26
02
08

Importujemy artykuły z Wikipedii

Jak wszyscy wiemy, Wikipedia to doskonałe źródło informacji. To też doskonałe źródło całkiem darmowych merytorycznych tekstów do legalnego przedruku… Czemuż więc by z niego nie skorzytać?

Ale jak już korzystać, to w sposób mądry. Nie mam tu na myśli przepisywanie czy wklejanie treści artykułów z Wikipedii, tylko zautomatyzowany import. Jak więc to zrobić?

Jeśli masz bloga w WordPressie, to sprawa jest nietrudna. Jeśli masz bloga w innym systemie, to nie potrafię Ci, jak na razie, pomóc. Trzeba tylko ściągnąć i zainstalować odpowiednią wtyczkę. Wtyczka nazywa się GetWIKI. Potrafi tworzyć kopie artykułu z Wikipedii na swoim serwerze i uaktualniać je raz na jakiś (zdefiniowany) czas, co oszczędza limity transferu… 🙂

Wtyczkę trzeba ściągnąć, rozpakować, wgrać do katalogu /wp-content/plugins i uaktywnić ją w panelu administracyjnym. Warto też ją skonfigurować, żeby pobierała tekst z polskiej a nie angielskiej wersji serwisu.. 😉
Po tym krótkim wstępie możemy do dowolnego artykułu wkleić treść artykułu z Wikipedii, wklejając do niego (w edytorze wizualnym albo kodu) polecenie:
~GetWIKI(Hasło)~
. W nawias wklejamy fragment adresu prowadzącego do strony artykułu, która jest za /wiki/. Przykładowo, jeśli chcesz wkleić link do mojego profilu, wstaw polecenie:
~GetWIKI(Wikipedysta:KrzysztofLis)~
.

To jest wersja dla leniwych. Dla leniwych, bo nie wymaga dalszej pracy. Jak na moje wymagania, jest ona zdecydowanie niewystarczająca.

Dlaczego? Tak wklejony artykuł zawiera linki do innych artykułów na Wikipedii. I wszystkie te odnośniki przekazują „moc SEO„, która wpływa na pozycję strony w wynikach wyszukiwania. Jeśli więc zamierzasz konkurować z Wikipedią o miejsce w wynikach wyszukiwania, nie ma to sensu. Tym bardziej, że Wikipedia nie przekazuje „mocy” do miejsc, do których sama linkuje. Z tego względu od jakiegoś czasu do każdego linka do Wikipedii dodaję atrybut rel="nofollow".

Jest jeszcze druga kwestia. Te przeklejone artykuły po prostu nie wyglądają ładnie… Zwłaszcza rozsypują się wszystkie nagłówki sekcji i rozdziałów artykułu. Obrazki też, zamiast być oblane tekstem i wyrównane do którejś strony, przecinają go zostawiając mnóstwo pustego miejsca.

W związku z powyższym, konieczne było dokonanie zmian w dwóch plikach — pliku wtyczki i pliku szablonu (arkuszu styli).

W pierwszej kolejności — zmiana w pliku wtyczki.

Zachciało mi się, żeby wszystkie linki w zaimportowanym artykule miały atrybut rel="nofollow". Niestety, niektóre z linków już taki atrybut mają — dotyczy to linków do artykułów zewnętrznych. Więc najpierw trzeba było pokasować ten atrybut z tych linków, które go mają a następnie dołożyć go do wszystkich. 🙂

Otwieramy więc wbudowany w WP edytor wtyczek i edytujemy plik naszej wtyczki. Odnajdujemy linię

$article = preg_replace ("#\<\!\-\-.*\-\-\>#imseU","",$article);

i ZA nią wklejamy fragment

/* mod KL */
$article = str_replace (' rel="nofollow"',"",$article);
$article = str_replace ('a href=','a rel="nofollow" href=',$article);
/* koniec moda KL */

To załatwia sprawę linków.

W drugiej kolejności — zmiana w arkuszu stylów CSS naszego szablonu.

Wymarzyłem sobie, żeby wszystkie obrazki były wyrównane do prawej. Mój szablon ma przygotowany taki kod CSS, wystarczy nadać odpowiedni atrybut znacznikowi <img>. Ponieważ nie umiem tego zrobić z poziomu funkcji „znajdź i zamień wykorzystując wyrażenia regularne” w PHP, nie mogłem tego załatwić w ten sposób, dodając fragment do pliku wtyczki. Musiałem więc dodać odpowiedni fragment do arkuszu stylów CSS. Tak samo załatwiłem wygląd nagłówków <h1> i <h2>.

Otwieramy więc edytor szat graficznych i tam bierzemy pod nóż arkusz stylu. Na końcu dodajemy fragment:

div.wiki h2 {
font-size: 20px;
}

span.mw-headline {
font-size: 18px;
}

div.tright {
float:right;
clear: right;
}

. To powinno załatwiać wszystko, czego mi potrzeba. W moim szablonie było tam więcej kodu, bo sobie kolorki poustawiałem itd. 🙂

Ja do swojego kodu wtyczki dołączyłem jeszcze kod reklamy AdSense i kilka słów do czytelnika. Ale to każdy sobie da radę zrobić własnoręcznie. 🙂

Po głowie chodzi mi jeszcze kilka zmian, np. całkowite wyeliminowanie linków prowadzących do innych artykułów w Wikipedii, wstawianie kodu reklamowego AdSense gdzieś do wnętrza artykułu albo wstawianie linków do powiązanych tematycznie tekstów na moim blogu. Tego nie umiem zrobić, więc jak na razie zostawię, ale jak się nauczę, to napiszę. 🙂

I na koniec jeszcze tylko uwaga, bardzo istotna!

Nie znam się na PHP ani na CSS. I dlatego nie jestem w stanie zagwarantować, że wprowadzone przeze mnie zmiany są poprawne ani skuteczne. Każdy z wprowadzających je do swojego bloga powinien je własnoręcznie sprawdzić i upewnić się, że nie spowodują w jego blogu jakiejś wielkiej dziury. Nie zamierzam ponosić odpowiedzialności za straty wynikłe z zastosowania mojego kodu. 😉

Autor:Krzysztof Lis | Tagi:



Wpisy powiązane tematycznie:

15 komentarzy do artykułu “Importujemy artykuły z Wikipedii”

  1. Hehe – idziesz w stronę black seo – możesz gdzie umieścić kod systemu wymiany linków 😉

  2. Nice. 😉 Ale nie można zapomnieć, że to jest duplicate content.

  3. Nie w tym rzecz, by budować sobie za darmo zaplecze. Na moich serwisach artykuły z Wikipedii używam wtedy, gdy nie chce mi się własnoręcznie pisać czegoś na dany temat a taki artykuł jest mi potrzebny (bo na przykład jest to wyjaśnienie jakiegoś stosowanego przeze mnie terminu).

    Co do tego, że treść taka jest duplikatem oryginału, nie mam żadnych wątpliwości. 🙂

  4. Ciekawa wtyczka i ciekawa modyfikacja, a tym duplicate content, radzę sie nie przejmować 🙂

  5. Jak na razie google lubi wikipedię więc o ręczne usuwanie stron nie ma co się martwić. Ciekawe

  6. zastanawiałem się już jakiś czas temu jak to wygląda od strony praw autorskich itp. czy można tak bez problemów wklejać artykuły z wiki na własne stronki?

  7. Wikipedia zawiera treść udostępnianą na licencji GNU FDL.
    Ta licencja stanowi, że można do woli kopiować i wykorzystywać treść na tej licencji. Można tworzyć na jej podstawie utwory pochodne. Ważne jest, by każda kopia treści zawierała informację o licencji i była udostępniana na tych samych zasadach.

  8. oooo no to nie widziałem 🙂 dzięki za info! przyda się z pewnością 🙂 szkoda że licencja ta nie dotyczy pisania prac magisterskich czy inżynierskich 😛 hehe

  9. Ciekawa wtyczka. Mam pytanko Krzysztof, jak zmienić wersję, żeby pobierało z polskiej wikipedii? Podmieniłem wszystkie linki z en. na pl. ale dalej nie działa.

  10. Po prostu podmieniłem w pliku .php wtyczki wszystkie wystąpienia en.wikipedia.org na pl.wikipedia.org. Później zobaczyłem, że to samo chyba da się zrobić przez konfigurację wtyczki przez panel administracyjny WP.

  11. […] Możesz w prosty sposób wykorzystywać teksty z Wikipedii, umieszczając je na swoim blogu. Wystarczy zainstalować specjalną wtyczkę, która automatycznie będzie pobierała treść z tej encyklopedii. W ten sposób możesz otrzymać darmowy content na bloga. Oczywiście można zrobić to ręcznie. Niemniej jednak tak jest lepiej, szybciej, prościej O rozwiązaniu tym napisał Krzysztof na swoim blogu o zarabianiu. […]

  12. […] blog nie będzie zarabiał… to zamykamy go, zmieniamy zainteresowania, tak? Rady dotyczące importowania artykułów z Wikipedii pod kątem pozycjonowania bloga, to chyba jakaś kpina. W moim odczuciu blogowanie polega na czymś […]

  13. Co do dupicate content, to wiki też zawiera wielkie ilości skopiowanej treści z innych stron. No, ale to nie ma znacznie, gorzej jak ktoś inny kopiuje do siebie. Nie wiadomo jak to G. potraktuje, bo z tego co wiem to takie stricte kopie wiki, banowali

  14. […] L. przedstawił fajny sposób na stworzenie zaplecza tamatycznego, przy pomocy wikipedii i […]

  15. […] A co tam, ciekawego w branży seowej? No coż, mój pligg się pięknie indeksuję, postawiłem nową spam stronkę youtubową (która zdecydowanie potrzebuję templatki i tunningu), a także zabieram się za postawienie Autowikibloga. […]

Pozostaw komentarz

Pamiętaj tylko proszę o polityce komentarzy! Komentarze służą do wyrażania opinii na temat opublikowanego tekstu, albo zadawania pytań jego dotyczących. Nie służą do reklamowania własnych stron ani zadawania pytań nie związanych z tematem wpisu. Jeśli masz pytanie, zadaj je na forum o zarabianiu na blogach albo napisz do mnie e-maila.

XHTML - możesz użyć tagów:<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Jak zarabiam?

Na moich blogach i witrynach zarabiam między innymi sposobami podanymi poniżej.