Jak niszczyć spamblogi?

Kilka dni temu Hazan napisał na swoim blogu o tym, że dodzwonił się do autora spambloga. Dla mnie sytuacja jest jasna. Autor spambloga jest zwykłym złodziejem - bez zgody autora skopiował artykuły objęte odpowiednią licencją i przywłaszczył je sobie. Artykuły już zniknęły, bo właściciel firmy Pozycjonowanie MDE odpowiedzialnej za działanie spambloga nie chciał się już bardziej kompromitować. Oczywiście wina została zrzucona na pracownika. Tak to już jest jak nie potrafi się dobrze zarządzać swoją firmą, nie kontrolując nawet poczynań swoich własnych pracowników.

Internauci w większości poparli Hazana. Oczywiście musieli się znaleźć "pozycjonerzy" tacy jak Shpyo, który najpierw wyśmiał Hazana, a następnie pochwalił się swoim kompletnym brakiem wiedzy na opisywany temat w tym wpisie: Knock knock Neo....

Moim zdaniem najciekawszy fragment tych bzdur to:

Analogicznie przecież można przyczepić się wszystkich serwisów które zbierają tematyczne wpisy np. blogfrog, blogbox czy 10przykazań! Tutaj jest ta różnica, że to się ładniej nazywa!

Jeśli Shpyo nie rozróżnia symbiozy od pasożytnictwa to nie mam więcej pytań :)
Czy to coś (spamblog) można porównać do tego (BlogNews)?
Jeśli ktoś nie widzi różnicy, to niech sprawdzi gdzie prowadzą na każdej z tych stron podlinkowane tytuły? W którym przykładzie wyraźnie zaznaczono kto jest autorem wpisu? Gdzie skopiowano cały artykuł bez podania źródła i autora?

Cytując dalej:

Drogi Blogerze! Jeżeli nie chcesz aby i Ciebie spotkała taka niespodzianka, to nie udostępniaj pełnych wpisów w swoim kanale RSS, tylko zajawki do wpisu.

A może lepiej wcale nie udostępniać wpisów w kanałach RSS? Czy opublikowanie wpisu poprzez RSS jest zgodą na dowolne rozpowszechnianie i łamanie warunków licencji udostępnianej treści?
Ktoś chyba nie wie, do czego służy RSS. Udostępniam wpisy poprzez RSS, aby moi czytelnicy mieli łatwiejszy dostęp do artykułów. Nie ma żadnej różnicy czy ktoś kradnie wpisy poprzez kanały RSS, czy też kopiując je bezpośrednio ze strony.

Treść blogów jest przeznaczona jedynie dla czytelników, a nie dla debili którzy wykorzystują ją do generowania sztucznych stron zaśmiecających internet.

Przecież możesz wykorzystać ten proceder do pozycjonowania siebie!

Shpyo chyba nie pomyślał o tym, że nie każdemu zależy na spamowaniu...
Jeśli ktoś kopiuje moją treść, to ja mogę na tym jedynie stracić - przeczytaj o Duplicate Content. Gdyby spamblogi przynosiły korzyści dla okradzionego, to każdy bloger posiadałby po kilkanaście blogów z powieloną treścią.

Czy korzyścią dla mnie jest to, że ktoś linkuje do skradzionego artykułu na spamblogu zamiast do mojego bloga?

Czy ze spamblogami można walczyć?
Tak, mimo tego, że jest ich coraz więcej. Nie można zniszczyć ich wszystkich, ale można obronić własną treść. Zadzwonienie do właściciela spambloga nie jest zawsze możliwe. Są inne, łatwiejsze sposoby.

IP spambloga - złodziej sam zrezygnuje.
Spamblogi kradnące treść z naszego własnego bloga jest łatwo odnaleźć. Jeśli już namierzymy taką stronę (np poprzez Google), to kanał RSS modyfikujemy tak, aby w następnym wpisie pojawił się adres IP czytelnika, czy spambota. Wchodzimy następnie na spambloga i odczytujemy IP który został tam automatycznie umieszczony.
Mając dany IP serwujemy spamblogowi specjalny kanał RSS. Teraz już wszystko zależy od naszej wyobraźni :)
Możemy przykładowo zaspamować samego spambloga sprawiając, że Google wyrzuci taką stronę ze swoich wyników ze względu na ewidentną próbę sztucznego manipulowania treścią.
Adres IP bota spambloga można także zdobyć na inne sposoby.

Pixel prawdy.
Innym sposobem jest dodanie na początku wpisów w kanale RSS małego, niewidocznego obrazka (wielkości 1px) który będzie podlinkowany do odpowiedniej podstrony naszego bloga. Subskrybentom ten mały obrazek nie będzie przeszkadzał.
W rzeczywistości ten mały obrazek będzie sprawdzał gdzie jest on wyświetlany (wykorzystując PHP). Jeśli znajdzie się on na stronie którą 'nie lubimy', to serwer zamiast małego pixelka wyśle duży obrazek informujący o ... (tu każdy może wpisać co tylko chce).

Takie zabezpieczenie będzie służyło temu, aby przekierować ewentualnych czytelników ze spambloga na naszego bloga (obrazek będzie podlinkowany).

Niech złodziej poczuje się jak ... prawdziwy przestępca :)
Bronią w walce ze spamblogami może być sama treść. Można tutaj użyć metody wykorzystującej IP bota spambloga w celu zaserwowania mu specjalnej treści.

uwaga! Nie namawiam tutaj nikogo do stosowania tej metody - ma ona jedynie ma na celu pokazać złodziejom treści kto tak naprawdę rozdaje karty, aby nie czuli się zbyt pewnie jak to jest obecnie.

Wyobraźmy sobie co się stanie, gdy pewnego pięknego ranka nic niepodejrzewający właściciel spambloga zostanie nagle zbudzony przez grupę antyterrorystyczną, która z hukiem wpadnie do jego mieszkania?
Jak będzie się tłumaczył on z tego, że informacja o (...) znalazła się na jego stronie?
Ile czasu minie zanim udowodni, że ta treść została automatycznie skopiowana z innej strony?
Jak wyjaśni to, że ta informacja zawierała wstęp o treści "Ja właściciel strony www.spamblog(...).pl informuje, że..." ?
Jak wyjaśni to, że treść ta miała być skopiowana ze strony która nigdy nigdzie nie istniała?
Ile czasu minie zanim specjalne służby dadzą mu spokój?
Czy powróci on do swojego starego zajęcia po całym zajściu?

To jest sytuacja abstrakcyjna, ale możliwa.

Pozycjonerze!
Jeśli masz zamiar kraść artykuły z blogów (nie podając nawet autora, czy źródła), to najpierw się zastanów, bo może okazać się, że nie będziesz już Sprite, tylko Pragnienie... :)

Komentarze 31:

  • » RoB: 13.04.2008 o 16:01

    Przyjdzie Shpyo i nazwie Cię asystentem Chucka Norrisa :D

  • » Łukasz Więcek: 13.04.2008 o 17:53

    Najlepiej by było, gdyby ktoś zrobił i uaktualniał jakąś centralną bazę IP spamblogów. Wtedy można by się już zawczasu przygotować na ewentualną kradzież ;)

  • » Adriano: 13.04.2008 o 18:01

    Z bazą nie byłoby tak łatwo. Za dużo tych spamblogów powstaje - nie wiadomo na jaki się trafi.

  • » astro7: 13.04.2008 o 18:10

    Ktoś poświęca swój czas aby coś napisać a pozycjoner w kilka sekund to skopiuje na swoją stronę i jeszcze podpisze się pod tym.

    Jeśli blogosfera się zorganizuje to poradzi sobie z takimi kradzieżami.

  • » Riff: 13.04.2008 o 18:50

    Ee... ten ostatni trackback ma ciekawy adres ;). Ale ja nie o tym - zaprawdę ten Pixel prawdy wydaje się być ciekawym sposobem. Idę pomyśleć, jak napisać ten mini-skrypt ;).

  • » Adriano: 13.04.2008 o 19:12
  • » Smoczokwik: 13.04.2008 o 21:19

    Jednego tylko nie rozumiem, jeśli mój wpis ma pod spodem linki do 5 lub 10 podobnych wpisów na mojej stronie, poszedł do feedburner, został zaindeksowany i dopiero potem pojawia się u scrapera, to czemu ja mam się martwić? Duplicate Content? Polecam wpis:
    http://googlewebmastercentral.blogspot.com/2007/06/duplicate-content-summit-at-smx.html
    akapit zatytułowany "Providing a way to authenticate ownership of content"

    Niech sobie scraper scrapuje, mam 5-10 linków do moich wpisów bez wysiłku (plus zawarte w tekście), czego jeszcze chcieć? O przepraszam, mozna dodać jeszcze stopkę +1 link.

  • » Adriano: 14.04.2008 o 07:05

    Jeśli tobie to nie przeszkadza to ok, ale to nie oznacza, że innym musi się to podobać.
    Równie dobrze spamblog może być tym pierwszym na który trafi bot google w niektórych przypadkach. Nowe blogi zazwyczaj nie są szybko indeksowane.

    Moja treść jest zawsze moja i właściciel spambloga musi się do tego zawsze dostosować.

  • » Adriano: 14.04.2008 o 07:07

    Chodzi też o to, aby uniknąć sytuacji takich jak ta: http://nasza-klasa.org.uk/2008/02/czy-to-koniec-pino/
    Zobaczcie gdzie wskazuje fragment "przeczytaj oryginalny wpis".
    (fragment pochodzi oryginalnie z Antyweb.pl)

  • » shpyo: 14.04.2008 o 15:02

    A więc, drogi Asystencie Chucka Norrisa ;)
    Jeśli chodzi o to porównanie, jest jak najbardziej w porządku. Mogę sobie przecież stworzyć taki ładny agregator RSS z rejestracją i innymi oficjalnymi tekstami, że na wszystko wyrażasz zgodę. Wszystko jest legalnie. No i teraz podpinam sobie pod to systemy wymiany linków i jadę. Site idzie w górę, za pół roku jest nawet jakiś fajny PR. I punkty w systemach rosną. Masz teraz taką oficjalną i legalną spamiarkę. Mogę się do wszystkiego dostosować.
    A co jeśli admini 10p czy blogfroga by taki numer wycięli? Kolejna afera.
    Nie popadajmy w skrajności w skrajność.
    Mnie rozbawiła ta cała sytuacja.
    Blogerzy oficjalnie napisali jak się przed tym bronić, a spamerzy będą kombinować jak "pobierać" RSS w inny niewykrywalny sposób.
    Kolejna sprawa to legendarny duplicate content. No c'mon przecież to jest straszak Google na nowych pozycjonerów/spamerów. Gdyby DP był prawdą, to newsy onetu, wp, gazety serwowane przez PAP by wylatywały z Google. Podobno można wyciąć konkurencyjną stronę na starej domenie - ale to też tylko domniemania.
    Oddział AT... odbieram to jako dobre poczucie humoru ;)
    Ostatnia rzecz... nie nazywaj wszystkich pozycjerów spamerami i złodziejami. Są też tacy, którzy zamiast iść na łatwiznę wolą postawić jakiś ciekawy serwis i mieć z tego jeszcze profity. Mogę przecież nazwać wszystkich blogerów frajerami, bo udostępniają swoje RSS bez "zabezpieczeń".

  • » Adriano: 14.04.2008 o 15:22

    Shpyo, jeśli wszyscy właściciele spamblogów będą tworzyć je na wzór 10p czy blogfroga, to nie mam nic przeciwko aby moja treść tam lądowała :)
    - tytuł podlinkowany do mojego oryginalnego wpisu
    - zaznaczenie kto jest autorem
    - nie pobieranie całej treści, tylko początkowej części wpisu

    Chodzi o to, aby ktoś trafiający na taką stronę (już nie spambloga) wiedział, że to co czyta nie należy do właściciela tej strony, tylko do jakiegoś określonego blogera. I jeśli temu komuś spodoba się wstęp, to będzie wiedział co robić aby przeczytać całość na mojej stronie. To jest blogosymbioza.

    W tym artykule pisałem tylko o konkretnych pozycjonerach odpowiedzialnych za spamblogi. Do tych pozycjonerów którzy nikomu nie szkodzą, nic nie mam :) (tych co zajmują się optymalizowaniem witryn).

  • » prcoek: 14.04.2008 o 22:15

    Mądre i zgadzam się z tym, ale nie do końca. Otóż serwisy, które linkują tylko tytuły i początki z dokładnym źródłem np. pcunited.info dają mi wzrost odwiedzin. Na wszelkie objemy spamu reaguję groźbami o policji i prokuraturze - o dziwo działa! :) Niestety chciałem sprawdzić czy to działa... Nie działa niestety. Policja odbije piłeczkę do CERT, a oni każą instalować aplikacje i na tym ściganie się kończy :/

  • » Mendax: 15.04.2008 o 12:10

    Taaa, fajne metody na "zwalczanie". Pytania:
    -co, jeśli korzysta się z FeedBurnera, jak wtedy ustalić adres, z którego "spamblog" pobiera RSS-a? Ooo, lub Yahoo Pipes?
    -czy Kolega wie, że istnieje taka prosta funkcja w PHP: strip_tags, która automagicznie usuwa wszelkie znaczniki HTML-owe w tym obrazki?

  • » Adriano: 15.04.2008 o 13:29

    @Mendax, zdaje sobie sprawę z istnienia tych problemów. Mój RSS jest serwowany bez pośredników, więc metoda z IP będzie skuteczna. Istnieją metody aby to ominąć, ale ja też mogę udoskonalić swoje.

  • » Mendax: 16.04.2008 o 11:10

    Heh, mimo, że nie przepadam za porównaniami, to aż się tutaj ciśnie na myśl walka między wielkimi koncernami muzycznymi a "piratami": ilekroć wymyślą jakiś DRM, czy cokolwiek, to zawsze znajdzie się jakiś cwaniak, który zabezpieczenie przełamie...

    A poza tym... cóż, poważni SEO-wcy jeśli już bawią się w autoblogi, to pobierają treści z miejsc, gdzie nikomu to nie będzie przeszkadzało.

  • » Adriano: 16.04.2008 o 19:08

    Trochę podobieństwa w tym jest :)
    Ale to całkiem inna sytuacja - treść na moim blogu nie jest niczym szczególnym z punktu widzenia właściciela spambloga. Utrudnię komuś takiemu pobieranie treści, to ten ktoś raczej znajdzie sobie inne źródło, zamiast tracić czas na zastanawianie się nad tym, jak to obejść.

    Co do ostatniego zdania to zgadzam się całkowicie - wystarczy poszukać.

  • » shpyo: 17.04.2008 o 12:05

    Lubię wyzwania. Pewnie bym powalczył z Tobą z tymi sztuczkami od utrudniania życia ;)

  • » Adriano: 17.04.2008 o 16:31

    Shpyo, jeśli będziesz uparty to wygrasz :)
    Jest jedna metoda: Ctrl+C -> Ctrl+V - przed tym nie potrafię się zabezpieczyć :)
    Istnieje tylko jedna, skuteczna w 100% metoda: nie publikować :)
    Hmm, ja wole napisać nowego posta zamiast bawić się w kotka i myszkę :)

    Udostępniam wpisy na licencji CC, dużo nie potrzeba aby legalnie wykorzystywać moją treść z bloga :)

  • » Anna: 19.04.2008 o 23:58

    A nie lepiej publikować w rss tylko początek i dodawać w rss link do artykułu, ktoś pobiera z rss to od razu publikuje linki do naszego artykułu. tylko nie wiem jak to technicznie wygląda, do wordpress'a są jakieś wtyczki, ale mi nie działały.

  • » Kashub [~]o: 04.05.2008 o 11:56

    "Oczywiście wina została zrzucona na pracownika. Tak to już jest jak nie potrafi się dobrze zarządzać swoją firmą, nie kontrolując nawet poczynań swoich własnych pracowników."
    No niby tak, ale... wiem z doświadczenia (nie powiem skąd, dociekliwi sami dojdą), że ta "wina pracownika" to jeden z mechanizmów obronnych. Bo jak dzwoni taki właściciel contentu do szefa firmy pseudopozycjonerskozłodziejskiej, to jeśli usłysze "wal się pan", to się wkurzy jeszcze bardziej, a jeśli usłyszy "ojej, przepraszam, to widocznie mój pracownik Kowalski, muszę z nim poważnie porozmawiać..blabla", to generalnie da spokój, bo niby sprawa rozwiązana.
    A taki pseudoszef co robi? Wręcz zmusza pracowników do kradzieży treści z RSS'ów ludzi , co sami piszą, bo na 1000 okradzionych blogów zgłosi się góra jeden właściciel i to dotrze najwyżej do 2 z 30 stron, na których jest jego kradziona treść, czyli bilans dodatni dla firmy pseudopozycjonerskiej.
    Osobom żądnym szczegółów służę pomocą :)
    Polecam też serwis http://copyscape.com/ - pomaga w odnalezieniu stronek z kradzionym naszym contentem :)
    Za artykuł spory plus, warto na to zwracać uwagę.

  • » Adam: 02.07.2008 o 22:20

    Ale przecież polskie prawo uwzględnia takie coś jak cytowanie, jeżeli jest to tylko kawałek tekstu i jest podane źródło to nie jest to żadne przestępstwo ani kradzież.

  • » Adi: 11.07.2008 o 15:55

    Prosty sposób na zapobieganiu kopiowania z rss - edytujemy pliki wp-includes/ feed-atom.php feed-rss.php i feed-rss2 (nie wiem czemu ale na rdf jakoś nie działa) i wstawiamy dowolne linki przed lub po funkcji ładującej get-excerpt-rss (skrót) a jak wyświetlamy całe wpisy to get-content, ale większość wyświetla skrót. Jak ktoś nam skopiuje do mimowolnie dodaje linki.

  • » Daniel: 06.10.2008 o 19:54

    Można jeszcze inaczej: do każdego RSS'a doklejać na początku lub na końcu unikalny fragment tekstu. Następnie co jakiś czas trzeba poszukać tego fragmentu, lub lepiej ustawić sobie to na Google Alerts. W ten sposób znajdziemy wszystkich "pożyczających" sobie teksty. Co z nimi dalej zrobicie to już Wasza sprawa. Można poprosić o usunięcie, można postraszyć policją, a można też po prostu wysłać spam report do Googla - co kto uważa za słuszne.

  • » Wojtek: 09.02.2009 o 19:44

    Temat spam blogów jest ostatnio dosyć popularny, więc napiszę tutaj co nieco. Najlepszą, według mnie, metodą na pozbycie się wpisów z takiego spam bloga jest skontaktowanie się z właścicielem strony (poszukiwania danych we WHOIS albo podążanie za linkami na spam blogu). Jeżeli to nie pomaga, to pozostaje usługodawca, czyli administracja hostingu, na którym znajduje się strona. Ostatecznie, jeżeli to nie pomaga, pozostaje albo zablokować IP albo (tak jak zostało napisane w notce) zrobić redirect i zaserwować inny kanał RSS. Na pewno pomoże.

  • » IvanBarazniew: 09.02.2009 o 21:38

    Do wszystkich blogerów: Nie ma możliwości skutecznej obrony przed podkradaniem treści, jak nie rss, to curl po całej stronie - są różne sposoby. Nawet jak flasha użyjecie to da się coś wykombinować. Pobieranie ip serwera - śmiech na sali, a co jeżeli pacjent odpali agregator rss przez proxy? A i jeszcze ważna kwestia: jak zamierzacie udowodnić, że treści, które ktoś od Was skopiował są Wasze tzn, że to właśnie Wy jesteście autorami?

  • » Adi: 04.11.2009 o 18:40

    Ivan ma trochę rację, to jest walka z wiatrakami, ja już dałem sobie jakiś czas temu spokój. Kupę czasu zajmuje dotarcie do właściciela spambloga o ile w ogóle to możliwe, a w połowie przypadków i tak nas zignoruje.

  • » Jarek K: 14.07.2010 o 10:15

    Ja jak publikuję nowego posta to po paru dniach cały Internet aż się roi od kopii mojego artykułu. Nie dość, że spamerzy są na maxa bezczelni to jeszcze po chamsku kradną cudzą pracę, która często wymaga wielu godzin wertowania materiału żeby napisać coś sensownego i przydatnego. Dzisiaj widziałem na wykopie artykuł w którym opisują jak namierzać złodziei treści: http://techfox.pl/porady/alerty-google-alerts-zlodzieje-tresci

    Wystarczy odpowiednio skonfigurować alerty a Google sam wysyła maile jak znajdzie kopie twojego artykułu.

  • » ghosti: 21.11.2010 o 00:32

    Tak jak pisze Adi, dotarcie do właściciela jest czasem bardzo trudne, nie mówiąc już o uzyskaniu odpowiedzi na maila.

Dodaj komentarz:

Dostępne tagi: [link]http://adres-www[/link] [quote]cytat[/quote] [code]kod[/code] [pre]tekst preformowany[/pre] [b]bold[/b]