Spam jest wszędzie - także w Google Analytics

Spamerzy wykorzystają każdą możliwy kanał aby dotrzeć do nas jak najniższym kosztem. Niektóre techniki stają się powoli nieskuteczne, więc trzeba ciągle wymyślać nowe i je doskonalić. O zjawisku takim jak 'referrer spam' słyszała przynajmniej część webmasterów. Nie jest to technika nowa. Sprawdza się dobrze i jest wykorzystywana już przynajmniej od kilku lat. Ostatnio jednak wyraźnie można zauważyć wzrost pomysłowości spamerów którzy dążą do tego, aby ich spam przestał być spamem nie tracąc na skuteczności.

Referrer spam - na czym to polega? Zasada jest prosta. Spamer tworzy bota który odwiedza naszą stronę podając jako referrer sfałszowany adres URL. Tyle i tylko tyle.

Jeśli posiadasz własną stronę www, to przynajmniej raz na jakiś czas zaglądasz do statystyk z różnych przyczyn. Liczba odwiedzin, słowa kluczowe, czy strony odsyłające. Każda informacja jest cenna. Sprawdzając to ostatnie prawdopodobnie natknąłeś się już na linki generujące ruch ze stron 'podejrzanych' na których link teoretycznie nie powinien się znaleźć. Jeśli kliknąłeś i linka do własnej strony nie odnalazłeś, to oznacza, że dałeś się wrobić spamerom.

Jak odróżnić linki spamerów od tych 'prawdziwych'? Kłopot w tym, że nie da się tego zrobić.Strony spamerów najczęściej znajdują się w domenach zagranicznych, zawierają w adresach słowa w językach obcych, itd. Klikając w taki link możemy liczyć na to, że komuś spodobał się design strony, czy też zamieszczony na niej film / skrypt / kod CSS z jakiegoś przykładu / itd. Jednak nawet i tutaj spamerzy mogą pochwalić się kreatywnością, o czym napiszę dalej.

Kilka linii kodu wystarczy
Napisanie spam-bota nie jest niczym trudnym. Wystarczy wykorzystać kilka podstawowych funkcji np. z popularnego PHP i zebrać listę stron www (ofiar) przykładowo z Google (związanych tematycznie z reklamowaną stroną).
Nie będę podawał gotowych rozwiązań, bo to nie jest celem. Piszę to, aby można było 'lepiej poznać wroga'.

Jaka jest skuteczność takiego działania?

Nie dawno napisałem takiego bota i spisał się bardzo dobrze na 300K domen miałem wejść na referera ze 200K
Źródło: pozycjonowanie.pl

Czy taki wynik jest możliwy? Jeśli użyjemy zagranicznych domen ze słowami niepolskojęzycznymi, to może okazać się, że wynik nie będzie przekraczał nawet kilku %. Jednak spam ma to do siebie, że niską skuteczność nadrabia się ilością.

Co ze statystykami w JavaScript?
Większość używanych statystyk opiera się na JavaScripcie. Wyżej opisany sposób będzie uwzględniał jedynie statystyki działające po stronie serwera, a nie przeglądarki. Jednak dla spamerów to także nie jest problemem. Dodanie do bota obsługi całego JavaScriptu nie jest dużym obciążeniem (bot z częścią funkcjonalności przeglądarki).

Spamerzy mogą także przygotować bota pod konkretny typ statystyk (np. dla tytułowego Google Analytics).

Idealny cel - blogerzy
Ostatnio w GA zauważyłem tego typu linki. Jeśli problem dotyczy blogów wykorzystujących własne rozwiązania, to tym bardziej będzie dotyczył blogów na konkretnych platformach blogowych skupionych wokół jednego miejsca, gdzie łatwiej jest wyciągać ich adresy.

Blogerzy lubią wiedzieć co wokół nich się dzieje - tak więc są idealnym celem dla opisywanego typu spamerów.

Niska świadomość blogerów na temat tego typu 'reklamy' jest dużym plusem dla spamerów. Oni nie będą czekać - wykorzystają to.

Coraz wyższa skuteczność.
Adresy typu: www.example.com/buy-new-lcd nie brzmią zachęcająco. Chęć kliknięcia w taki link może wynikać tylko i wyłącznie z ciekawości o co komuś chodziło podając link do naszej strony/bloga.

Jednak pomyślmy, co stanie się gdy spamer zastosuje taką sztuczkę:

- Bot jest wysyłany na Twojego bloga, odczytuje tytuł dowolnego wpisu, a następnie pozostawia referrer w takiej postaci: www.example.com/kolejny-bloger-idiota--tytul-twojego-wpisu.

Nie trudno domyślić się, że taki adres przyciągnie uwagę nawet rozważnego blogera który o istnieniu czegoś takiego jak 'referrer spam' słyszał niejednokrotnie. Pod linkiem może kryć się cokolwiek.

Antyreklama?
Załóżmy, że spamer chce coś zareklamować, np. swój serwis www. Metoda taka jak powyżej nie przyniesie oczekiwanego rezultatu. Bloger może zauważyć że został oszukany. Co spamer może zrobić?

Wystarczy, że odpowiednio przygotuje wpis na swojej stronie, w tym przypadku 'spam-blogu'. Ofiara przyciągnięta linkiem odwiedzi podstawiony wpis. Spamer może w takim podstawionym wpisie poruszyć kilka tematów: najpierw okaże się, że 'kolejny bloger idiota' to ktoś kto skrytykował wpis o tytule 'tytul twojego wpisu'. Spamer broni dobrego imienia naszego bloga, a przy okazji poleca pewną stronę - wszystko wygląda niby naturalnie.
Słowami można łatwo manipulować i dopasować je tak, aby pasowały do każdej tematyki (lub tematyki z pewnej dziedziny). Dodatkowo zwykła baza zawierająca dane wcześniej wyciągnięte ze stron pozwoli na przygotowywanie wpisów w taki sposób, aby dla 'oszukanej' osoby wyglądały całkiem realistycznie.

Dobrze przygotowany 'spam-blog' wykorzystujący 'referrer spam' będzie nieodróżnialny od realnych blogów które do nas linkują. Spamer może szokować, wzbudzać zaufanie, zachęcać, itd.Reklama która nie wygląda jak reklama jest najskuteczniejsza.

Ja z aż tak zaawansowanymi przypadkami spamu jeszcze się nie spotkałem, ale prawdopodobnie jeszcze wszystko przed nami.

Jak z tym walczyć?
Można blokować adresy www, IP, itd. Ale rozwiązania działającego w 100% nie znajdziemy. Musimy liczyć się z tym, że część transferu będą pochłaniać różnego rodzaju boty, w tym pozostawiające sfałszowane referrery.

Gdzieś czytałem o metodzie która polega na tym, że sprawdza się referrery - czy pod podanymi linkami znajduje się odwołanie do naszej strony. Jednak takie rozwiązanie nie jest optymalne i dodatkowo nawet nieskuteczne w sytuacji takiej jak ta wyżej opisana (kiedy strona spamera na podstawie wywoływanego adresu wstawi do treści przypisany wcześniej link zwrotny).

Na chwilę obecną trzeba liczyć się z tym, że statystyki naszych stron zawierają pewną granicę błędu wynikającą ze sztucznie wygenerowanego ruchu.

Ciekaw jestem jak często pojawiają się sfałszowane referrery w przypadku blogów na Wordpress.com, Blogspot.com, czy też na polskim Jogger.pl, Blox.pl, itd? Czy jest jakaś różnica między blogami związanymi z danymi społecznościami, a tymi niezależnymi (we własnych domenach)? Sam nie mam możliwości sprawdzenia tego.

Komentarze 291:

  • » Flanker: 01.07.2009 o 14:49

    Bardzo ciekawy wpis. Muszę się przyznać, że pierwszy raz słyszę o takiej metodzie spamerskiej. A już nieraz dziwiłem się skąd w statystykach pojawiają tak dziwne adresy.

  • » Maciej Łebkowski: 01.07.2009 o 14:54

    Haha, dodanie obsługi JS do spambota? Na pewno! Jeśli tak, to życzę botom smacznego:

    while(1) {}

  • » Adriano: 01.07.2009 o 14:57

    @Maciej Łebkowski: jak odróżnisz spambota od zwykłego użytkownika?
    Poza tym jakim problemem jest wyłączyć działanie JS przykładowo po 1 sekundzie od wczytania skryptów?

  • » Analizator: 01.07.2009 o 15:37

    Spamerzy idą na masówkę więc jak narazie łatwo jest ich rozpoznać.

  • » procek: 01.07.2009 o 16:04

    Takie spamerstwo dodatkowo robi flooding przy okazji, o czym krótko wspomniałeś Adriano we wpisie. Sęk w tym, że o ile spam nic nam nie robi (poza straconym czasem) to o tyle zmasowany flooding powoduje uziemienie strony... Ciekawe, który blog w Polsce pierwszy polegnie z powodu nadmiernego rozreklamowania? :D

  • » Chris Trynkiewicz: 03.07.2009 o 17:30

    Pomyslowe.

    Jak sie ma jezyk domeny do odwiedzalnosci? Nie kapuje...

    Akapit "antyreklama": jesli juz ktos zacznie pisac bzdury podajac link do naszej strony, by wygladalo to naturalnie, to raczej nie zareklamuje przy tym nic. Albo reklamy, albo tresc..

    Co do akapitu "jak z tym walczyc": jesli juz umiesci link do nas na swojej spamerskiej stronie, to nie ma co sie aferowac - w koncu mamy darmowy backlink :)

  • » Adriano: 03.07.2009 o 21:29

    Jak sie ma jezyk domeny do odwiedzalnosci? Nie kapuje...

    Zobaczysz link z nieznanej domeny z nieznanymi słowami, to istnieje większe prawdopodobieństwo że go 'olejesz' (chyba że znasz dany język).
    Każdy inaczej to może oceniać - tutaj własne zdanie przedstawiłem, a nie informację obiektywną.

    Akapit "antyreklama": jesli juz ktos zacznie pisac bzdury podajac link do naszej strony, by wygladalo to naturalnie, to raczej nie zareklamuje przy tym nic. Albo reklamy, albo tresc..

    Jeśli ktoś się postara to uda się coś sensownego ułożyć. Nie z każdym produktem to wyjdzie, ale w przypadku spamu niską skuteczność nadrabia się ilością.

    jesli juz umiesci link do nas na swojej spamerskiej stronie, to nie ma co sie aferowac - w koncu mamy darmowy backlink :)

    Miałem na myśli wstawianie linków automatyczne, tzn. po wywołaniu określonego adresu.
    Adres taki znajdzie się tylko i wyłącznie w naszych statystykach i nikt inny go nie wywoła.
    Tak więc link jest bezwartościowy, bo nie jest widoczny.

  • » Marcin Kosedowski: 05.07.2009 o 23:35

    Chyba dałem się złapać na takie coś:/ Co ciekawe, miałem po kilkadziesiąt wejść z adresów, na których nie było wposmniane słowem o mojej stronie.

    Dużo bardziej irytuje mnie spamowanie trackbackami - jakiś spamowy WordPress daje linka do mojej strony, która jest bardzo często odwiedzana przez googlebota. Na szczęście wystarczyło zablokowanie dwóch IP, ale problem pozostaje.

  • » Martin: 19.07.2009 o 14:13

    A ja zawse myślałem, że to błąd, albo ktoś po prostu zamieścił linka a potem zdjął, a tu taki numer. W sumie to nawet sprytne, ale z takiego użytkownika, czyli na przykład mnie, nie ma paktycznie żadnej korzyści, bo odwiedza daną strone tyko po to, żeby zobaczyć w jaki sposób użytkownicy wchodzą z danej witryny na jego stronę i jak jest zamieszczony link.

  • » Anka: 19.10.2009 o 17:55

    No to ładnie. Fakt, że to dość niszowy sposób. Większość ludzi nie wie, że można sprawdzić statystyki, a ci co wiedza z reguły się nie nabiorą. Dobrze się dowiedzieć, że coś takiego istnieje...

  • » Piotr Soboń: 26.12.2009 o 17:34

    Również uważam, że to bardzo ciekawy artykuł. W życiu bym nie pomyślał...
    Niszowy sposób ale każdy na początku jest niszowy, by z czasem stał się "sposobem wielu"...

  • » Warchol: 04.10.2010 o 08:02

    Widać że wszystko da się zaspamować heh

  • » Adrian: 25.11.2010 o 10:33

    Pytanie, czy wyłączenie trackback-ów to jakiegoś rodzaju rozwiązanie? Poniekąd tak. Ale też nie do końca. Pozostaje jedynie śledzić statystyki.

  • » Adrian: 25.11.2010 o 11:09

    http://www.askapache.com/htaccess/htaccess-plugin-blocks-spam-hackers-and-password-protects-blog.html - wtyczka dla WordPress
    Modyfikacja .htaccess

    RewriteEngine On
    RewriteCond %{REQUEST_METHOD} POST
    RewriteCond %{REQUEST_URI} .wp-comments-post.php*
    RewriteCond %{HTTP_REFERER} !.*yourblog.com.* [OR]
    RewriteCond %{HTTP_USER_AGENT} ^$
    RewriteRule (.*) ^http://%{REMOTE_ADDR}/$ [R=301,L]


    Lub edytować plik functions.php, który znajduje się w katalogu każdego szablonu do WordPress i można dopisać taki kod:
    function check_referrer() {
    if (!isset($_SERVER['HTTP_REFERER']) || $_SERVER['HTTP_REFERER'] == “”) {
    wp_die( __(‘Please enable referrers in your browser, or, if you’re a spammer, bugger off!’) );
    }
    }
    add_action(‘check_comment_flood’, ‘check_referrer’);

  • » Bartek Jakubowski: 16.03.2015 o 22:46

    Tak jak kolega wyżej napisał trzeba to zablokować w .htaccess. W lutym miałem ok. 30 fałszywych wejść z niby jakiejś strony, a po kliknięciu przekierowuje na aukcje internetowe.

    Fałszywe trackbacki to też wkurzająca sprawa.

Dodaj komentarz:

Dostępne tagi: [link]http://adres-www[/link] [quote]cytat[/quote] [code]kod[/code] [pre]tekst preformowany[/pre] [b]bold[/b]