Harvey nie jest głodny

Spamerzy do pozyskiwania adresów mailowych często używają botów zwanych harvesterami, które analizują treśći stron i zbierają zawarte w nich adresy, aby następnie wykorzystać je do rozsyłania spamu. Taki przypadek opisywałem kilka dni temu: spamer pozyskał bazę adresową na podstawie danych zawartych na stronach zaindeksowanych w Google.

Istnieją mniej lub więcej skuteczne sposoby na ochronę naszego adresu, jednak żaden z nich nie 'ocali' osób które już pozostawiły swój e-mail w Sieci, czyniąc go dostępnym dla każdego bota.

Tonid na swoim blogu przedstawił sposób walki z harvesterami, poprzez 'zasypywanie' ich sztucznie wygenerowanymi adresami. W tym celu został napisany specjalny skrypt, którego działanie możemy zobaczyć na tej stronie. Tonid tak przedstawia idee korzystania ze skryptu:

Załóżmy co następuje (liczby wzięte z sufitu):

1. Do zebrania 100 adresów harvester potrzebuje średnio jednej minuty. Jeśli wszystkie adresy są prawidłowe (normalne adresy na stronach), spamer w godzinę otrzymuje 6000 adresów. Jeśli harvestery chodzą po stronach takich jak ta generowana skryptem, spamer w godzinę otrzymuje maksimum kilka prawdziwych adresów.

2. Do wysłania 100 spamów spamer potrzebuje jednej minuty. Jeśli wszystkie adresy w jego bazie są prawdziwe, w godzinę 6000 osób otrzyma spam. Jeśli są fałszywe (jak z tej strony), spam otrzyma maksymalnie kilka osób (których prawidłowe adresy znalazły się w tej sekcji bazy).

Wniosek: zaburzając bazy spamerów powodujemy, że przy użyciu tych samych zasobów mniej osób otrzyma spam. Ponieważ często zasoby się po jakimś czasie "kończą" (bo ktoś wykrywa open proxy, infekcję, czy też blokuje host), efektywność spamowania drastycznie spada.

Do tej pory powstało już wiele stron mających na celu zasypać spamerów fałszywymi adresami. Jednak ich skuteczność nie jest wysoka jak mogłoby się początkowo wydawać.

1. Wszystkie strony generują adresy na podstawie algorytmu, który daję odmienne wyniki za każdym wyświetleniem strony. Wystarczy więc jak harvester będzie sprawdzał treść każdej strony dwukrotnie. Metoda ta będzie zmniejszała wydajność przeszukiwania, jednak może być często stosowana ze względu na bardzo dużą ilość stron mających na celu zasypanie botów losowo generowanymi adresami.

2. Pojawienie się na stronie większej ilości adresów mailowych nie jest rzeczą naturalną - odrzucanie takich adresów przez boty nie jest problemem.

Czy więc warto stosować takie rozwiązanie?
Na pewno tak, większość botów jest tworzona przez 'amatorów' - zareagują one na każdą 'małpę' w treści strony. Spamerzy działający na większą skale bez problemu poradzą sobie z zaprojektowaniem botów tak, aby radziły sobie z niepożądaną przez nie treścią.

Aby ograniczyć ilość wysyłanego spamu należy opracować sposób 'dokarmiania harvestera', w którym identyfikacja fałszywych adresów nie będzie tak prosta. To tylko kwestia czasu i organizacji ...

Komentarze 87:

  • » Delfin: 25.11.2006 o 22:36

    Gdzie można pobrać skrypt o którym pisałes?

  • » Adriano: 25.11.2006 o 22:48

    Na blogu Tonida, podlinkowałem wpis w którym mówi o skrypcie i jego konfiguracji ...

  • » Delfin: 26.11.2006 o 10:24

    OK, mam, dzięki.

  • » Imp: 03.05.2007 o 11:36

    Fajny art...tylko szkoda ze nie moge pobrac tego skryptu ze strony Tonida:/

Dodaj komentarz:

Dostępne tagi: [link]http://adres-www[/link] [quote]cytat[/quote] [code]kod[/code] [pre]tekst preformowany[/pre] [b]bold[/b]