Crawler

Entwickler des SchülerVZ-Crawlers legte Pläne im Netz offen



3x1t ging freizügig mit unerlaubt ausgelesenen SchülerVZ-Daten um

Der Crawler, mit dem die sozialen Netzwerke der VZ-Gruppe ausgelesen wurden, stammt aus Erlangen. Nach einigen Hinweisen und einer Recherche im Google-Cache sieht es so aus, als ob der Entwickler Mathias L. die Daten nicht nur aus sportlichen Gründen unerlaubt ausgelesen hat.

Bild von adsnews
Weiter:

Webmaster-Tools - Crawl-Geschwindigkeit frei einstellbar



Die Crawl-Geschwindigkeit in den Google Webmaster-Tools ist nun frei einstellbar ist. Wer also über sehr viele Seiten und/oder oft aktualisierten Content verfügt, kann hier mal den Regler hoch schieben und schauen was passiert :-).

Bild von trblogger
Weiter:

Yacy - Eine verteilte Suchmaschine



YaCy ist ein verteilte P2P-Suchmaschine, die es jedem ermöglicht einen Crawler aufzusetzen und unzensiert zu suchen.

Dabei zeigt YaCy ganz ausgezeichnet über ein Webinterface, was es gerade macht und es macht richtig Laune zuzusehen.

Ein weiteres gelungenes Feature ist die Internet-Visualisierung, die aus dem eigenen Index Bilder von der Linkstruktur belibieger Webseiten bauen kann.

Bild von rocu
Weiter:

MSNBot verfälscht Nutzungsstatistiken - inkognito



MSNBot, der Crawler von Microsofts Live Search identifiziert sich normalerweise mit einem eigenen User-Agent String. Dem Betreiber des Flashcounter-Services von Webmasterpro.de fiel nun ein Bot auf, der auf vielen Seiten hohen Traffic erzeugt. Dieser entpuppte sich als undercover MSNBot.

Bild von adsnews
Weiter:

Download-Tipp: Tristat Modul (Freeware)



Tristat Modul ist eine Software zur statistischen Auswertung von Zugriffen auf Webseiten und Downloads mit integriertem Content Management für Downloads. Ausgewertet werden die Server-Variablen über einen PHP-Tag oder eine transparente Javascript-Zählgrafik. Crawler werden gesondert erfasst.

Bild von adsnews
Weiter:
Inhalt abgleichen