Da haben wir wohl ein Problem: Microsoft listet 4 Mio. Adword Ads in Live Search



Raven hat was nettes entdeckt: Die Microsoft Live Search enthält auf einmal Google Ads. Aber nicht regulär, sondern als Links in den Suchergebnissen!

Da Google normalerweise zu verhindern weiss, dass diese Links von Spidern eingesammelt werden, ist bei dem Vorfall wohl von einem Fehler bei Microsoft auszugehen. Mir fällt da spontan (rein spekulativ) die Möglichkeit ein, dass man sich bei Microsoft gütlich getan hat an den Google SERPs, dazu die robots.txt von Google ignoriert und dabei vergessen hat die Ads auszufiltern... Wenn diese Vermutung totaler Quatsch ist, bitte ich um Kommentare hier!

Live Search ein bisschen kaputt?

Hier als kleines Beispiel die Suchergebnisseite von Live Search mit über 4 Millionen Treffern (!).

Mehr: Da haben wir wohl ein Problem: Microsoft listet 4 Mio. Adword Ads in Live Search

Bild von Francis Drake
Weiter:

Kommentare (Neueste zuoberst)

Bild von Francis Drake

Microsoft hat reagiert und erklärt

Microsoft hat ziemlich schnell reagiert und folgendes Statement dazu abgegeben:

The issue stems from the way Live Search handles content disallowed by the Robots.txt file. We regularly check the robots.txt file of a site to ensure that we don't index and cache pages excluded by the webmaster. However, if we do find a link elsewhere on the web pointing to a page excluded by the robots.txt file, we may include the link and the anchor text in our index if we think it might be valuable to our users. Yesterday we accidently began including the links from the ads of Google AdSense customers. The issue has been fixed, and you should see the results disappear from our search results over the next couple days.

Bild von Monbro

sehr

sehr gefährlich, mit ein paar tricks habe ich schon den ersten link zu einem freien google-mail account...

Bild von Besucher

Bug oder Feature...

Interessant auf jeden Fall und man stelle sich mal vor, das dies viel vertraulichere Daten gewesen wären, die so niemals in den Index kommen sollten und nun sind. Die Robots.txt von Google.com sagt auf jeden Fall aus: bitte nicht spidern...

Das aufnehmen und dann ausfiltern kann ich mir schwer vorstellen, denn warum erst spidern, wenn es doch untersagt ist dies zu tun?

Bild von Francis Drake

Wie ich bei Dir lesen

Wie ich bei Dir lesen konnte, kommt Dir das also auch mehr als komisch vor, gelle?! Meine These wäre: MS möchte sich gerne am schön frischen Google Index laben, um die eigene Lahma*schigkeit ein wenig zu vertuschen. Zu der Frage wieso erst spidern und dann filtern, wenn doch eh verboten: Ist es nicht so, dass Google das spidern der Suchergebnisse in der robots.txt verbietet (dachte ich)? Nur dann würde meine These Sinn ergeben. Denn dann müsste man die robots.txt ignorieren um an die SERPs zu kommen, oder?

Bild von seekXL

Robots.txt

Normal halten sich die Spider an die robots.txt, wodurch das ganze ja erst interessant ist. Jens vom GoogleWatchBlog.de habe ich das auch mal vorgeschlagen, da liest ja bekanntlich auch Google gerne mal mit, was vielleicht zur Folge hat, das man eventuelle Löschungen der 4 Mio Links vornimmt oder so... Ich würde denken Bug bei Microsofts Spider, wie Du schon eingehent vermutet hast.

Kommentar hinzufügen

Mit dem Absenden dieses Formulars akzeptierst Du die Mollom privacy policy.

Mehr Beiträge von mir

Google vereinfacht Authorship (rel="me") Verlinkung

Während Google bekannt gegeben hat, dass das Panda Update nun auch offiziell in Deutschland ausgerollt wird, gab es eine kleine Meldung...

Anleitung: Von Google+ nach Twitter und Facebook (und andere) posten

Wenn man von Google+ nach Twitter, Facebook, LinkedIn etc. posten möchte, dann kann man dies mit dieser kurzen Anleitung ganz einfach...

KinoX.to - Der Server ist zur Zeit Überrlastet...Wir arbeiten daran

Diese Idee scheint nicht schlecht gewesen zu sein: Einfach eine Domäne sichern, die so ähnlich wie "Kino.to" klingt, das Layout schnell...