Raven hat was nettes entdeckt: Die Microsoft Live Search enthält auf einmal Google Ads. Aber nicht regulär, sondern als Links in den Suchergebnissen!
Da Google normalerweise zu verhindern weiss, dass diese Links von Spidern eingesammelt werden, ist bei dem Vorfall wohl von einem Fehler bei Microsoft auszugehen. Mir fällt da spontan (rein spekulativ) die Möglichkeit ein, dass man sich bei Microsoft gütlich getan hat an den Google SERPs, dazu die robots.txt von Google ignoriert und dabei vergessen hat die Ads auszufiltern... Wenn diese Vermutung totaler Quatsch ist, bitte ich um Kommentare hier!

Hier als kleines Beispiel die Suchergebnisseite von Live Search mit über 4 Millionen Treffern (!).
Mehr: Da haben wir wohl ein Problem: Microsoft listet 4 Mio. Adword Ads in Live Search

Kommentare (Neueste zuoberst)
Microsoft hat reagiert und erklärt
Microsoft hat ziemlich schnell reagiert und folgendes Statement dazu abgegeben:
sehr
sehr gefährlich, mit ein paar tricks habe ich schon den ersten link zu einem freien google-mail account...
Bug oder Feature...
Interessant auf jeden Fall und man stelle sich mal vor, das dies viel vertraulichere Daten gewesen wären, die so niemals in den Index kommen sollten und nun sind. Die Robots.txt von Google.com sagt auf jeden Fall aus: bitte nicht spidern...
Das aufnehmen und dann ausfiltern kann ich mir schwer vorstellen, denn warum erst spidern, wenn es doch untersagt ist dies zu tun?
Wie ich bei Dir lesen
Wie ich bei Dir lesen konnte, kommt Dir das also auch mehr als komisch vor, gelle?! Meine These wäre: MS möchte sich gerne am schön frischen Google Index laben, um die eigene Lahma*schigkeit ein wenig zu vertuschen. Zu der Frage wieso erst spidern und dann filtern, wenn doch eh verboten: Ist es nicht so, dass Google das spidern der Suchergebnisse in der robots.txt verbietet (dachte ich)? Nur dann würde meine These Sinn ergeben. Denn dann müsste man die robots.txt ignorieren um an die SERPs zu kommen, oder?
Robots.txt
Normal halten sich die Spider an die robots.txt, wodurch das ganze ja erst interessant ist. Jens vom GoogleWatchBlog.de habe ich das auch mal vorgeschlagen, da liest ja bekanntlich auch Google gerne mal mit, was vielleicht zur Folge hat, das man eventuelle Löschungen der 4 Mio Links vornimmt oder so... Ich würde denken Bug bei Microsofts Spider, wie Du schon eingehent vermutet hast.
Kommentar hinzufügen