Wer wissen möchte, wie Google mit Duplicate Content umgeht, wird die heutigen Äußerungen von Gary Illyes sehr interessant finden. Bemerkenswert ist dabei vor allem, dass die Behandlung von Duplicate Content in mehreren Phasen stattfindet.
Duplicate Content gehört zu den Grundproblemen, mit denen sich Webseitenbetreiber, SEOs und Suchmaschinen beschäftigen müssen. Wenn inhaltlich sehr ähnliche oder gleiche Seiten unter mehreren, verschiedenen URLs abrufbar sind, kann das dazu führen, dass die Seiten in den Suchergebnissen für dieselben Keywords miteinander konkurrieren.
Google ist inzwischen sehr gut darin, Duplicate Content zu erkennen und zu filtern. Doch wie genau läuft dieser Vorgang ab? Dazu hat jetzt Gary Illyes einige interessante Informationen auf Twitter gepostet.
Demnach findet die Kanonisierung, also das Festlegen der Seite, die letztendlich in den Suchergebnissen erscheinen soll, auf Seitenebene statt. Wenn es zwei Seiten A und B gibt,die ähnliche oder gleiche Inhalte haben, dann werden diese miteinander verglichen. Es findet eine "Auktion" statt, deren Sieger dann den Zuschlag für die Suchergebnisseite erhält. Dieser Vorgang findet bereits während der Indexierung statt und ist "quasi-permanent".
Falls eine solche Bereinigung bei der Indexierung nicht möglich ist, wird je nach Keyword versucht, sie während der Suchanfrage durchzuführen.
Nachfolgend ist die komplette Twitter-Konversation zu sehen:
Illyes gibt in seiner Antwort einen wichtigen Hinweis, indem er den URL-Parameter "&filter=1" anspricht: Dieser Parameter in der URL einer Suchergebnisseite sorgt dafür, dass Google auch Suchergebnisse anzeigt, die normalerweise aufgrund ihrer Ähnlichkeit zu den anderen Ergebnissen ausgelassen werden. Immer dann, wenn Google schreibt: "Damit Sie nur die relevantesten Ergebnisse erhalten, wurden einige Einträge ausgelassen...", hat Google eine Filterung von Duplicate Content zur Laufzeit der Suche durchgeführt.
Um alle Ergebnisse zu sehen, kann man entweder auf den von Google mit dem Text angezeigten Link klicken oder eben "&filter=1" in der URL ergänzen.