Ein neues Google-Patent beschreibt einen Mechanismus, der an den PageRank erinnert, zugleich aber mit einer Liste von vertrauenswürdigen Seiten arbeitet. Doch der gezeigte Ansatz ähnelt vielen bereits existierenden Algorithmen zur Bestimmung der Webseitenqualität.
Das Vertrauen, das eine Webseite im Netz genießt, spielt für Google eine wichtige Rolle beim Ranking. Schon der PageRank-Algorithmus bezieht dieses Vertrauen mit ein: Seiten, die Backlinks von anderen populären Seiten (ebenfalls an der Zahl und der Qualität der Backlinks gemessen) erhalten, erhalten einen höheren PageRank als Seiten, die weniger Links oder nur solche von weniger populären Seiten erhalten.
Aufgebohrter PageRank
Google nutzt den PageRank mit großer Wanrscheinlichkeit noch immer als einen der wichtigsten Rankingfaktoren und scheint den Algorithmus auch weiterzuentwickeln: Ein neu gewährtes Patent (20. Oktober 2015) beschreibt einen Mechanismus, der, ähnlich zum PageRank, die Beziehungen von Webseiten im Netz für das Ranking nutzt. Zusätzlich jedoch wird eine "Seed-Liste" von besonders vertrauenswürdigen Webseiten eingeführt. Zur Bewertung einer Webseite wird jeweils die kürzeste Distanz im Netz zwischen dieser Webseite und einer der Seiten aus der Seed-Liste bestimmt. Dabei werden bestehende Verlinkungen berücksichtigt.
Ähnlichkeit zu bestehenden Algorithmen
Auf den ersten Blick fällt die Ähnlichkeit zu bereits bestehenden Ansätzen auf. Neben dem bereits erwähnten PageRank erinnert das Patent an den Hilltop-Algorithmus, der ebenfalls eine vorab definierte Anzahl von so genannten Expertenseiten und darauf basierender Autoritätsseiten für die Bewertung weiterer Dokumente verwendet.
In diesem Zusammenhang taucht auch der Begriff des TrustRanks auf: Auch dieser Wert kann als Qualitätsmerkmal von Webseiten betrachtet werden. Wie beim Hilltop-Algorithmus werden zur Berechnung des Wertes vorab einige als vetrauenswürdig einzustufende Domains manuell ausgewählt. Danach wird betrachtet, auf welche weiteren Domains diese vorab ausgewählten Domains verlinken. Je größer die Entfernung einer Domain vom Ausgangspunkt ist, desto niedriger ist ihr TrustRank.
Schließlich gibt es ein Dokument (PDF), das gemeinsam von Yahoo und der Stanford University entwickelt wurde. Es beschreibt Möglichkeiten zur Erkenung von Webseiten mit Spam. Auch hier findet zunächst eine manuelle Auswahl besonders vertrauenswürdiger Seiten statt, in deren Folge die Distanz zu untersuchender Webseiten von diesen vorab ausgewählten Seiten ermittelt wird.
Eine Erkenntnis für viele Ansätze
Sicherlich ist es kein Zufall, dass es inzwischen viele ähnliche Ansätze zur Ermittlung der Webseitenqualität gibt. Die unterschiedlichen Algorithmen vertrauen im Grunde alle auf die als wahrscheinlich anzunehmende These, dass vertrauenswürdige Webseiten nicht oder nur sehr selten auf unseriöse Dokumente verlinken. Betrachtet man das Beispiel von Regierungswebseiten oder Seiten aus dem Bildungsbereich, leuchtet diese Tatsache sofort ein. Daher verwundert es auch nicht, dass alle genannten Ansätze im Grunde auf diese Erkenntnis setzen.
Danke an SEO by the SEA
Titelbild © aurora - Fotolia.com