
Google: Gerichtsdokumente zeigen die Bedeutung von Nutzersignalen für das Ranking

Gerichtsdokumente aus dem Kartellverfahren gegen Google zeigen, wie wichtig Nutzersignale für die Suche sind: Ihre Bedeutung könnte sogar die des PageRanks übersteigen.
Jüngst veröffentlichte Gerichtsdokumente gewähren einen umfassenden Einblick in die internen Mechanismen von Googles Ranking-Systemen. Aus den Unterlagen geht hervor, dass Nutzerinteraktionen und -daten eine entscheidende Rolle spielen, sowohl für die Bewertung von Webseiten als auch für die Häufigkeit, mit der Google Inhalte indexiert.
Danke an Marie Haynes für die Zusammenfassung und an Barry Schwartz für die Aufbereitung.
TL;DR: das Wichtigste in Kürze
- Nutzerdaten und -interaktionen spielen eine entscheidende Rolle für Googles Ranking-Algorithmen.
- Google nutzt Nutzerdaten in jedem Schritt des Suchprozesses, vom Crawling über das Indexieren bis hin zum Retrieval und Ranking.
- Das Verhalten der Nutzer ist seit 15 Jahren der Kern der Ranking-Verbesserungen, weil Google daraus lernt, welche Suchergebnisse relevant sind.
- Das Google-System "Glue" protokolliert umfangreiche Nutzeraktivitäten wie Suchanfragen, Klicks und Verweildauer, um die Vorhersage hilfreicher Ergebnisse zu verbessern.
- KI-Modelle wie RankEmbed BERT werden mit Nutzerfeedback und Bewertungen von Qualitätsprüfern trainiert, um Ranking-Signale zu erstellen.
Nutzerverhalten als zentrale Grundlage der Ranking-Verbesserung
Google verbessert seine Suchergebnisse, indem es aus dem Verhalten der Nutzer lernt. Jede Interaktion eines Nutzers liefert Google weitere Trainingsdaten und zeigt auf, welche Suchergebnisse als besonders relevant oder hilfreich erachtet wurden. Diese Art des Lernens aus dem Feedback der Nutzer ist seit 15 Jahren der Kern der Verbesserungen im Web-Ranking. Das Handeln der Nutzer lehrt Google, welche Ergebnisse tatsächlich nützlich sind.
Dabei verwendet Google die Nutzerdaten in jedem Schritt des Suchprozesses - angefangen beim Crawling über das Indexieren bis hin zum Retrieval und zum Ranking.
Nutzerdaten helfen Google außerdem dabei zu verstehen, welche Anzeigen Aufmerksamkeit erzielen, um die Qualität der Anzeigen besser bewerten zu können.
Auf Seite 87 des Dokuments ist dazu folgendes zu lesen:
Google utilizes user data “[a]t every stage of the search process,” from crawling and indexing to retrieval and ranking. User data further helps Google understand which ads capture users’ attention, enabling it to better evaluate ad quality and serve more relevant ads in the future. (finding that users’ sessions data “helps to tailor the advertisements that Google delivers to [them]”). These improvements in search quality and ad monetization ultimately translate into higher revenue, as superior search results attract additional users and more targeted ads generate more clicks.
Nutzerdaten werden zum Beispiel verwendet, um zu bestimmen, welche Websites gecrawlt werden sollen, in welcher Reihenfolge das geschehen undwie oft das Crawlen stattfinden soll. Ziel ist es, dass der Suchindex ein möglichst breites Spektrum von Themen und Quellen abdeckt und aktuelle Ergebnisse geliefert werden.
Wenn Google eine Seite seltener crawlt, kann das ein Hinweis darauf sein, dass Verbesserungen an der Qualität der Inhalte oder der Aufbau eines engagierten Publikums notwendig sind. Ein sogenannter Spam-Score jeder Website wird ebenfalls bei der Entscheidung über das Crawling berücksichtigt.
Auf Seite 93 und 94 heißt es weiter im Dokument:
[...]Google has continuously deployed user data to, among other things, determine which websites to crawl, in what order, and at what frequency; construct and organize its search index to ensure that it covers a wide range of subject matter and sources (and thus a diverse array of queries); enhance the “freshness” of results (i.e., bring them up to date); create signals and models that assess results’ relevance and establish their ranking; and run large-format experiments to develop new features.
Jedes Dokument, das im Google-Index gespeichert wird, erhält eine eindeutige ID (DocID), welche eine Reihe von Signalen und Attributen enthält Beschrieben ist das auf Seite 136 des Dokuments.
Zu diesen Signalen zählt die Popularität einer Seite, gemessen an der Nutzerabsicht, Klicks und Feedbacksystemen wie Navboost und Glue. Auch Qualitäts- und Autoritätskennzahlen sind darin enthalten.
Wichtige Ranking-Signale aus Nutzeraktivitäten
Die Anzahl der Klicks ist eines der grundlegenden Signale, die Google zur Ermittlung des Rankings verwendet. Obwohl Klicks kein direkter Rankingfaktor sind, werden sie gespeichert und in Systemen genutzt, welche die Platzierungen bestimmen. Ein Klick von einem Nutzer, der mit dem Inhalt der Seite zufrieden ist, gilt als starkes positives Signal.
Das System "Glue" von Google ist eine umfangreiche Protokolltabelle der Nutzeraktivität. Es erfasst unter anderem:
- Die Suchanfrage
- Sprache, Standort und Gerätetyp des Nutzers.
- Die auf den Suchergebnisseiten (SERP) angezeigten Inhalte, einschließlich Webseiten und SERP-Funktionen.
- Was der Nutzer angeklickt oder mit mit Mouseover berührt hat
- Wie lange der Nutzer auf der SERP verblieben ist.
- Interpretationen und Vorschläge zur Suchanfrage.
Google lernt aus jeder einzelnen Suche, weil es misst, wie Nutzer mit den angezeigten Ergebnissen interagieren, um die Vorhersage hilfreicher Ergebnisse zu verbessern.
KI-Modelle nutzen Nutzerfeedback
Ein zentrales Element ist das KI-Ranking-Modell RankEmbed BERT, welches durch 70 Tage Suchprotokolle und Bewertungen von Qualitätsprüfern trainiert wird (siehe Seite 137 im Dokument). Dieses Deep-Learning-System versteht natürliche Sprache sehr gut und bezieht Informationen über jede Suchanfrage in seine Berechnungen ein. Die Aktionen der Nutzer und die Bewertungen der Qualitätsprüfer helfen dem Modell zu erkennen, ob seine Vorhersagen erfolgreich waren. Wenn Nutzer mehr Anzeichen von Zufriedenheit zeigen, weist das darauf hin, dass der Algorithmus gut funktioniert.
Qualitätssignale wichtiger als PageRank
Im Dokument wird beschrieben, dass die Qualitätssignale, die direkt von der Webseite stammen, besonders wichtig sind. Die Bedeutung könnte sogar höher sein als die des PageRanks. Im Dokument heißt es dazu:
“PageRank […] is a single signal relating to distance from a known good source.”
Und weiter:
“Do you understand that most of Google’s quality signal is derived from the webpage itself?”
Es gibt außerdem Hinweise darauf, dass die Popularität, ein wichtiges Ranking-Signal, auf Chrome-Besuchsdaten basieren kann. Die tatsächliche Nutzung und Interaktion von Nutzern mit einer Seite könnten also zu deren Popularität beitragen. Aktive Interaktionen wie das Absenden von Formularen, Scrollen oder Einkäufe könnten ein stärkeres positives Signal darstellen als lediglich Verlinkungen.
SEO-Newsletter bestellen
Verwandte Beiträge


Google Gemini inklusive AI Overviews AI Mode werden mit Suche-Rankingfaktoren trainiert
