Google hat den Prozess des Ausspielens und des Rankings von Suchergebnissen detailliert erklärt. Dabei wird deutlich, wie viele Schritte zwischen der Eingabe der Suchanfrage und der fertigen Suchergebnisseite durchlaufen werden müssen.
In einer neuen Ausgabe von Googles SEO-Podcast "Search Off the Record" geht es unter anderem um die Frage, wie Google Suchanfragen verarbeitet und die passenden Suchergebnisse auswählt. Obwohl Google keine Details dazu nennt, wie das Ranking von Suchergebnissen genau funktioniert, zeigt die Beschreibung im Podcast dennoch recht anschaulich den Ablauf.
Jeder Sucheprozess beginnt demnach mit der Eingabe eines Suchbegriffs durch einen Nutzer. Diese Suchanfrage durchläuft Googles Systeme in zwei Richtungen: zuerst nach unten und danach wieder nach oben. Auf ihrem Weg passiert die Suchanfrage verschiedene Komponenten des Systems. Eine dieser Komponenten sorgt für das Parsen, also das Aufarbeiten sowie für das Verstehen der Suchanfrage:
"But going back to the higher level serving system, what we start with is a query from the user. That query is traveling in the serving system two ways: one is going down, and one is going up. When going down, it passes several systems, which I think we can cover, or at least most of them. One would be the query parsing and understanding system."
Danach folgt eine Art von Router, der dafür sorgt, dass die Suchanfrage die verschiedenen Indizes erreicht. Gerade für Universal Search, also für Suchergebnisseiten mit unterschiedlichen Arten von Ergebnissen, ist dieser Schritt von Bedeutung. So können zum Beispiel passende Bilder, News oder Videos herausgesucht werden.
Im Fall der Websuche setzt sich der Weg fort zum ausliefernden Index. Dort geschehen einige wichtige Dinge, die nicht alle im Detail genannt werden. Ein Bestandteil ist eine sogenannte Posting List, auf deren Grundlage Ergebnisse generiert werden, welche zu einer Suchanfrage passen könnten. Die entsprechenden Dokumente werden ausgewählt. Im Anschluss schaltet sich das Rankingsystem ein und sortiert die Ergebnisse:
"Then in case of web, the parsed query travels down to our serving index. That's where some of the magic happens, some of the magic that we already covered. For example, in a previous episode, we were talking about posting list. We are going to dedicate more time to this in a future episode. But based on the posting list, we find the results that might satisfy the user's query. We select those documents, and then we start pushing them back up. The ranking system kicks in and starts ranking the results that we've retrieved from our index."
Dabei werden Kriterien wie Relevanz zu einem Thema, die Qualität, der Inhalt und Hunderte von weiteren Rankingfaktoren angewandt. Die Ergebnisse setzen ihren Weg fort und gelangen wieder an einen Router, der die Suchanfragen an die verschiedenen Schichten des Index gesandt hat. An dieser Stelle wird auf Ergebnisse von anderen Indizes gewartet. Kommen Ergebnisse innerhalb der vorgegebenen Zeit, werden diese unter die Suchergebnisse gemischt - fertig ist die Universal Search-Ergebnisseite.
"Here, you can think of topicality, for example-- essentially, relevance-- that plays a huge factor in ranking than the quality of the results, the content, and-- I don't remember how we say it anymore-- but probably hundreds of other signals are taken into account for determining an order for the results that we retrieved from our serving index. Then it goes further up in the stack. Now, we reach that router again that was sending the queries to the different index tiers. Here, we wait a little bit for the other index's responses. If we get anything in the allotted time, then we would try to push the received results among the web results. That is, essentially, what universal search is."
Wenn die übrigen Ergebnisse nicht rechtzeitig eintreffen, werden nur Webergebnisse angezeigt. Im weiteren Schritt werden lediglich Anzeigen hinzugefügt und die Ergebnisse in ein Template eingebracht.
Alle der beschriebenen Schritte finden innerhalb weniger Millisekunden statt. Wenn ein Teil des Systems nicht rechtzeitig antwortet, werden dessen Ergebnisse nicht einbezogen. Ausnahme bilden Webergebnisse - auf sie wird immer gewartet:
"It's blazing fast. Every system has an allotted time for responding. If they don't respond in that time, then we would not wait for them, unless they are critical for the page. For example, for web results, we would always wait because without results, it's kind of weird."
Anzeigen oder Ergebnisse aus Google Maps werden nicht als kritisch erachtet. Wenn sie zu spät geliefert werden, erscheinen die Suchergebnisse ohne sie.
Eine wichtige Rolle im Prozess spielt das Caching. Sucht jemand zum Beispiel nach "Kekse in meiner Umgebung", dann wird er vermutlich wegen der geographischen Position immer zum selben Rechenzentrum geleitet. Nach der ersten Suche nach Keksen würden weitere Ergebnisse vermutlich aus dem Cache ausgespielt werden, so dass nicht der gesamte oben beschriebene Weg beschritten werden müsste. Das führe zu einer schnelleren Ausspielung der Ergebnisse:
"Plus, the second thing is that there is lots of caching going on. If people search for "cookies in my area," then they are very likely routed to the same data center because of the geographic area, and it just makes sense to route them to the same data center. There, we would very likely-- after the first 'cookie' query, we would return results from a cache, so we wouldn't even go down the whole stack and find new results for a certain time, which is order of minutes, but still, it helps a lot with giving users speedier results."
Auch wenn im Podcast keine Details zur Anwendung der Rankingfaktoren auf die Suchergebnisse genannt werden, vermittelt die Beschreibung zumindest einen groben Einblick, wie Google die Ergebnisse für Suchanfragen auswählt. Besonders faszinierend dabei ist die Geschwindigkeit, in der all das passiert.
SEO-Newsletter bestellen