SEO-News

Google SuchefeldBeim sogenannten Query Parsing bereitet Google Suchanfragen so auf, dass sie für die Abfrage passender Ergebnisse aus dem Index verwendet werden können. Dabei ist das Query Parsing ein wichtiger Schritt, um zum Beispiel Synonyme abdecken zu können.

Eine bei Google eingegebene Suchanfrage wird nicht in ihrer ursprünglichen Form zur Abfrage von Suchergebnissen aus dem Index verwendet. Zuvor wird sie aufbereitet. Diesen Schritt nennt man Query Parsing. In einer neuen Ausgabe von Googles SEO-Podcast "Search Off the Record" erklärt Gary Illyes, wie das Query Parsing funktioniert.

Das Aufbereiten der Suchanfrage dient dazu, dass der Index sie verstehen kann. Die geparste Suchanfrage sei im Vergleich zur ursprünglichen Suchanfrage zumindest in den meisten Fällen "eine absolute Monstrosität":

"When we query our index, before we can send the query to the index, we have to transform it into something that our index will understand. That would be the parsed query. The parsed query, compared to the users' query, at least in most cases, is an absolute monstrosity."

Suche man zum Beispiel nach etwas wie "auto kaufen", dann entstehe daraus ein großer Protocol Buffer (dabei handelt es sich um einen Mechanismus zum Serialisieren strukturierter Daten, Anmerkung Red.). Das bedeuet, aus einer kleinen Suchanfrage kann ein großes Konstrukt mit vielen Wörtern werden:

"Basically, if you search for something like "purchase auto" or "purchase car," for example, that becomes a massive protocol buffer-- "protocol buffer," look it up on your favorite search engine, it's open source-- but it becomes this massive protocol buffer with many words."

Auf diese Weise können Suchergebnisse geliefert werden, die nicht nur zur Suchanfrage selbst passen, sondern auch zu verwandten Suchanfragen. Manchmal können dabei allerdings auch Fehler passieren:

"That's, essentially, what query understanding and parsing does: expanding the query into something that will not only return the results that are relevant for that query-- that exact query that the user searched for-- but also very closely related queries. Sometimes, it also makes mistakes that you can see in the video that we probably will link to in our description."

Bei Suchanfragen aus nur zwei Wörtern sei dies noch recht einfach, doch wenn man Suchanfragen wie "Herr der Ringe" betrachte, dann sehe das schon anders aus: Soll dann jedes Wort einzeln und für sich betrachtet oder das gesamte Konstrukt als Entität behandelt werden?

"But if you have stuff like "The Lord of the Rings," for example, then that's a more complex query, and you have to decide what to do with that string. Do you treat each word separately, or you treat the whole thing as basically a compound and as, essentially, an entity on itself?"

In anderen, nicht-englischen Sprachen könne dies noch komplizierter sein, etwa dann, wenn Leerzeichen zwischen Wörtern fehlen oder es sehr lange Zeichenketten geben kann, wie etwa im Thaländischen.

Ein System mit dem Namen Segmentor sorgt bei Google für das Aufteilen der Zeichenketten :

"We have a system called a Segmentor that will try to split up the strings that the users supply to us and, basically, create word that we can look up in our index."

 

Synonyme und Flexionen wie Plural: All das geschieht beim Verstehen von Suchanfragen

Nach dem Parsen folgt das Verstehen der Suchanfrage. Hier gebe es einiges an Magie. Dazu gehören Synonyme und auch Anti-Synonyme. Auch das Hinzufügen der Plural-Form bei Suchanfragen im Singular könne Bestandteil sein:

"Now that we have our parsed, I guess, user query, we move on to understanding. In this space, we do a lot of magic. One would be synonyms, for example. Also 'antisynonyms,' I guess. If you search for 'purchase car,' then we would also expand that query to, let's say, 'purchase auto,' or 'buy car,' or-- I forgot what the last one is, but you get the point. Then we would also inject in the parsed query the plural forms of the noun, I guess, in this case. So it would be 'purchase cars.'"

Anti-Synonyme sind Fälle, in denen Begriffe nicht miteinander in Verbindung gebracht werden sollen, wie zum Beispiel bei den Fluglinien "United" und "Continental Airlines".

Auch das Entfernen von Stoppwörtern gehört zum Aufbereiten und Verstehen von Suchanfragen. Das betrifft im Deutschen Wörter wie "der", "die", "das" oder "und". In manchen Fällen seien Stoppwörter aber notwendig, etwa dann, wenn sie Teil eines Titels sind wie in "Herr der Ringe":

"What else do we do? Stop words. We have to remove stop words. If you think about it, the internet is full of words like 'of,' 'the'," 'a', 'and.' In most cases, you don't need those words in the query. You don't have to search for them because they are just not relevant. You can safely drop them most of the time because there are cases where you can't drop them, like 'The Lord of the Rings.' There, you need all of them to understand the query and to detect the entity."

 

Inhalte von Webseiten werden lediglich in Token zerlegt

Beim Verstehen von Inhalten auf Webseiten geht Google übrigens anders vor als bei Suchanfragen. Hier findet lediglich eine Zerlegung der Inhalte in Token statt:

"They are different systems. When we parse a page, then we just tokenize it. Basically, we do the splitting if the language needs it, but otherwise, we just put everything in the index that we find on the page."

Synonyme werden nicht zusammen mit den Inhalten von Seiten abgespeichert, sondern bei der Verarbeitung von Suchanfragen bestimmt:

"Okay, so like synonyms, it's not that we would store the synonyms with the index. We would pick them up when someone searches for them. Gary Illyes: That's right. For example, when I search for 'purchase car,' for example, then if Martin Splitt thought they have a page for that or a page for 'purchase auto,' then we would pick, potentially, that page, if it doesn't suck, and would return it because we expanded the query to 'purchase auto' as well. Basically, the query would become 'purchase car' or 'auto.'"

Die Sprache übernimmt Google dabei vom Browser - zumindest normalerweise. Wenn der Browser einen Accept-Language-Header sendet, dann verwendet Google diesen. Und wenn man die Google-Suche auf eine bestimmte Sprache einstellt, dann werde Google dies berücksichtigen - zumindest, solange eine Suchanfrage nicht offensichtlich in einer anderen Sprache gestellt wird: 

"The language, that becomes more interesting in a lower level, but usually we pick up the language from the browser. Usually, it's not always. Basically, if the browser sends Accept-Language header, for example, then we would pick that up and use that. Or if you set your Google Search language to-- I don't know-- Thai, for example, then we would detect that and use that. Unless it's obvious that you are not searching in that language. For example, if your browser is set to Japanese, and you are using Latin characters searching for 'banana,' then it's more likely that you want English results."

 

Fazit

Es ist faszinierend zu sehen, dass ein großer Teil der Suche bereits beim Parsen und beim Verstehen von Suchanfragen stattfindet. Dazu gehören zum Beispiel das Hinzufügen von Synonymen und verschiedenen Flexionen wie zum Beispiel dem Plural. Auf diese Weise kann Google den Index vergleichsweise schlank halten.

 


Christian Kunz

Von Christian Kunz

SEO-Experte. Sie benötigen Beratung für Ihre Webseite? Klicken Sie hier.



Anzeigen

Artikelveröffentlichungen auf starken Magazinen und Blogs

Wir kooperieren mit unzähligen Verlagen und Bloggern und können daher auf über 4000 Blogs zu fast allen Themengebieten Artikelplätze anbieten:

    - Nachhaltiger Linkaufbau, kein SEO-Netzwerk
    - Hohe Sichtbarkeitswerte, keine expired Domains
    - Einmalzahlung, keine Vertragsbindung

Für jede Artikelveröffentlichung erstellen wir hochwertigen Content mit mindestens 400 Wörtern und publizieren den Artikel mit einem DoFollow-Bachlink zu deiner Seite auf einem Magazin oder Blog deiner Wahl.

Frag uns unverbindlich nach Beispielen



SEO-Vergleich





Verwandte Beiträge

SEO-Newsletter bestellen

Im monatlichen SEO-Newsletter erhaltet Ihr eine Übersicht der jeweils zehn wichtigsten SEO-Meldungen des Monats. Mit dem SEO-Newsletter bleibt Ihr auf dem Laufenden.
Ich bin mit den Nutzungsbedingungen einverstanden

Anzeige

Search One

 

 

Anzeige

rnkeffect

 

Premium-Partner (Anzeige)


Anzeigen

InterNetX

trust in time

SEO Agentur aus Darmstadt

SEO-Vergleich

Backlink-Kampagnen

SEO-Beratung

Suchmaschinenoptimierung und SEO-Beratung für Karlsruhe, Baden und die Pfalz

 

06340/351-943

 

info(at)seo-suedwest.de

Auszeichnungen

SEO-Vergleich.de: Top 30 SEO-Agenturen mit der höchsten Sichtbarkeit 2020

iBusiness Top-100-Liste SEO-Dienstleister

SEO Südwest: Platz 5 bei den SEO-Wahlen 2014 zum besten deutschen SEO-Blog

 

SEO-united.de Tipp 12/15

Sprecher auf

Onsite-Optimierung

Onsite-Optimierung

 

SEO- und Suchmaschinenblogs

Bekannt aus

Website Boosting


Internet World Business

SEO United


The SEM Post


Webselling

SEO selber machen

SEO selber machen

Jetzt vernetzen

SEO-Glossar

SEO-Glossar

 

SEO-Kalender 2020

SEO-Kalender 2019

 

SEO im Ohr, der Podcast von SEO Südwest: aktuell Folge

IMAGE Special zu den neuen Google Quality Rater Guidelines: SEO im Ohr - Folge 172
Freitag, 22. Oktober 2021
Google hat in dieser Woche eine neue Version der Quality Rater Guidelines herausgebracht. Darin sind einige wichtige Änderungen enthalten - zum Beispiel hinsichtlich der Bewertung von EAT oder der Einstufung von Websites mit geringer Qualität.... Weiterlesen...

SEO-Tipps und SEO-Tricks

IMAGE 'Noindex' oder robots.txt - wann ist welches Instrument das richtige?
Freitag, 09. Februar 2018
Um zu steuern, welche Seiten von Google und anderen Suchmaschinen gecrawlt und indexiert werden... Weiterlesen...
IMAGE Lighthouse: ein Top-Tool für die Performancemessung von Webseiten und PWAs
Montag, 16. Oktober 2017
Lighthouse ist ein Tool, mit dem man die Performance und die Nutzerfreundlichkeit von Progressive... Weiterlesen...
IMAGE Tipp: Reddit für den Aufbau von Backlinks nutzen
Samstag, 17. Januar 2015
Die Social-News-Plattform Reddit erlaubt den Aufbau von guten Backlinks - wenn man sich an... Weiterlesen...

News aus dem Blog

IMAGE Google Webmaster Conference 2019 in Zürich – Recap
Mittwoch, 11. Dezember 2019
Auf der diesjährigen Google Webmaster Conference in Zürich, die erstmals im Raum EMEA... Weiterlesen...
IMAGE Google Webmaster Hangout: A visit at the Google Zurich office
Donnerstag, 05. Juli 2018
I was invited to Google Zurich to take part in a new episode of the Webmaster Office Hangout. I was... Weiterlesen...
IMAGE SEO-Rückblick 2020: Gespräch mit Markus Hövener
Dienstag, 01. Dezember 2020
Ein SEO-Rückblick in lockerer und entspannter Weise: Markus Hövener und ich sprechen über einige... Weiterlesen...

 Eine Auswahl zufriedener Kunden

Rebel - Bad Küche Raum
Schöne Haare Karlsruhe
kr3m
feel-perfect.eu - Die Nährstoffexperten border=
Flintec IT GmbH
ESM Academy
Ringladen

Verbinden und Informationen zu SEO Südwest

Impressum und Datenschutz

Social Networks und RSS-Feed