SEO-News

Google SuchefeldBeim sogenannten Query Parsing bereitet Google Suchanfragen so auf, dass sie für die Abfrage passender Ergebnisse aus dem Index verwendet werden können. Dabei ist das Query Parsing ein wichtiger Schritt, um zum Beispiel Synonyme abdecken zu können.

Eine bei Google eingegebene Suchanfrage wird nicht in ihrer ursprünglichen Form zur Abfrage von Suchergebnissen aus dem Index verwendet. Zuvor wird sie aufbereitet. Diesen Schritt nennt man Query Parsing. In einer neuen Ausgabe von Googles SEO-Podcast "Search Off the Record" erklärt Gary Illyes, wie das Query Parsing funktioniert.

Das Aufbereiten der Suchanfrage dient dazu, dass der Index sie verstehen kann. Die geparste Suchanfrage sei im Vergleich zur ursprünglichen Suchanfrage zumindest in den meisten Fällen "eine absolute Monstrosität":

"When we query our index, before we can send the query to the index, we have to transform it into something that our index will understand. That would be the parsed query. The parsed query, compared to the users' query, at least in most cases, is an absolute monstrosity."

Suche man zum Beispiel nach etwas wie "auto kaufen", dann entstehe daraus ein großer Protocol Buffer (dabei handelt es sich um einen Mechanismus zum Serialisieren strukturierter Daten, Anmerkung Red.). Das bedeuet, aus einer kleinen Suchanfrage kann ein großes Konstrukt mit vielen Wörtern werden:

"Basically, if you search for something like "purchase auto" or "purchase car," for example, that becomes a massive protocol buffer-- "protocol buffer," look it up on your favorite search engine, it's open source-- but it becomes this massive protocol buffer with many words."

Auf diese Weise können Suchergebnisse geliefert werden, die nicht nur zur Suchanfrage selbst passen, sondern auch zu verwandten Suchanfragen. Manchmal können dabei allerdings auch Fehler passieren:

"That's, essentially, what query understanding and parsing does: expanding the query into something that will not only return the results that are relevant for that query-- that exact query that the user searched for-- but also very closely related queries. Sometimes, it also makes mistakes that you can see in the video that we probably will link to in our description."

Bei Suchanfragen aus nur zwei Wörtern sei dies noch recht einfach, doch wenn man Suchanfragen wie "Herr der Ringe" betrachte, dann sehe das schon anders aus: Soll dann jedes Wort einzeln und für sich betrachtet oder das gesamte Konstrukt als Entität behandelt werden?

"But if you have stuff like "The Lord of the Rings," for example, then that's a more complex query, and you have to decide what to do with that string. Do you treat each word separately, or you treat the whole thing as basically a compound and as, essentially, an entity on itself?"

In anderen, nicht-englischen Sprachen könne dies noch komplizierter sein, etwa dann, wenn Leerzeichen zwischen Wörtern fehlen oder es sehr lange Zeichenketten geben kann, wie etwa im Thaländischen.

Ein System mit dem Namen Segmentor sorgt bei Google für das Aufteilen der Zeichenketten :

"We have a system called a Segmentor that will try to split up the strings that the users supply to us and, basically, create word that we can look up in our index."

 

Synonyme und Flexionen wie Plural: All das geschieht beim Verstehen von Suchanfragen

Nach dem Parsen folgt das Verstehen der Suchanfrage. Hier gebe es einiges an Magie. Dazu gehören Synonyme und auch Anti-Synonyme. Auch das Hinzufügen der Plural-Form bei Suchanfragen im Singular könne Bestandteil sein:

"Now that we have our parsed, I guess, user query, we move on to understanding. In this space, we do a lot of magic. One would be synonyms, for example. Also 'antisynonyms,' I guess. If you search for 'purchase car,' then we would also expand that query to, let's say, 'purchase auto,' or 'buy car,' or-- I forgot what the last one is, but you get the point. Then we would also inject in the parsed query the plural forms of the noun, I guess, in this case. So it would be 'purchase cars.'"

Anti-Synonyme sind Fälle, in denen Begriffe nicht miteinander in Verbindung gebracht werden sollen, wie zum Beispiel bei den Fluglinien "United" und "Continental Airlines".

Auch das Entfernen von Stoppwörtern gehört zum Aufbereiten und Verstehen von Suchanfragen. Das betrifft im Deutschen Wörter wie "der", "die", "das" oder "und". In manchen Fällen seien Stoppwörter aber notwendig, etwa dann, wenn sie Teil eines Titels sind wie in "Herr der Ringe":

"What else do we do? Stop words. We have to remove stop words. If you think about it, the internet is full of words like 'of,' 'the'," 'a', 'and.' In most cases, you don't need those words in the query. You don't have to search for them because they are just not relevant. You can safely drop them most of the time because there are cases where you can't drop them, like 'The Lord of the Rings.' There, you need all of them to understand the query and to detect the entity."

 

Inhalte von Webseiten werden lediglich in Token zerlegt

Beim Verstehen von Inhalten auf Webseiten geht Google übrigens anders vor als bei Suchanfragen. Hier findet lediglich eine Zerlegung der Inhalte in Token statt:

"They are different systems. When we parse a page, then we just tokenize it. Basically, we do the splitting if the language needs it, but otherwise, we just put everything in the index that we find on the page."

Synonyme werden nicht zusammen mit den Inhalten von Seiten abgespeichert, sondern bei der Verarbeitung von Suchanfragen bestimmt:

"Okay, so like synonyms, it's not that we would store the synonyms with the index. We would pick them up when someone searches for them. Gary Illyes: That's right. For example, when I search for 'purchase car,' for example, then if Martin Splitt thought they have a page for that or a page for 'purchase auto,' then we would pick, potentially, that page, if it doesn't suck, and would return it because we expanded the query to 'purchase auto' as well. Basically, the query would become 'purchase car' or 'auto.'"

Die Sprache übernimmt Google dabei vom Browser - zumindest normalerweise. Wenn der Browser einen Accept-Language-Header sendet, dann verwendet Google diesen. Und wenn man die Google-Suche auf eine bestimmte Sprache einstellt, dann werde Google dies berücksichtigen - zumindest, solange eine Suchanfrage nicht offensichtlich in einer anderen Sprache gestellt wird: 

"The language, that becomes more interesting in a lower level, but usually we pick up the language from the browser. Usually, it's not always. Basically, if the browser sends Accept-Language header, for example, then we would pick that up and use that. Or if you set your Google Search language to-- I don't know-- Thai, for example, then we would detect that and use that. Unless it's obvious that you are not searching in that language. For example, if your browser is set to Japanese, and you are using Latin characters searching for 'banana,' then it's more likely that you want English results."

 

Fazit

Es ist faszinierend zu sehen, dass ein großer Teil der Suche bereits beim Parsen und beim Verstehen von Suchanfragen stattfindet. Dazu gehören zum Beispiel das Hinzufügen von Synonymen und verschiedenen Flexionen wie zum Beispiel dem Plural. Auf diese Weise kann Google den Index vergleichsweise schlank halten.

 


Christian Kunz

Von Christian Kunz

SEO-Experte.
Sie benötigen Beratung für Ihre Webseite? Klicken Sie hier


Anzeige

SEO-Vergleich


Verwandte Beiträge

Google zur möglichen Zukunft von XML-Sitemaps

Sind XML-Sitemaps noch zeitgemäß, oder werden sie zukünftig von anderen Instrumenten abgelöst? Um diese und andere Fragen ging es in einer neuen Ausgabe von Googles SEO-Podcast "Search Off the...

SEO-Newsletter bestellen

Im monatlichen SEO-Newsletter erhaltet Ihr eine Übersicht der jeweils zehn wichtigsten SEO-Meldungen des Monats. Mit dem SEO-Newsletter bleibt Ihr auf dem Laufenden.
Ich bin mit den Nutzungsbedingungen einverstanden

Anzeigen

OSG

 

Senior SEO

 

 

Anzeige

rnkeffect

Premium-Partner (Anzeige)


Anzeigen

sedo

SEO Agentur aus Darmstadt

SEO-Vergleich

Online Solutions Group




Sprecher auf

Onsite-Optimierung

Onsite-Optimierung

 

SEO- und Suchmaschinenblogs

SEO-FAQ

Bild © FM2 - Fotolia.com

Bekannt aus

Website Boosting


Internet World Business

SEO United


The SEM Post


Webselling

SEO selber machen

SEO selber machen

Jetzt vernetzen

SEO-Glossar

SEO-Glossar

 

SEO im Ohr, der Podcast von SEO Südwest: aktuell Folge

SEO-Beratung

Wir bringen gemeinsam Ihre Webseite in Google nach vorne. Profitieren Sie von jahrelanger SEO-Erfahrung.

Social Networks und RSS-Feed

Auszeichnungen

seo19 sieger sichtbarkeit 2020 200x200px