Ein aktuelles Google-Patent erklärt, wie die Suchmaschine bei der Interpretation neuer Suchanfragen mit Hilfe von Synonymen in Suchanfragen vorgehen könnte. Dabei kommen Kategorien von Begriffen zum Einsatz.
Jeden Tag verarbeitet Google zahlreiche Suchanfragen, die so noch nie gestellt wurden. Laut Google sind etwa 15 Prozent der täglich ankommenden Suchanfragen neu. Um diese Suchanfragen zu interpretieren, hat Google unter anderem mit dem RankBrain-Algorithmus Mechanismen geschaffen, die es ermöglichen sollen, neue Begriffe und Wortkombinationen zu verstehen.
Ein wichtiger Bestandteil beim Erkennen und Interpretieren neuer Suchanfragen besteht in der Verarbeitung von Synonymen, also von unterschiedlichen Begriffen mit derselben Bedeutung. Ein aktuelles Patent erklärt, wie Google beim Erkennen und Ersetzen von Synonymen in Suchanfragen vorgehen könnte. Das Patent, das am 1. Dezember dieses Jahres gewährt wurde, trägt den Titel "Synonym identification based on categorical contexts".
Am besten lässt sich die im Patent beschriebene Funktionsweise zur Erkennung von Synonymen anhand eines Beispiels erklären: Wenn "San Francisco" und "Grey Bull" Städte sind und "Restaurants" ein passendes Synonym für Suchanfragen nach Essen in San Francisco darstellt, dann kann es sein, dass dies auch für Suchanfragen im Zusammenhang mit der Stadt Grey Bull der Fall ist. San Francisco und Grey Bull gehören beide zur Kategorie "Stadt". Auf diese Weise lassen sich Zusammenhänge aus Suchanfragen für die Stadt San Francisco auch auf Suchanfragen für kleinere Städte wie Grey Bull übertragen.
Für den im Patent beschriebenen Prozess muss die Erkennung von Kategorien jedoch erweitert werden um den Begriff der kohärenten bzw. der zusammenhängenden Kategorien. Von solchen Kategorien wird ausgegangen, wenn die in einem Satz von Suchanfragen und in der jeweiligen Kategorie gemeinsam vorkommenden Terme bzw. Entitäten einen gewissen Schwellwert überschreiten. Angewandt auf das obige Beispiel müssen also erst genügend Suchanfragen nach dem Schema "Restaurant + Stadt" gestellt worden sein, um von einer kohärenten Kategorie sprechen zu können.
Bei diesem Mechanismus kommt eine so genannte Knowledge Base zum Einsatz, eine Art von Datenbank, die Wissen über entsprechende Kategorien und in ihnen vorkommende Entitäten umfasst. Auch Googles Knowledge Graph basiert auf dieser Datenbank.
Da sich die Sprache und damit auch die genutzten Wörter und Begriffe in einem kontinuierlichen Veränderunsprozess befinden, ist es für Suchmaschinen wie Google sehr wichtig, gleichlautende Begriffe verstehen zu können. Das beschriebene Patent stellt einen Baustein dar, mit dem dies gelingen kann.
Danke an SEO by the SEA
Titelbild © aurora - Fotolia.com