Wie kann Google erkennen, welche Webseiten und Ergebnisse besonders zuverlässig und vertrauenswürdig sind? Einen Weg dazu beschreibt ein neues Patent.
Die Qualität der gelieferten Ergebnisse ist entscheidend für eine Suchmaschine wie Google. Leider aber gibt es im Netz nicht nur seriöse, gut recherchierte Inhalte, sondern auch viele Seiten zweifelhafter Qualität.
Um die Spreu vom Weizen trennen zu können, könnte Google in nächster Zeit auf Mechanismen zugreifen, die in einem neuen Patent beschrieben sind, das den Titel "Obtaining authorative search results" trägt.
Im Abstract dieses Patents heißt es:
"Methods, systems, and apparatus, including computer programs encoded on computer storage media, for obtaining authoritative search results. One of the methods includes receiving a first search query. First search results responsive to the first search query are obtained. Based on the first search query or the first search results, an authoritative search result that identifies a resource on a site that is authoritative for the first search query is obtained. A ranking of the authoritative search result and the one or more first search results is generated, and the ranking of the authoritative search result and the one or more first search results is provided in response to the first search query."
Basierend auf einer Suchanfrage sollen also zwei Dinge geschehen:
- Es wird ein als besonders zuverläsig und hochwertig geltendes Ergebnis ermitelt.
- Zusätzlich werden weitere Suchergebnisse erzeugt.
- Diese Ergebnisse werden anschließend in eine Reihenfolge gebracht und ausgegeben.
Falls die ursprüngliche Suchanfrage kein befriedigendes Ergebnis liefern sollte, können Abwandlungen der Suchanfrage durchgeführt und Ergebnisse für diese erzeugt werden, die dann dem Nutzer präsentiert werden.
Neu und bemerkenswert ist hier die Bestimmung des als "authoritative search result" bezeichneten Suchergebnisses.
Was genau darunter zu verstehen ist, wird auch im Patent genannt:
"In general, an authoritative site is a site that the search system has determined to include particularly trusted, accurate, or reliable content. The search system can distinguish authoritative sites from low-quality sites that include resources with shallow content or that frequently include spam advertisements. Whether the search system considers a site to be authoritative will typically be query-dependent."
Es geht also um Seiten mit besonders vertrauenswürdigen, passenden und verlässlichen Inhalten im Gegensatz zu Seiten mit wenig fundierten Inhalten oder Werbe-Spam. Dabei hängt die Auswahl der hochwertigen Seiten von der jeweiligen Suchanfrage ab. Eine Seite wie zum Beispiel die des Centers for Disease Control (cdc.gov) kann für eine Suchanfrage nach Krankheiten, die von Moskitos übertragen werden, als führend erkannt werden, nicht aber für Suchanfragen nach Restaurantempfehlungen.
Google könnte die Liste der als jeweils führend erkannten Webseiten in einer Datenbank vorhalten. Ein früheres Google-Patent aus dem Jahr 2015 beschreibt, dass eine Liste solcher Seiten auch als "Seed-Liste" für die Auswahl weiterer vertrauenswürdiger Webseiten genutzt werden kann.
Welche Inhalte sind geeignet, damit eine Webseite als "führend" erkannt wird?
Für die Inhalte der betreffenden Webseiten gilt laut Patent folgende Definition:
"Internet search engines aim to identify resources, e.g., web pages, images, text documents, multimedia content, e.g., videos, that are relevant to a user's information needs and to present information about the resources in a manner that is most useful to the user."
Es geht also, wer hätte es gedacht, um die Informationsbedürfnisse der Nutzer, die von den in Frage kommenden Webseiten, Bildern, Texten und multimedialen Inhalten optimal bedient werden sollen.
Die Lehre aus dem Patent?
Eine wichtige Frage beantwortet das Patent nicht: Was kann man unernehmen, damit Google eine Webseite als "authoritative" erkennt? Der Hinweis auf die Bedürfnisse der Nutzer ist hier von zentraler Bedeutung. Man sollte vor dem Erstellen neuer Inhalte (übrigens auch bei der Überarbeitung bestehender Inhalte) stets überlegen, welche Fragen sich die Nutzer stellen und wie diese optimal beantwortet werden können. Das kann dazu beitragen, dass die Nutzer die Arbeit durch das Teilen in sozialen Netzwerken, durch Weiterempfehlungen und das Setzen von Links honorieren.
Titelbild © aurora - Fotolia.com