Google zeigt je nach Nutzer unterschiedliche Suchergebnisse an. Bei der Personalisierung der Suchergebnisse wird eine Reihe von Faktoren einbezogen. Welche das sein könnten, zeigt ein Patent, das Google gerade aktualisiert hat.
Die Suchergebnisse von Google unterscheiden sich je nach Nutzer - so viel ist klar. Dabei spielen neben der Sprache, dem Ort, dem genutzten Gerät und früher gestellten Suchanfragen viele weitere Faktoren eine Rolle. Welche das genau sind, kann niemand genau sagen.
Ein kürzlich aktualisiertes Patent, über das Bill Slawski auf seiner Webseite berichtet, könnte ein wenig mehr Klarheit in diese Frage bringen. Dabei ist zunächst interessant, dass es einige Änderungen im Patent gab. Ursprünglich hatte Google das Patent im September 2013 beantragt. Gewährt wurde es im März 2015. Die überarbeitete Version des Patents wurde in der vergangenen Woche gewährt.
Dabei sind vor allem diese Änderungen auffällig:
Die Personalisierung soll in der neuen Version auf Basis von "distrusted document weights" und einem "high quality document set" erfolgen. Diese beiden Begriffe waren in der früheren Version des Patents nicht erwähnt worden. Ob sich dadurch eine tatsächliche Änderung für die Berechnung der Werte ergibt, oder ob die Änderung nur zur besseren Verständlichkeit vorgenommen wurde, ist unklar.
Gemäß den Beschreibungen im Patent findet die Neubewertung der Rankings auf Basis der persönlichen Vorlieben der Nutzer wie folgt statt:
Eine Menge personalisierter Ergebnisse, bezeichnet mit "Document Bias Set", wird entweder automatisch oder durch manuelle Auswahl erstellt. In dem Set können solche Dokumente enthalten sein, die vom Nutzer oder der Nutzergruppe besonders bevorzugt werden. Die Bevorzugung kann dabei auf Vertrauen bzw. Misstrauen und / oder Respekt basieren:
"The weights may be assigned to each document (e.g., documents a, b, x, y and z) based on a user’s, or group’s, relative preferences among documents of bias set F 105. For example, bias set F 105 may include a user’s personal most-respected, or most-distrusted, document list, with the weights being assigned to each document in bias set F 105 based on a relative quantification of the user’s preference among each of the documents of the set."
Interessant ist, dass nicht nur Vorlieben, sondern auch negative Aspekte zum Tragen kommen.
Was genau ist aber ein "High Quality Document Set"? Das Patent beschreibt dessen Eigenschaften wie folgt:
- Es wird durch einen der bestehenden Ranking-Algorithmen berechnet.
- Möglich sind Rankings basierend auf Links wie zum Beispiel durch den PageRank-Algorithmus oder den "Hubs and Authorities"-Algorithmus von Kleinberg, der ähnlich wie der PageRank-Algorithmus Knoten in einem Netzwerk auf Basis ihrer Verlinkungen bewertet.
- Zum Set können die von den Algorithmen am höchsten bewerteten Dokumente gehören (zum Beispiel 20 Prozent der bestbewerteten Dokumente), oder die einen bestimmten PageRank überschreiten.
- Auch die Beziehungen der Dokumente im Set untereinander können in die Bewertung einfließen.
Die Menge der personalisierten Suchergebnisse, die letztendlich an die Nutzer ausgegeben werden, kann sowohl Dokumente aus dem "Document Bias Set" als auch aus dem "High Quality Document Set" stammen.
Wer sich mit der Personalisierung von Suchergebnissen etwas näher beschäftigen möchte, der findet in dem Patent interessante Ansätze, die es sich lohnt zu betrachten. Vor allem der Ansatz, Ergebnisse aus zwei unterschiedlichen Sets mit unterschiedlichen Kriterien auszuspielen, ist dabei bemerkenswert.
Titelbild © DigiClack - Fotolia.com