Jede zehnte Suchanfrage, die Google verarbeitet, ist falsch geschrieben. Um mit Falschschreibweisen umzugehen, setzt Google auch auf maschinelles Lernen.
Schon im Oktober des vergangenen Jahres hatte Google erklärt, jede zehnte Suchanfrage sei falsch geschrieben. Das stellt die Suchmaschine vor große Herausforderungen, denn auch für Suchanfragen mit Schreibfehlern sollen die bestmöglichen Ergebnisse geliefert werden.
Wie Google mit solchen Suchanfragen umgeht, beschreibt Pandu Nayak, Vice President Search bei Google, jetzt in einem Blogbeitrag.
Demnach gibt es zwei Hauptkategorien von Schreibfehlern in Suchanfragen: konzeptuelle Schreibfehler, die darauf basieren, dass die Schreibweise eines Begriffes dem Nutzer unbekannt ist, und Tippfehler, die auf einer versehentlichen Falscheingabe basieren, zum Beispiel durch das Drücken falscher Tasten auf dem Keyboard. Letztere seien zum Beispiel ein Grund dafür, dass Google bereits mehr als 10.000 verschiedene Varianten für "YouTube" gesehen habe.
Im Umgang mit solchen Fehlern setzt Google auf verschiedene Techniken. Zu den einfacheren Ansätzen gehört es, Buchstaben, die auf der Tastatur nahe beieinander liegen, bei der Korrektur zu nutzen, zum Beispiel, wenn statt eines "i" ein "u" getippt wird. Beide Buchstaben liegen auf der Tastatur direkt nebeneinander.
Mithilfe von Deep Learning ist Google inzwischen auch in der Lage, seltene und sogar einzeln vorkommende Falschschreibweisen zu erkennen. Dabei wird auch der Kontext zwischen den Begriffen in einer Suchanfrage genutzt. Zunächst wird versucht, die komplette Suchanfrage zu verstehen. Davon ausgehend werden dann verschiedene Kandidaten für Ersetzungen erzeugt.
Je nachdem, wie sicher sich Google ist, eine fehlerhafte Schreibweise erkannt zu haben, wird entweder ein Hinweis per "Meinten Sie..." angezeigt, oder es werden gleich Ergebnisse für die korrigierte Suchanfrage ausgespielt - allerdings mit der Möglichkeit, zur ursprünglichen Suchanfrage zurückzukehren.
Bild: Google
SEO-Newsletter bestellen