In einer Gesprächsrunde hat sich Amit Singhal, Googles Verantwortlicher für die Entwicklung einer natürlicheren Suche, zu den vier größten Herausforderungen geäußert, denen sich der Suche-Konzern derzeit gegenüber sieht. Sämtliche Herausforderungen beziehen sich auf das Verstehen und Interpretieren natürlicher Sprache.
Die sprachgesteurte Suche ist kein Science Fiction mehr. Dienste wie Siri von Apple machen bereits vor, wie die Suche der Zukunft aussehen kann. Das Verstehen der Suche mit den einzelnen dazu gehörenden Aufgaben stellen nun die technischen Herausforderungen dar, denen sich Google in der Zukunft stellen wird. In dem auf forbes.com veröffentlichen Text sagt Singhal wörtlich
It should tell you things when you don’t ask it. If your flight is delayed you shouldn’t have to ask what’s the status. It should just know.[...]
Knowledge Graph
Um das Ziel einer Suchanfrage richtig verstehen zu können, muss sie in den richtigen semantischen Zusammenhang gebracht werden. Die Suche nach „Spiegel“ kann sich zum Beispiel sowohl auf den Einrichtungsgegenstand beziehen, aber auch auf das politische Magazin, den Stand einer Flüssigkeit usw. Mit dem Knowledge Graph, der ein Netzwerk so genannter Entitäten, als Gegenständen, Personen etc. sowie deren Eigenschaften und Verbindungen darstellt, lässt sich die Intention leichter erkennen, die hinter Suchanfragen steht.
Erkennung gesprochener Sprache (Speech-to-Text)
Für das Erkennen von gesprochenen Worten wird die menschliche Stimme in Text transformiert (Speech-to-Text). Damit wird die mündliche Eingabe von Suchanfragen ermöglicht, wie sie zum Beispiel bereits Siri von Apple bietet.
Das Verstehen natürlicher Sprache
Die bloße Übertragung der gesprochenen Worte in Text reicht nicht aus, um die dahinter liegenden Zusammenhänge zu erkennen. Natürliche Sprache zeichnet sich durch verschiedene Variationen und Nuancen ab. Jeder Mensch spricht auf eine bestimmte und unverwechselbare Art und Weise. Das erschwert die Spracherkennung. Das Ziel ist es, trotz dieser Abweichungen eine zuverlässige Detektion des Gesprochenen zu erzielen.
Verstehen von Unterhaltungen
Unterhaltungen führen das weiter, was bereits beim Verstehen von natürlicher Sprache genannt wurde. Unterhalten sich zwei Menschen miteinander, verstehen sie einander auch dann, wenn bestimmte Dinge nicht ausgesprochen oder nur angedeutet werden. Dafür wird ein bestimmter semantischer und logischer Hintergrund benötigt, den eine Maschine normaleweise nicht hat.
{extravote 1}