SEO-News

Künstliche Intelligenz und maschinelles LernenGoogle stellt mit SyntaxNet einen der aktuell leistungsfähigsten Sprachparsern als Open Source-Software zur Verfügung. Zusammen mit dem Parser für die englische Sprache, Parsey McParseface, lassen sich damit auch komplexe Satzkonstruktionen verstehen.

 

 

 

 

Parsey McParseface analyisert englische Texte

SyntaxNet ist ein Framework für neuronale Netze, das mit TensorFlow implementiert wurde, einer Bibliothek für maschinelles Lernen, die Google ebenfalls als Open Source anbietet. SyntaxNet bietet die Basis für ein Natural Language Understanding System (NLU). Im Paket mit Parsey McParseface, einem Parser für die englische Sprache, ist der gesamte Code enthalten, um auf Basis eigener Daten englischen Text zu analyiseren.

SyntaxNet ist ein Framework, das als syntaktischer Parser bezeichnet werden kann. Gibt man dem System einen bestimmten Satz vor, dann kennzeichnet das System jedes Wort dieses Satzes mit einem Attribut, das die Bedeutung des Wortes im Satz beschreibt. Diese Technik wird auch als part-of-speech (POS) bezeichnet. Im folgenden Satz ist das noch relativ einfach:

NLU: einfaches Beispiel

 

"Alice" ist das Subjekt, "saw" ist das Verb und "Bob" ist das Objekt. Zentraler Bestandteil des Satzes, hier als "Root" gekennzeichnet, ist das Verb. Die meisten Sätze, die in der natürlichen Sprache vorkommen, sind jedoch wesentlich komplexer, wie das folgende Beispiel zeigt:

NLU: komplexes Beispiel

 

Das Hauptproblem in solchen Fällen ist eine gewissen Ambiguität oder Unklarheit, was die Bedeutung der einzelen Satzbestandteile betrifft. Im gezeigten Beispiel sind zwei Möglichkeiten denkbar: Entweder bezieht sich der Teil "in her car" auf die Straße, was bedeuten würde, dass Alice die Straße in ihr Auto geladen hätte, oder der Satzbestandteil bezieht sich auf "drove" und beschreibt, dass Alice in ihrem Auto auf der Straße gefahren ist. Diese Unklarheit wird im Englischen auch als "prepositional phrase attachment ambiguity" bezeichnet, was so viel bedeutet wie die Unklarheit hinsichtlich Zuordnung von Präpositionen.

Für den Menschen ist es relativ schnell ersichtlich, welche Zuordnung einen Sinn ergibt und welche nicht. Computer tun sich damit aber schwer. Aus diesem Grunde behilft man sich mit der Anwendung zweier Techniken: erstens eines Neuronalen Netzes und zweitens der "Beam Search". Das Neuronale Netzwerk durchläuft die Bestandteile eines Satzes und vergibt in Fällen der Unklarheit Punkte für verschiedene Alternativen. Beam Search ist eine Technik, die auf auf heuristischen Algorithmen basiert und in einem Graphen nicht die erstbeste, sondern die vielversprechendste Variante verfolgt.

 

Erstaunliche Trefferquote

Laut Aussage von Google ist Parsey McParseface bereits sehr erfolgreich, wenn es um die korrekte Interpretation von Sätzen geht. Für wohlformatierte Texte, wie sie in der Literatur zu finden sind, liegt die Trefferquote bei etwa 94 Prozent. Geschätzt wird, dass Menschen es auf etwa 96 bis 97 Prozent bringen. Parsey McParseface erreicht hier also schon fast die Leistung eines Menschen.

Bei Texten aus dem Web, die oftmals schlechter strukturiert sind, schafft das System immerhin auch über 90 Prozent. Das sollte für eine Vielzahl von Anwendungen genügen.

 

Fazit

Es ist erstaunlich, was sich aktuell im Bereich des maschinellen Lernens und hier insbesondere auf dem Gebiet der Spracherkennung tut. Systeme wie SyntaxNet werden es in Zukunft ermöglichen, noch bessere digitale Assistenten und ähnliche Produkte auf den Markt zu bringen. Durch die Veröffentlichung des Codes wird gleichzeitig die Entwicklerbasis erweitert. Bleibt zu hoffen, dass es ähnliche Fortschritte auch für andere Sprachen wie Deutsch geben wird.

 

Titelbild © AGPhotography - Fotolia.com

 


Christian Kunz

Von Christian Kunz

SEO-Experte.
Sie benötigen Beratung für Ihre Webseite? Klicken Sie hier


Anzeige

SEO-Vergleich


 

 

 

Anzeige

rnkeffect

Premium-Partner (Anzeige)


Anzeigen

sedo

SEO Agentur aus Darmstadt

SEO-Vergleich

Online Solutions Group




Sprecher auf

Onsite-Optimierung

Onsite-Optimierung

 

SEO- und Suchmaschinenblogs

SEO-FAQ

Bild © FM2 - Fotolia.com

Bekannt aus

Website Boosting


Internet World Business

SEO United


The SEM Post


Webselling

SEO selber machen

SEO selber machen

Jetzt vernetzen

SEO-Glossar

SEO-Glossar

 

SEO im Ohr, der Podcast von SEO Südwest: aktuell Folge

SEO-Beratung

Wir bringen gemeinsam Ihre Webseite in Google nach vorne. Profitieren Sie von jahrelanger SEO-Erfahrung.

Social Networks und RSS-Feed

Auszeichnungen

seo19 sieger sichtbarkeit 2020 200x200px