SEO-News

Künstliche Intelligenz und maschinelles LernenGoogle stellt mit SyntaxNet einen der aktuell leistungsfähigsten Sprachparsern als Open Source-Software zur Verfügung. Zusammen mit dem Parser für die englische Sprache, Parsey McParseface, lassen sich damit auch komplexe Satzkonstruktionen verstehen.

 

 

 

 

Parsey McParseface analyisert englische Texte

SyntaxNet ist ein Framework für neuronale Netze, das mit TensorFlow implementiert wurde, einer Bibliothek für maschinelles Lernen, die Google ebenfalls als Open Source anbietet. SyntaxNet bietet die Basis für ein Natural Language Understanding System (NLU). Im Paket mit Parsey McParseface, einem Parser für die englische Sprache, ist der gesamte Code enthalten, um auf Basis eigener Daten englischen Text zu analyiseren.

SyntaxNet ist ein Framework, das als syntaktischer Parser bezeichnet werden kann. Gibt man dem System einen bestimmten Satz vor, dann kennzeichnet das System jedes Wort dieses Satzes mit einem Attribut, das die Bedeutung des Wortes im Satz beschreibt. Diese Technik wird auch als part-of-speech (POS) bezeichnet. Im folgenden Satz ist das noch relativ einfach:

NLU: einfaches Beispiel

 

"Alice" ist das Subjekt, "saw" ist das Verb und "Bob" ist das Objekt. Zentraler Bestandteil des Satzes, hier als "Root" gekennzeichnet, ist das Verb. Die meisten Sätze, die in der natürlichen Sprache vorkommen, sind jedoch wesentlich komplexer, wie das folgende Beispiel zeigt:

NLU: komplexes Beispiel

 

Das Hauptproblem in solchen Fällen ist eine gewissen Ambiguität oder Unklarheit, was die Bedeutung der einzelen Satzbestandteile betrifft. Im gezeigten Beispiel sind zwei Möglichkeiten denkbar: Entweder bezieht sich der Teil "in her car" auf die Straße, was bedeuten würde, dass Alice die Straße in ihr Auto geladen hätte, oder der Satzbestandteil bezieht sich auf "drove" und beschreibt, dass Alice in ihrem Auto auf der Straße gefahren ist. Diese Unklarheit wird im Englischen auch als "prepositional phrase attachment ambiguity" bezeichnet, was so viel bedeutet wie die Unklarheit hinsichtlich Zuordnung von Präpositionen.

Für den Menschen ist es relativ schnell ersichtlich, welche Zuordnung einen Sinn ergibt und welche nicht. Computer tun sich damit aber schwer. Aus diesem Grunde behilft man sich mit der Anwendung zweier Techniken: erstens eines Neuronalen Netzes und zweitens der "Beam Search". Das Neuronale Netzwerk durchläuft die Bestandteile eines Satzes und vergibt in Fällen der Unklarheit Punkte für verschiedene Alternativen. Beam Search ist eine Technik, die auf auf heuristischen Algorithmen basiert und in einem Graphen nicht die erstbeste, sondern die vielversprechendste Variante verfolgt.

 

Erstaunliche Trefferquote

Laut Aussage von Google ist Parsey McParseface bereits sehr erfolgreich, wenn es um die korrekte Interpretation von Sätzen geht. Für wohlformatierte Texte, wie sie in der Literatur zu finden sind, liegt die Trefferquote bei etwa 94 Prozent. Geschätzt wird, dass Menschen es auf etwa 96 bis 97 Prozent bringen. Parsey McParseface erreicht hier also schon fast die Leistung eines Menschen.

Bei Texten aus dem Web, die oftmals schlechter strukturiert sind, schafft das System immerhin auch über 90 Prozent. Das sollte für eine Vielzahl von Anwendungen genügen.

 

Fazit

Es ist erstaunlich, was sich aktuell im Bereich des maschinellen Lernens und hier insbesondere auf dem Gebiet der Spracherkennung tut. Systeme wie SyntaxNet werden es in Zukunft ermöglichen, noch bessere digitale Assistenten und ähnliche Produkte auf den Markt zu bringen. Durch die Veröffentlichung des Codes wird gleichzeitig die Entwicklerbasis erweitert. Bleibt zu hoffen, dass es ähnliche Fortschritte auch für andere Sprachen wie Deutsch geben wird.

 

Titelbild © AGPhotography - Fotolia.com

 


Christian Kunz

Von Christian Kunz

SEO-Experte. Sie benötigen Beratung für Ihre Webseite? Klicken Sie hier.



Anzeige von Clixado

Artikelveröffentlichungen auf starken Magazinen und Blogs

Wir kooperieren mit unzähligen Verlagen und Bloggern und können daher auf über 4000 Blogs zu fast allen Themengebieten Artikelplätze anbieten:

    - Nachhaltiger Linkaufbau, kein SEO-Netzwerk
    - Hohe Sichtbarkeitswerte, keine expired Domains
    - Einmalzahlung, keine Vertragsbindung

Für jede Artikelveröffentlichung erstellen wir hochwertigen Content mit mindestens 400 Wörtern und publizieren den Artikel mit einem DoFollow-Bachlink zu deiner Seite auf einem Magazin oder Blog deiner Wahl.

Frag uns unverbindlich nach Beispielen





 

 

 

SEO-Checkliste

SEO-Checkliste

 

Anzeigen












SEO-Beratung

Suchmaschinenoptimierung und SEO-Beratung für Karlsruhe, Baden und die Pfalz

 

06340/351-943

 

info(at)seo-suedwest.de

SEO-Schulung 2019

SEO-Schulung

Ganztägige Schulung "SEO-Grundlagen". Jetzt anmelden

Jetzt vernetzen

SEO-Glossar

SEO-Glossar

 

SEO-Kalender 2018

SEO-Kalender 2018

 

Onsite-Optimierung

Onsite-Optimierung

 

SEO- und Suchmaschinenblogs

Bekannt aus

Website Boosting


Internet World Business

SEO United


The SEM Post


Webselling

SEO selber machen

SEO selber machen

Sprecher auf

Auszeichnungen

iBusiness Top-100-Liste SEO-Dienstleister

SEO Südwest: Platz 5 bei den SEO-Wahlen 2014 zum besten deutschen SEO-Blog

 

SEO-united.de Tipp 12/15

SEO-Tipps und SEO-Tricks

IMAGE 'Noindex' oder robots.txt - wann ist welches Instrument das richtige?
Freitag, 09. Februar 2018
Um zu steuern, welche Seiten von Google und anderen Suchmaschinen gecrawlt und indexiert werden... Weiterlesen...
IMAGE Lighthouse: ein Top-Tool für die Performancemessung von Webseiten und PWAs
Montag, 16. Oktober 2017
Lighthouse ist ein Tool, mit dem man die Performance und die Nutzerfreundlichkeit von Progressive... Weiterlesen...
IMAGE Tipp: Reddit für den Aufbau von Backlinks nutzen
Samstag, 17. Januar 2015
Die Social-News-Plattform Reddit erlaubt den Aufbau von guten Backlinks - wenn man sich an... Weiterlesen...

News aus dem Blog

IMAGE Vielen Dank für die Glückwünsche, Google!
Dienstag, 07. November 2017
Google hat mich mit einem persönlichen Geburtstags-Doodle überrascht. Vielen Dank dafür! Weiterlesen...
IMAGE Google Webmaster Hangout: A visit at the Google Zurich office
Donnerstag, 05. Juli 2018
I was invited to Google Zurich to take part in a new episode of the Webmaster Office Hangout. I was... Weiterlesen...
IMAGE AMP - Is GDPR-compliant usage possible?
Sonntag, 29. April 2018
The AMP framework was established to speed up mobile websites. Normally, AMP pages are served via... Weiterlesen...

 Eine Auswahl zufriedener Kunden

Rebel - Bad Küche Raum
Schöne Haare Karlsruhe
kr3m
feel-perfect.eu - Die Nährstoffexperten border=
Flintec IT GmbH
ESM Academy
Ringladen

Verbinden und Informationen zu SEO Südwest

Impressum und Datenschutz

Social Networks und RSS-Feed