SEO-News

Google-ArbeitsplatzSie gehört zu den Mythen, die sich um Google und seine Algorithmen ranken: die Latent Semantische Indexierung (LSI). Kommt diese Technik tatsächlich zum Einsatz, oder wird sie zumindest in Teilen genutzt?

Latent Semantische Indexierung (LSI) ist ein Begriff aus dem Bereich des Information Retrievals. LSI gab es schon lange vor Google. Vereinfacht gesagt nutzt LSI Mustererkennung in Texten, um Dokumente zu identifzieren, die sich mit ähnlichen Themen beschäftigen. Das funktioniert auch, wenn in den Dokumenten unterschiedliche Begriffe verwendet werden. So könnten per LSI zum Beispiel zwei Texte als verwandt identifiziert werden, wenn im einen Text von "Bank" und im anderen Text von "Geldinstitut" die Rede ist. Das ist möglich, indem erkannt wird, dass beide Texte begriffsähnliche Wörter und Textmuster nutzen.

Das Verlockende an LSI ist, dass viele SEOs vermuten, daraus eine Optimierungsstrategie ableiten zu können. Bei der Latent Sematischen Optimierung (LSO), die das Gegenstück zur LSI bildet, geht es folgerichtig darum, Texte auf bestimmte Themen zu trimmen. Dazu wird auf Synonyme und andere Begriffe gesetzt, die in einem engen Sinnzusammenhang zum verfolgten Thema stehen.

Aber nutzt Google LSI tatsächlich? Beweise oder offizielle Bestätigungen dazu gibt es nicht. Darauf weist auch Bill Slawski in einem aktuellen Beitrag auf SEO by the Sea hin. LSI wurde unter anderem von Susan Dumais geprägt und in ihrer Arbeit "Indexing by Latent Semantic Analysis" (PDF) beschrieben. Sie wirkte außerdem an einem Patent mit, das der Bell Communication Research Ende der 80er-Jahre gewährt wurde - Titel: "Computer information retrieval using latent semantic structure". In der Zusammenfassung des Patents steht:

"A methodology for retrieving textual data objects is disclosed. The information is treated in the statistical domain by presuming that there is an underlying, latent semantic structure in the usage of words in the data objects. Estimates to this latent structure are utilized to represent and retrieve objects. A user query is recouched in the new statistical domain and then processed in the computer system to extract the underlying meaning to respond to the query."

Damit sollte die Problematik behandelt werden, die sich den Suchmaschinen damals durch die Vieldeutigkeit der menschlichen Sprache stellte. Synonyme, die unterschiedliche Bedeutung einzelner Begriffe (Homonyme) und die Unklarheit im Ausdruck insgesamt führten damals oft zu mangelhaften Suchergebnissen. Diese Probleme sollten durch das Schaffen eines "semantischen Raums " behandelt werden, indem der Bezug zwischen Worten, dem Text und Objekten als statistische Aufgabe betrachtet wurde.

 

Google: RankBrain als eine Art von LSI

Auch wenn über die genaue Funktionsweise von Googles RankBrain-Algorithmus wenig bekannt ist, so gibt es zumindest einige Informationen, die darauf hindeuten, dass es eine Verwandtschaft mit LSI geben könnte. RankBrain wird von Google genutzt, um Suchanfragen der Nutzer zu interpretieren und thematisch zuzuordnen. Noch immer ist ein großer Anteil der täglich von Google beantworteten Suchanfragen neu - von 15 Prozent ist die Rede. Die thematische Zuordnung dieser Suchanfragen stellt somit eine große Herausforderung dar.

RankBrain soll Worte und Phrasen in sogenannte Termvektoren umrechnen. Dabei bildet jedes Wort einer Suchanfrage eine Dimension im Vektorraum. Durch den Vergleich des Vektors einer neuen Suchanfrage mit den Vektoren bereits bekannter Suchanfragen kann herausgefunden werden, zu welchen Suchanfragen eine besonders große Ähnlichkeit besteht. Damit sind Rückschlüsse auf die Bedeutung der neuen Suchanfrage nöglich.

 

Suchanfrage: Termvektoren

 

Weil für die Bestimmung der Ähnlichkeit der Kosinus zwischen den Termvektoren genutzt wird, nennt man diese Technik auch Cosine Similarity.

 

Nutzt Google jetzt LSI oder nicht?

Ein klares Ja oder Nein auf diese Frage kann nicht gegeben werden. Die Wahrscheinlichkeit ist aber hoch, denn Google ist inzwischen sehr gut dazu in der Lage, themenrelevante Ergebnisse zu liefern - auch dann, wenn der eigentlich gesuchte Begriff im Dokument gar nicht vorkommt.

Lohnt es sich also, LSO zu betreiben und auf Synonyme zu setzen? Die Empfehlung kann hier nur lauten, sich beim Schreiben von Texten nicht nur auf Keywords, sondern auch auf Themen zu konzentrieren. Wer ein Thema umfassend und in der Tiefe behandelt, wird automatisch so schreiben, dass durch die verwendeten Begriffe und die eingesetzten Textmuster eine bestimmte Prägung erfolgt, die dann hoffentllich von Google und anderen Suchmaschinen richtig zugeordnet werden.

 

Titelbild: Google

 


Christian Kunz

Von Christian Kunz

SEO-Experte. Sie benötigen Beratung für Ihre Webseite? Klicken Sie hier.



Anzeige von Clixado

Artikelveröffentlichungen auf starken Magazinen und Blogs

Wir kooperieren mit unzähligen Verlagen und Bloggern und können daher auf über 4000 Blogs zu fast allen Themengebieten Artikelplätze anbieten:

    - Nachhaltiger Linkaufbau, kein SEO-Netzwerk
    - Hohe Sichtbarkeitswerte, keine expired Domains
    - Einmalzahlung, keine Vertragsbindung

Für jede Artikelveröffentlichung erstellen wir hochwertigen Content mit mindestens 400 Wörtern und publizieren den Artikel mit einem DoFollow-Bachlink zu deiner Seite auf einem Magazin oder Blog deiner Wahl.

Frag uns unverbindlich nach Beispielen





SEO-Newsletter bestellen

Mit dem SEO-Newsletter erhältst Du einmal pro Monat eine Übersicht der wichtigsten SEO-Meldungen auf SEO Südwest sowie Ankündigungen wichtiger SEO-Veranstaltungen. Zum Abonnieren des SEO-Newsletters ist die Einwilligung in die Datenschutzhinweise erforderlich. Zum Bestellen genügt die Angabe der E-Mail-Adresse. Per Klick auf den entsprechenden Button unten kann das Abonnement jederzeit gekündigt werden.
Ich stimme den Nutzungsbedingungen zu

SEO-Checkliste

SEO-Checkliste

 

Anzeigen












SEO-Beratung

Suchmaschinenoptimierung und SEO-Beratung für Karlsruhe, Baden und die Pfalz

 

06340/351-943

 

info(at)seo-suedwest.de

SEO-Schulung 2019

SEO-Schulung

Ganztägige Schulung "SEO-Grundlagen". Jetzt anmelden

Jetzt vernetzen

SEO-Glossar

SEO-Glossar

 

SEO-Kalender 2018

SEO-Kalender 2018

 

Onsite-Optimierung

Onsite-Optimierung

 

SEO- und Suchmaschinenblogs

Bekannt aus

Website Boosting


Internet World Business

SEO United


The SEM Post


Webselling

SEO selber machen

SEO selber machen

Sprecher auf

Auszeichnungen

iBusiness Top-100-Liste SEO-Dienstleister

SEO Südwest: Platz 5 bei den SEO-Wahlen 2014 zum besten deutschen SEO-Blog

 

SEO-united.de Tipp 12/15

SEO-Tipps und SEO-Tricks

IMAGE 'Noindex' oder robots.txt - wann ist welches Instrument das richtige?
Freitag, 09. Februar 2018
Um zu steuern, welche Seiten von Google und anderen Suchmaschinen gecrawlt und indexiert werden... Weiterlesen...
IMAGE Lighthouse: ein Top-Tool für die Performancemessung von Webseiten und PWAs
Montag, 16. Oktober 2017
Lighthouse ist ein Tool, mit dem man die Performance und die Nutzerfreundlichkeit von Progressive... Weiterlesen...
IMAGE Tipp: Reddit für den Aufbau von Backlinks nutzen
Samstag, 17. Januar 2015
Die Social-News-Plattform Reddit erlaubt den Aufbau von guten Backlinks - wenn man sich an... Weiterlesen...

News aus dem Blog

IMAGE SEO: Linkbuilding gehört dazu
Donnerstag, 09. August 2018
Ohne den konstanten und nachhaltigen Aufbau hochwertiger Links bringen die besten Onpage-Maßnahmen... Weiterlesen...
IMAGE Google Webmaster Hangout: A visit at the Google Zurich office
Donnerstag, 05. Juli 2018
I was invited to Google Zurich to take part in a new episode of the Webmaster Office Hangout. I was... Weiterlesen...
IMAGE Neuer SEO-Contest: Punktesystem soll für mehr Fairness und Chancen sorgen
Montag, 30. Juli 2018
Im Rahmen eines neuen SEO-Contests kämmpfen wieder zahlreiche Publisher und Webseitenanbieter um... Weiterlesen...

 Eine Auswahl zufriedener Kunden

Rebel - Bad Küche Raum
Schöne Haare Karlsruhe
kr3m
feel-perfect.eu - Die Nährstoffexperten border=
Flintec IT GmbH
ESM Academy
Ringladen

Verbinden und Informationen zu SEO Südwest

Impressum und Datenschutz

Social Networks und RSS-Feed