Passage RetrievalWer SEO betreibt, muss sich mit den technischen Grundlagen von Suchmaschinen auskennen. Getreu diesem Motto gibt es ab jetzt auf SEO Südwest eine neue Serie, die sich mit dem Thema Information Retrieval beschäftigt.

 

Die Rückgewinnung von Dokumenten, die für bestimmte Suchanfragen relevant sind, stellt trotz aller Neuerungen noch immer einen Kernbereich aller Suchmaschinen dar. Wer erfolgreiche Suchmaschinenoptimierung betreiben will, benötigt Grundkenntnisse auf diesem Gebiet.

SEO ist zwar keine Wissenschaft. SEO kann aber nur gelingen, wenn bekannt ist, wie sich bestimmte Handlungen auswirken. Dazu muss bekannt sein, welche Faktoren des Ranking beeinflussen. Neben externen Faktoren wie vor allem der Verlinkung von Dokumenten sind vor allem die Eigenschaften der Dokumente oder Werbseiten selbst von Bedeutung, denn diese entscheiden darüber, welche Relevanz die Suchmaschinen den Dokumenten beimessen. Die zugehörige - wissenschaftliche - Disziplin ist das Information Retrieval. Dessen Aufgabe ist die computergestützte Rückgewinnung von Ergebnissen, die für bestimmte Suchanfragen relevant sind.

Die neue Serie zum Information Retrieval auf SEO Südwest soll dazu dienen, die Grundlagen der Rückgewinnung von Dokumenten zu verstehen. Ein Beispiel ist der schon vielfach diskutierte TFIDF-Ansatz, mit dem die Termfrequenz im Verhältnis zur Häufigkeit der Terme beschrieben wird. Neben diesem werden weitere Algorithmen zur Relevanzbewertung wie etwa die Bootstrap Vector Machine, die Query Word Density oder das Mixture of Language Model vorgestellt.

Der erste Beitrag der neuen Serie widmet sich dem Passage Retrieval. Damit lassen sich für eine Suchanfrage relevante Teile von Dokumenten extrahieren. Dieser Ansatz kann zum Beispiel bei der Erzeugung von Suche-Snippets zur Anwendung kommen. Es wird beschrieben, wie Dokumente in geeignete Passagen zerlegt werden und die Relevanz dieser Passagen bewertet werden kann.

Weitere Beiträge zum Information Retrieval werden in Kürze folgen.

 


Christian Kunz

Von Christian Kunz

SEO-Experte.
Sie benötigen Beratung für Ihre Webseite? Klicken Sie hier


Anzeige

SEO-Vergleich


Verwandte Beiträge

Googles Suche-Algorithmen arbeiten nicht für alle Sprachen gleich. Das liegt zum Beispiel daran, dass das Sortieren von Wörtern je nach Sprache sehr unterschiedlich funktioniert.

Google hat den Prozess des Ausspielens und des Rankings von Suchergebnissen detailliert erklärt. Dabei wird deutlich, wie viele Schritte zwischen der Eingabe der Suchanfrage und der fertigen...

Lange Zeit wurden Stoppwörter von den Suchmaschinen nicht beachtet. Inzwischen haben sich die Möglichkeiten zur Spracherkennung aber deutlich verbessert. Was bedeutet das für den...

{extravote 1}