Wer SEO betreibt, muss sich mit den technischen Grundlagen von Suchmaschinen auskennen. Getreu diesem Motto gibt es ab jetzt auf SEO Südwest eine neue Serie, die sich mit dem Thema Information Retrieval beschäftigt.
Die Rückgewinnung von Dokumenten, die für bestimmte Suchanfragen relevant sind, stellt trotz aller Neuerungen noch immer einen Kernbereich aller Suchmaschinen dar. Wer erfolgreiche Suchmaschinenoptimierung betreiben will, benötigt Grundkenntnisse auf diesem Gebiet.
SEO ist zwar keine Wissenschaft. SEO kann aber nur gelingen, wenn bekannt ist, wie sich bestimmte Handlungen auswirken. Dazu muss bekannt sein, welche Faktoren des Ranking beeinflussen. Neben externen Faktoren wie vor allem der Verlinkung von Dokumenten sind vor allem die Eigenschaften der Dokumente oder Werbseiten selbst von Bedeutung, denn diese entscheiden darüber, welche Relevanz die Suchmaschinen den Dokumenten beimessen. Die zugehörige - wissenschaftliche - Disziplin ist das Information Retrieval. Dessen Aufgabe ist die computergestützte Rückgewinnung von Ergebnissen, die für bestimmte Suchanfragen relevant sind.
Die neue Serie zum Information Retrieval auf SEO Südwest soll dazu dienen, die Grundlagen der Rückgewinnung von Dokumenten zu verstehen. Ein Beispiel ist der schon vielfach diskutierte TFIDF-Ansatz, mit dem die Termfrequenz im Verhältnis zur Häufigkeit der Terme beschrieben wird. Neben diesem werden weitere Algorithmen zur Relevanzbewertung wie etwa die Bootstrap Vector Machine, die Query Word Density oder das Mixture of Language Model vorgestellt.
Der erste Beitrag der neuen Serie widmet sich dem Passage Retrieval. Damit lassen sich für eine Suchanfrage relevante Teile von Dokumenten extrahieren. Dieser Ansatz kann zum Beispiel bei der Erzeugung von Suche-Snippets zur Anwendung kommen. Es wird beschrieben, wie Dokumente in geeignete Passagen zerlegt werden und die Relevanz dieser Passagen bewertet werden kann.
Weitere Beiträge zum Information Retrieval werden in Kürze folgen.
{extravote 1}