Begriff | Definition |
---|---|
Hyperlink-Induced Topic Search (HITS) | Bei der Hyperlink-Induced Topic Search (kurz HITS) handelt es sich um einen Algorithmus zur Bewertung von Webseiten. Er wurde von Jon Kleinberg von der Cornell Universität entwickelt. Bei HITS kommt das Konzept von Hubs und Authorities zum Einsatz. Dabei sind Hubs solche Webseiten, die auf viele andere Webseiten mit einer hohen Autorität verlinken. Authorities sind wiederum solche Seiten, die von vielen Hubs verlinkt sind. Für jede Webseite werden jeweils zwei Werte bestimmt: Der Hub Score und der Authority Score. Das Besondere an HITS ist, dass diese Scores jeweils auf Basis einer vorliegenden Suchanfrage berechnet werden. Das unterscheidet HITS vom PageRank. Dazu kommt, dass die Scores bei HITS online berechnet werden, während der PageRank offline bestimmt wird. Bei einer Suchanfrage wird nun zunächst ein so genanntes Root Set an Webseiten bestimmt, die inhaltlich relevant sind. Dieses Root Set wird erweitert um zusätzliche Webseiten, die auf die Seiten im Root Set verlinken oder von diesen verlinkt werden. Das Ergebnis ist das so genannte Base Set. Anhand der Linkstrukturen innerhalb des Base Sets werden dann für jede vorhandene Webseite Hub- und Authority-Score bestimmt. Die Berechnung erfolgt iterativ in mehreren Schleifen.
Zur Kritik an HITSEin großer Vorteil von HITS ist sicherlich, dass die Bewertung der Webseiten die jeweilige Suchanfrage mit einbezieht. Somit ergibt sich zunächst ein Vorteil gegenüber dem PageRank, der themenunabhängig bestimmt wird. Allerdings erfordert die Berücksichtigung der Suchanfragen auch eine Berechnung zum Zeitpunkt der Suchabfrage (online), was zu Performance-Problemen und längeren Antwortzeiten führen kann. Die Online-Berechnung setzt außerdem Grenzen beim Kreis der einzubeziehenden Webseiten. So wird es nicht möglich sein, alle oder auch nur annähernd alle Dokumente aus einem großen Index einzubeziehen, wie sie zum Beispiel bei großen Suchmaschinen vorliegen. Es wird also immer nur ein recht kleiner Kreis von Dokumenten betrachtet. Die Qualität der Ergebnisse hängt zudem von den zu Beginn festgelegten Webseiten aus, also dem Root Set und dem erweiterten Kreis des Base Sets. HITS ist recht anfällig gegen Manipulationen. Diese sind zum Beispiel durch eine starke interne Verlinkung einer Webseite oder durch das Hosten einer Webseite auf mehreren Servern möglich. Trotz dieser Kritik wurde HITS bereits erfolgreich auch von großen Suchmaschinen eingesetzt. Dazu gehören Teoma und Ask Jeeves, heute Ask.com. Auch Twitter nutzt einen Algorithmus auf HITS-Basis. Dieser wird verwendet, um Nutzerprofile vorzuschlagen, denen man folgen soll. |
Wir bringen gemeinsam Ihre Webseite in Google nach vorne. Profitieren Sie von jahrelanger SEO-Erfahrung.