Das SEO-Glossar enthält Fachbegriffe und Stichworte zur Suchmaschinenoptimierung, zu Suchmaschinentechnologie und zum Information Retrieval.
Begriff | Definition |
---|---|
Hallway Page | Eine Hallway Page ist eine Seite, die entweder Links zu mehreren Doorway Pages oder zu weiteren, untergeordneten Hallway Pages enthält. Der Zweck besteht darin, den Crawler der Suchmaschine so auf möglichst viele Doorway Pages zu schicken |
Hapax legomenon | Bei einem Hapax legomenon (Plural: Hapax legomena) handelt es sich um Wörter in einem Text, die nur einmalig belegt sind. Der Begriff Hapax legomenon stammt aus dem Griechischen und bedeutet so viel wie "das gesagt Werdende". Im Kontext der Suchmaschinen bezeichnet man als Hapax legomenon diejenigen Suchanfragen, die innerhalb einer betrachteten Periode nur einmal gestellt werden. Zweifach auftauchende Wörter bzw. Suchanfragen werden als Dis legomenon bezeichnet, dreifach auftauchenden Suchanfragen als Tris legomenon. |
Hashbang (#!) | Hilfsmittel zum Indexieren von AJAX-Seiten durch Crawler von Suchmaschinen. Durch die so genannte Hashbang-Notation (geschrieben: #!) zeigt ein Server an, dass er in der Lage ist, eine Transformation des Zustands einer dynamischen AJAX-Seite in URL-Parametern abzubilden. Dies ist notwendig, um einen Http-Snapshot des Zustands der Seite abzubilden, der dann von Crawler der Suchmaschinen ausgelesen und indexiert werden kann. Es findet eine Umwandlung einer so genannten Pretty-URL (die den Zustand der Seite als Hash-Parameter enthält) in eine Ugly-URL statt (diese enthält den Zustand der Seite als URL-Parameter). Die Notwendigkeit der Umwandlung in URL-Parameter ist gegeben, weil Hash-Parameter nicht in einem Http-Request übergeben werden. Siehe dazu auch die sehr gute Google-Dokumentation. |
Hilltop-Algorithmus | Als Hilltop wird ein Algorithmus bezeichnet, mit dem die Relevanz von Dokumenten im Hinblick auf bestimmte Schlüsselbegriffe (Keywords) ermittelt wird. Das Verfahren läuft in zwei Schritten ab: 1.) Ermittlung so genannter Expertenseiten. Das sind Seiten, die auf eine große Zahl unabhängiger Dokumente verweisen 2.) Ermittlung so genannter Autoritätsseiten. Das sind Seiten, die Verweise von mindestens zwei unabhängigen Expertenseiten besitzen. |
Hit | Die Anzahl der Hits entspricht der Anzahl der Zugriffe auf Dateien auf einem Webserver unabhängig von der Dateiart. |
htaccess | Konfigurationsdatei für den Apache-Webserver. In dieser Datei werden die Zugriffsrechte für das Verzeichnis festgelegt, in dem sich die Datei befindet. So können beispielsweise Passwortschutz oder Umleitungen für Webseiten per Eintrag in der .htaccess festgelegt werden. Eine sehr gute und ausführliche Beschreibung gibt es bei SELFHTML. |
Hyperlink-Induced Topic Search (HITS) | Bei der Hyperlink-Induced Topic Search (kurz HITS) handelt es sich um einen Algorithmus zur Bewertung von Webseiten. Er wurde von Jon Kleinberg von der Cornell Universität entwickelt. Bei HITS kommt das Konzept von Hubs und Authorities zum Einsatz. Dabei sind Hubs solche Webseiten, die auf viele andere Webseiten mit einer hohen Autorität verlinken. Authorities sind wiederum solche Seiten, die von vielen Hubs verlinkt sind. Für jede Webseite werden jeweils zwei Werte bestimmt: Der Hub Score und der Authority Score. Das Besondere an HITS ist, dass diese Scores jeweils auf Basis einer vorliegenden Suchanfrage berechnet werden. Das unterscheidet HITS vom PageRank. Dazu kommt, dass die Scores bei HITS online berechnet werden, während der PageRank offline bestimmt wird. Bei einer Suchanfrage wird nun zunächst ein so genanntes Root Set an Webseiten bestimmt, die inhaltlich relevant sind. Dieses Root Set wird erweitert um zusätzliche Webseiten, die auf die Seiten im Root Set verlinken oder von diesen verlinkt werden. Das Ergebnis ist das so genannte Base Set. Anhand der Linkstrukturen innerhalb des Base Sets werden dann für jede vorhandene Webseite Hub- und Authority-Score bestimmt. Die Berechnung erfolgt iterativ in mehreren Schleifen.
Zur Kritik an HITSEin großer Vorteil von HITS ist sicherlich, dass die Bewertung der Webseiten die jeweilige Suchanfrage mit einbezieht. Somit ergibt sich zunächst ein Vorteil gegenüber dem PageRank, der themenunabhängig bestimmt wird. Allerdings erfordert die Berücksichtigung der Suchanfragen auch eine Berechnung zum Zeitpunkt der Suchabfrage (online), was zu Performance-Problemen und längeren Antwortzeiten führen kann. Die Online-Berechnung setzt außerdem Grenzen beim Kreis der einzubeziehenden Webseiten. So wird es nicht möglich sein, alle oder auch nur annähernd alle Dokumente aus einem großen Index einzubeziehen, wie sie zum Beispiel bei großen Suchmaschinen vorliegen. Es wird also immer nur ein recht kleiner Kreis von Dokumenten betrachtet. Die Qualität der Ergebnisse hängt zudem von den zu Beginn festgelegten Webseiten aus, also dem Root Set und dem erweiterten Kreis des Base Sets. HITS ist recht anfällig gegen Manipulationen. Diese sind zum Beispiel durch eine starke interne Verlinkung einer Webseite oder durch das Hosten einer Webseite auf mehreren Servern möglich. Trotz dieser Kritik wurde HITS bereits erfolgreich auch von großen Suchmaschinen eingesetzt. Dazu gehören Teoma und Ask Jeeves, heute Ask.com. Auch Twitter nutzt einen Algorithmus auf HITS-Basis. Dieser wird verwendet, um Nutzerprofile vorzuschlagen, denen man folgen soll. |
Wir bringen gemeinsam Ihre Webseite in Google nach vorne. Profitieren Sie von jahrelanger SEO-Erfahrung.