Googles Algorithmen sind in der Lage, interne Suchergebnisseiten von gecrawlten Webseiten zu erkennen und aus dem Index zu entfernen. Die sogenannte Site Search ist ein wichtiger Bestandteil der Navigation vieler Webseiten, doch Google möchte deren Ergebnisse nicht im Index haben.
Suchergebnisseiten (SERPs), die von der internen Suche auf gecrwalten Webseiten erzeugt werden, können für die Besucher dieser Webseiten sehr hilfreich sein, etwa dann, wenn die gewünschte Seite oder ein bestimmtes Produkt nicht oder nur umständlich über das Menü erreichbar ist.
Allerdings möchte Google die SERPs, die von solchen Site Searches erzeugt werden, nicht im Index haben. Man spricht in einem solchen Fall auch von "SERP in SERP", was bedeutet, dass ein Nutzer, der auf ein Google-Ergebnis klickt, auf einer weiteren Suchergebnisseite landet.
Leere SERPs und Belastung des Crawl-Budgets
Im ungünstigsten Fall kann es geschehen, dass Google auch leere Suchergebnisseiten crawlt und indexiert, die für die Nutzer keinerlei Mehrwert besitzen.
Das Crawlen interner Suchergebnisseiten kann auch zu einer Belastung des Crawl-Budgets führen, vor allem dann, wenn dieser Vorgang zu einer Schleife führt, den den Crawle längere Zeit bindet.
Algorithmen erkennen interne SERPs - meistens
Aus diesem Grund hat Google seine Algorithmen so angepasst, dass SERPs, die von einer Site Search erzeugt werden, erkannt und gar nicht erst gecrawlt werden. Bereits indexierte Seiten dieser Art können auch wieder entfernt werden. Das hat Gary Illyes von Google kürzlich auf der SMX West mitgeteilt. Er sagte (Übersetzung Red.):
Im Allgemeinen sind solche Seiten nicht besonders hilfreich für die Nutzer. Wir verfügen über bestimmte Algorithmen, um diese loszuwerden und dafür zu sorgen, dass sie gar nicht erst gecrawlt werden, aber manchmal funktioniert das nicht. In solchen Fällen müssen wir von Hand eingreifen oder neue Regeln für diese Seiten anlegen."
Eine weitere Möglichkeit für Webseitenbetreiber, das Crawlen dieser Seiten zu verhindern, besteht in der Nutzung des Tools für URL-Parameter in der Google Search Console - falls die Suchergebnisseiten mit solchen Parametern arbeiten. Ansonsten bieten viele Content Management Systeme oder Erweiterungen die Möglichkeit, interne Suchergebnisseiten auf "noindex" zu setzen.
Titelbild © jemastock - Fotolia.com
{loadoposition newsletter}