Wie verhält sich Google, wenn eine Seite auf "noindex" gesetzt wurde und gleichzeitig einen Canonical-Link auf eine andere Seite enthält?
Es ist zugegebenermaßen eine recht spezielle Situation, die jedoch auf jeder Webseite vorkommen kann: Eine Seite enthält einen Canonical-Link, der auf eine andere Seite zeigt, und trägt gleichzeitig das Robots-Attribut "noindex".
Welches Signal ergibt sich dadurch für Google? Diese Frage war Gegenstand eines aktuellen Webmaster-Hangouts. Und die Antwort auf diese Frage ist nicht eindeutig.
Johannes Müller führt aus, dass Google aufgrund des Canonicals beide Seiten als identisch behandelt. Das "noindex"-Attribut weist Google an, die Seite, welche das Attribut trägt, aus dem Index zu entfernen. Theoretisch könnte dann Google unter der Vorgabe, beide Seiten als identisch zu behandeln, auch die andere Seite aus dem Index entfernen.
Tatsächlich aber wird Google laut Müller in solchen Fällen von einem Fehler ausgehen und die Canonical-Anweisung ignorieren.
Das Ergebnis ist dann das gleiche wie im Fall, dass nur das Canonical oder nur ein "nofollow" gesetzt wäre: Lediglich eine Seite wird im Index bleiben.
Grundsätzlich werden hier zwei verschiedene Themen in einen Topf geworfen: Ein Canonical-Link dient der Vermeidung von Duplicate Content, indem er bei identischen Inhalten, die unter mehreren URLs erreichbar sind, diejenige URL benennt, die indexiert werden soll.
Die Robots-Attribute "noindex" oder "index" zeigen an, ob eine Seite bzw. URL indexiert werden soll oder nicht. Auch damit kann man Duplicate Content vermeiden: Dazu müssen alle verschiedenen URLs, unter denen eine bestimmte Seite erreichbar ist, bis auf die zu indexierende URL auf "noindex" gesetzt werden.
Einne Vermischung dieser beiden Ansätze führt zu Verwirrung. Das zeigt das folgende Video:
Titelbild © mvoisey - Fotolia.com