BotsWenn es beim Abruf der robots.txt einer Website dauerhaft zu Serverfehlern kommt, kann dies das Crawlen durch Google beeinträchtigen.

Google prüft vor dem Crawlen einer Website deren robots.txt. Darin sind Informationen darüber enthalten, welche URLs und Verzeichnisse von den Crawlern der Suchmaschinen abgerufen werden dürfen und welche nicht.

Kommt es beim Abruf der robots.txt aber zu Problemen, kann dies das Crawlen der Website beeinträchtigen. Google kann das Crawlen sogar komplett einstellen und beim Andauern der Probleme die Website aus dem Index entfernen.

Dies war auch Thema auf der gestrigen Google Webmaster Conference. Darin wurde genauer erklärt, wie genau sich die verschiedenen Antworten beim Abruf einer robots.txt auf das Crawlen auswirken können:

  • HTTP-Status 200: kein Problem
  • HTTP-Status 404: ebenfalls ok
  • HTTP-Status 5xx: ok, sofern nur vorübergehend.
  • HTTP-Status 5xx dauerhaft: kritisch

Es ist also nicht schlimm, wenn es keine robots.txt gibt und der Server mit einem Status 404 antwortet. Auch vorübergehende Serverfehler sind nicht dramatisch.

 

Google: Probleme mit dem Crawlen, wenn dauerhaft 500er-Fehler beim Abruf der robots.txt

 

Der letzte Fall, also dauerhafte Serverfehler beim Versuch, die robots.txt anzurufen, kann aber dazu führen, dass Google das Crawlen einstellt und eventuell sogar die URLs der betroffenen Website aus dem Index entfernt.

 


Christian Kunz

Von Christian Kunz

SEO-Experte.
Sie benötigen Beratung für Ihre Webseite? Klicken Sie hier


Anzeige

SEO-Vergleich


Verwandte Beiträge

Die Google Search Console hat einen neuen robots.txt-Report erhalten. Dafür wird der alte robots.txt-Tester eingestellt.

Per 'Google-extended' kann man nicht verhindern, dass Google Webseiten für KI-Antworten in der neuen Suche 'Google SGE' verwendet.

Die unter archive.org verfügbare Wayback Machine ermöglicht auch den Abruf alter robots.txt-Dateien. Das kann bei der nachträglichen Fehlersuche hilfreich sein.

SEO-Newsletter bestellen

Im monatlichen SEO-Newsletter erhaltet Ihr eine Übersicht der jeweils zehn wichtigsten SEO-Meldungen des Monats. Mit dem SEO-Newsletter bleibt Ihr auf dem Laufenden.
Ich bin mit den Nutzungsbedingungen einverstanden