SEO-News

SuchmaschinenbotGoogle ruft die robots.txt nicht bei jedem Crawl ab, sondern nutzt auch eine im Cache abgelegte Version der Datei. Das passiert etwa einmal pro Tag.


 Anzeige

Google crawlt nur solche URLs, auf die der Zugriff per robots.txt nicht gesperrt ist. Um das zu prüfen, muss Google die robots.txt abrufen. Das passiert aber nicht vor jedem Crawl von URLs. Google legt die robots.txt nämlich in seinem Cache ab und aktualisiert sie immer wieder - etwa einmal pro Tag, manchmal auch häufiger oder auch seltener. Die robots.txt wird also dann abgerufen, wenn die Version im Cache aktualisiert wird und nicht, wenn eine bestimmte URL gecrawlt werden soll. Das erklärte John Müller auf Twitter:

"We cache robots.txt, so we'd re-check it when we update the cache, not when we have a specific URL to crawl. Usually that's around once/day (but can be higher/lower depending on the site)."

 

Google ruft robots.txt nicht bei jedem Crawl ab

 

Zuletzt hatte Google wieder darauf hingewiesen, dass die Nicht-Verfügbarkeit der robots.txt dazu führen kann, dass Google eine Website nicht crawlt. Das kann dann passieren, wenn beim Abruf der robots.txt ein Fehler wie ein 403 oder ein 500er geworfen wird.

 

Titelbild: Copyright Patrick Daxenbichler - Fotolia.com

 


Christian Kunz

Von Christian Kunz

SEO-Experte.
Sie benötigen Beratung für Ihre Webseite? Klicken Sie hier


Anzeige

SEO-Vergleich


Verwandte Beiträge

Google empfiehlt, sogenannte Action URLs per robots.txt zu blockieren, um das Crawlen auf wichtige URLs zu fokussieren.

Damit Google eine Website crawlen kann, muss der Webserver die richtige HTTP-Antwort an den Googlebot senden. Ansonsten kann es zu Problemen kommen.

Google hat angekündigt, das Crawl Limiter Tool, mit dem sich die Crawl-Rate des Googlebots manuell reduzieren lässt, zum 8. Januar einzustellen.

SEO-Newsletter bestellen

Im monatlichen SEO-Newsletter erhaltet Ihr eine Übersicht der jeweils zehn wichtigsten SEO-Meldungen des Monats. Mit dem SEO-Newsletter bleibt Ihr auf dem Laufenden.
Ich bin mit den Nutzungsbedingungen einverstanden

 

Anzeige

rnkeffect

Premium-Partner (Anzeige)


Anzeigen InternetX

SEO Agentur aus Darmstadt

Better sell online

Online Solutions Group

Onsite-Optimierung

Onsite-Optimierung

 

Sprecher auf

SEO- und Suchmaschinenblogs

SEO-FAQ

Bild © FM2 - Fotolia.com

SEO selber machen

SEO selber machen

Bekannt aus

Website Boosting


Internet World Business

SEO United


The SEM Post


Webselling

Jetzt vernetzen

SEO-Glossar

SEO-Glossar

 

SEO im Ohr, der Podcast von SEO Südwest: aktuell Folge

SEO-Beratung

Wir bringen gemeinsam Ihre Webseite in Google nach vorne. Profitieren Sie von jahrelanger SEO-Erfahrung.

Social Networks und RSS-Feed

Auszeichnungen

seo19 sieger sichtbarkeit 2020 200x200px