SEO-News

CrawlerEin Bug im robots.txt Testing-Tool von Google kann gefährliche Auswirkungen haben, nämlich dann, wenn man auf Basis des Testergebnisses falsche Regeln definiert. Betroffen sind URLs, die prozentkodierte Zeichen enthalten.

Per robots.txt lässt sich der Zugriff auf bestimmte Seiten, Dokumente und Verzeichnisse auf einem Server für Crawler sperren. Auch wenn sich nicht alle Crawler daran halten, so respektiert Google diese Anweisungen jedoch.

Fehlerhafte Anweisungen in der robots.txt können aber gravierende Auswirkungen haben. So kann es geschehen, dass man aus Versehen komplette Pfade, Kategorien oder sogar die gesamte Webseite sperrt mit dem Ergebnis, dass diese nicht mehr gecrawlt wird.

Zur Kontrolle der robots.txt bietet Google ein eigenes Tool an, das über die Google Search Console aufgerufen werden kann. Ganz fehlerfrei arbeitet das Tool jedoch nicht: Im Umgang mit URLs, die prozenkodierte Zeichen enthalten, kann es zu Problemen kommen. Eine solche Kodierung empfiehlt Google für Zeichen, die nicht im 7-Bit-ASCII-Zeichensatz enthalten sind.

In einem Blogbeitrag schreibt Giuseppe Pastore über die Probleme des robots.txt Testing-Tools mit solchen prozentkodierten Zeichen. Als Beispiel nennt er einen Fall, in dem alle URLs blockiert werden sollen, die das "<"-Zeichen ("kleiner als") enthalten. Dieses Zeichen lässt sich entsprechend kodieren. Der resultierende Eintrag in der robots.txt wäre dann:

Disallow: /*%3c

Testet man dies im robots.txt Tool, wird jedoch weiterhin bescheinigt, dass der Zugriff erlaubt sei:

Robots.txt Testing Tool: Problem mit prozentkodierten URLs

 

Das Problem dabei ist: Wenn man auf Basis des Tools annimmt, eine URL sei weiterhin nicht blockiert und die Regel zum Blockieren verallgemeinert, kann dies unter Umständen zum Blockieren von Seiten führen, die eigentlich für die Crawler verfügbar sein sollen.

Johannes Müller von Google empfiehlt auf Twitter zur Absicherung die Funktion "Abruf wie durch Google" in der Search Console. Dieses gibt Auskunft darüber, ob eine URL gesperrt ist oder nicht:

 

Johannes Müller

 

Man sollte sich also bei URLs mit prozentkodierten Zeichen niemals auf die Aussage des robots.txt Testing-Tools verlassen, sondern stets auch weitere Prüfungen vornehmen.

 

Titelbild © AKS - Fotolia.com

 


Christian Kunz

Von Christian Kunz

SEO-Experte. Sie benötigen Beratung für Ihre Webseite? Klicken Sie hier.



Anzeige von Clixado

Artikelveröffentlichungen auf starken Magazinen und Blogs

Wir kooperieren mit unzähligen Verlagen und Bloggern und können daher auf über 4000 Blogs zu fast allen Themengebieten Artikelplätze anbieten:

    - Nachhaltiger Linkaufbau, kein SEO-Netzwerk
    - Hohe Sichtbarkeitswerte, keine expired Domains
    - Einmalzahlung, keine Vertragsbindung

Für jede Artikelveröffentlichung erstellen wir hochwertigen Content mit mindestens 400 Wörtern und publizieren den Artikel mit einem DoFollow-Bachlink zu deiner Seite auf einem Magazin oder Blog deiner Wahl.

Frag uns unverbindlich nach Beispielen





 

 

 

SEO-Checkliste

SEO-Checkliste

 

Anzeigen












SEO-Beratung

Suchmaschinenoptimierung und SEO-Beratung für Karlsruhe, Baden und die Pfalz

 

06340/351-943

 

info(at)seo-suedwest.de

SEO-Schulung 2019

SEO-Schulung

Ganztägige Schulung "SEO-Grundlagen". Jetzt anmelden

Jetzt vernetzen

SEO-Glossar

SEO-Glossar

 

SEO-Kalender 2018

SEO-Kalender 2018

 

Onsite-Optimierung

Onsite-Optimierung

 

SEO- und Suchmaschinenblogs

Bekannt aus

Website Boosting


Internet World Business

SEO United


The SEM Post


Webselling

SEO selber machen

SEO selber machen

Sprecher auf

Auszeichnungen

iBusiness Top-100-Liste SEO-Dienstleister

SEO Südwest: Platz 5 bei den SEO-Wahlen 2014 zum besten deutschen SEO-Blog

 

SEO-united.de Tipp 12/15

SEO-Tipps und SEO-Tricks

IMAGE 'Noindex' oder robots.txt - wann ist welches Instrument das richtige?
Freitag, 09. Februar 2018
Um zu steuern, welche Seiten von Google und anderen Suchmaschinen gecrawlt und indexiert werden... Weiterlesen...
IMAGE Lighthouse: ein Top-Tool für die Performancemessung von Webseiten und PWAs
Montag, 16. Oktober 2017
Lighthouse ist ein Tool, mit dem man die Performance und die Nutzerfreundlichkeit von Progressive... Weiterlesen...
IMAGE Tipp: Reddit für den Aufbau von Backlinks nutzen
Samstag, 17. Januar 2015
Die Social-News-Plattform Reddit erlaubt den Aufbau von guten Backlinks - wenn man sich an... Weiterlesen...

News aus dem Blog

IMAGE SEO: Linkbuilding gehört dazu
Donnerstag, 09. August 2018
Ohne den konstanten und nachhaltigen Aufbau hochwertiger Links bringen die besten Onpage-Maßnahmen... Weiterlesen...
IMAGE Google Webmaster Hangout: A visit at the Google Zurich office
Donnerstag, 05. Juli 2018
I was invited to Google Zurich to take part in a new episode of the Webmaster Office Hangout. I was... Weiterlesen...
IMAGE Neuer SEO-Contest: Punktesystem soll für mehr Fairness und Chancen sorgen
Montag, 30. Juli 2018
Im Rahmen eines neuen SEO-Contests kämmpfen wieder zahlreiche Publisher und Webseitenanbieter um... Weiterlesen...

 Eine Auswahl zufriedener Kunden

Rebel - Bad Küche Raum
Schöne Haare Karlsruhe
kr3m
feel-perfect.eu - Die Nährstoffexperten border=
Flintec IT GmbH
ESM Academy
Ringladen

Verbinden und Informationen zu SEO Südwest

Impressum und Datenschutz

Social Networks und RSS-Feed