SEO-News

CrawlerEin Bug im robots.txt Testing-Tool von Google kann gefährliche Auswirkungen haben, nämlich dann, wenn man auf Basis des Testergebnisses falsche Regeln definiert. Betroffen sind URLs, die prozentkodierte Zeichen enthalten.

Per robots.txt lässt sich der Zugriff auf bestimmte Seiten, Dokumente und Verzeichnisse auf einem Server für Crawler sperren. Auch wenn sich nicht alle Crawler daran halten, so respektiert Google diese Anweisungen jedoch.

Fehlerhafte Anweisungen in der robots.txt können aber gravierende Auswirkungen haben. So kann es geschehen, dass man aus Versehen komplette Pfade, Kategorien oder sogar die gesamte Webseite sperrt mit dem Ergebnis, dass diese nicht mehr gecrawlt wird.

Zur Kontrolle der robots.txt bietet Google ein eigenes Tool an, das über die Google Search Console aufgerufen werden kann. Ganz fehlerfrei arbeitet das Tool jedoch nicht: Im Umgang mit URLs, die prozenkodierte Zeichen enthalten, kann es zu Problemen kommen. Eine solche Kodierung empfiehlt Google für Zeichen, die nicht im 7-Bit-ASCII-Zeichensatz enthalten sind.

In einem Blogbeitrag schreibt Giuseppe Pastore über die Probleme des robots.txt Testing-Tools mit solchen prozentkodierten Zeichen. Als Beispiel nennt er einen Fall, in dem alle URLs blockiert werden sollen, die das "<"-Zeichen ("kleiner als") enthalten. Dieses Zeichen lässt sich entsprechend kodieren. Der resultierende Eintrag in der robots.txt wäre dann:

Disallow: /*%3c

Testet man dies im robots.txt Tool, wird jedoch weiterhin bescheinigt, dass der Zugriff erlaubt sei:

Robots.txt Testing Tool: Problem mit prozentkodierten URLs

 

Das Problem dabei ist: Wenn man auf Basis des Tools annimmt, eine URL sei weiterhin nicht blockiert und die Regel zum Blockieren verallgemeinert, kann dies unter Umständen zum Blockieren von Seiten führen, die eigentlich für die Crawler verfügbar sein sollen.

Johannes Müller von Google empfiehlt auf Twitter zur Absicherung die Funktion "Abruf wie durch Google" in der Search Console. Dieses gibt Auskunft darüber, ob eine URL gesperrt ist oder nicht:

 

Johannes Müller

 

Man sollte sich also bei URLs mit prozentkodierten Zeichen niemals auf die Aussage des robots.txt Testing-Tools verlassen, sondern stets auch weitere Prüfungen vornehmen.

 

Titelbild © AKS - Fotolia.com

 


Christian Kunz

Von Christian Kunz+Mehr Infos hier.





Anzeige von Clixado

Artikelveröffentlichungen auf starken Magazinen und Blogs

Wir kooperieren mit unzähligen Verlagen und Bloggern und können daher auf über 4000 Blogs zu fast allen Themengebieten Artikelplätze anbieten:

    - Nachhaltiger Linkaufbau, kein SEO-Netzwerk
    - Hohe Sichtbarkeitswerte, keine expired Domains
    - Einmalzahlung, keine Vertragsbindung

Für jede Artikelveröffentlichung erstellen wir hochwertigen Content mit mindestens 400 Wörtern und publizieren den Artikel mit einem DoFollow-Bachlink zu deiner Seite auf einem Magazin oder Blog deiner Wahl.

Frag uns unverbindlich nach Beispielen





 

 

 

SEO-Checkliste

SEO-Checkliste

 

Anzeigen












SEO-Beratung

Suchmaschinenoptimierung und SEO-Beratung für Karlsruhe, Baden und die Pfalz

 

06340/351-943

 

info(at)seo-suedwest.de

SEO-Wissenstest

SEO-Wissenstest

SEO selber machen

SEO selber machen

Bekannt aus

Website Boosting


Internet World Business

SEO United


The SEM Post


Webselling

Sprecher auf

Auszeichnungen

iBusiness Top-100-Liste SEO-Dienstleister

SEO Südwest: Platz 5 bei den SEO-Wahlen 2014 zum besten deutschen SEO-Blog

 

SEO-united.de Tipp 12/15

SEO Südwest English website

Jetzt vernetzen

SEO-Glossar

SEO-Glossar

 

SEO-Kalender 2018

SEO-Kalender 2018

 

Onsite-Optimierung

Onsite-Optimierung

 

SEO- und Suchmaschinenblogs

SEO-Tipps und SEO-Tricks

IMAGE 'Noindex' oder robots.txt - wann ist welches Instrument das richtige?
Freitag, 09. Februar 2018
Um zu steuern, welche Seiten von Google und anderen Suchmaschinen gecrawlt und indexiert werden... Weiterlesen...
IMAGE Lighthouse: ein Top-Tool für die Performancemessung von Webseiten und PWAs
Montag, 16. Oktober 2017
Lighthouse ist ein Tool, mit dem man die Performance und die Nutzerfreundlichkeit von Progressive... Weiterlesen...
IMAGE Tipp: Reddit für den Aufbau von Backlinks nutzen
Samstag, 17. Januar 2015
Die Social-News-Plattform Reddit erlaubt den Aufbau von guten Backlinks - wenn man sich an... Weiterlesen...

News aus dem Blog

IMAGE Vielen Dank für die Glückwünsche, Google!
Dienstag, 07. November 2017
Google hat mich mit einem persönlichen Geburtstags-Doodle überrascht. Vielen Dank dafür! Weiterlesen...
IMAGE SEO: Können 'Ausverkauft'-Seiten in Online-Shops positive Rankingeffekte haben?
Sonntag, 01. Februar 2015
Wie geht Google eigentlich mit Seiten aus Online-Shops um, die nicht mehr lieferbare Produkte... Weiterlesen...
IMAGE Bloggen in der Sauregurkenzeit: Auffallen leicht gemacht
Dienstag, 02. Januar 2018
Beim Bloggen kommt es auf das richtige Timing an. Wer den richtigen Zeitpunkt für die... Weiterlesen...

 Eine Auswahl zufriedener Kunden

Rebel - Bad Küche Raum
Schöne Haare Karlsruhe
kr3m
feel-perfect.eu - Die Nährstoffexperten border=
Flintec IT GmbH
ESM Academy
Ringladen

Verbinden und Informationen zu SEO Südwest

Impressum und Datenschutz

Social Networks und RSS-Feed

Cookies erleichtern die Bereitstellung unserer Dienste. Mit der Nutzung unserer Dienste erklären Sie sich damit einverstanden, dass wir Cookies verwenden.
Weitere Informationen