Google füllt in einzelnen Fällen Formulare aus, wenn der Googlebot darauf stößt. Das kann zum Beispiel dazu führen, dass interne Suchergebnisseiten indexiert werden.
Wie kann es sein, dass Webseiten in den Suchergebnissen von Google erscheinen, deren Anzeige ein ausgefülltes Formular voraussetzt? Ein Beispiel dafür sind interne Suchergebnisseiten. Damit eine solche Seite aufgerufen werden kann, muss zunächst auf der betreffenden Website eine Suchanfrage gestellt werden.
Google füllt tatsächlich in Einzelfällen beim Crawlen Formulare aus. Und diese Nachricht ist alles andere als neu: Bereits im Jahr 2008 veröffentlichte Google einen Blogbeitrag, in dem dieses Vorgehen beschrieben wird. Trifft der Googlebot auf ein <form>
Element, dann kann eine kleine Anzahl von Suchanfragen für das Formular ausgewählt werden. Dabei verwendet Google für Textboxen automatisch Wörter von der betreffenden Website. Für Auswahlmenüs, Checkboxen und Radio Buttons werden bestehende Werte aus dem HTML gewählt:
"Specifically, when we encounter a
<form>
element on a high-quality site, we might choose to do a small number of queries using the form. For text boxes, our computers automatically choose words from the site that has the form; for select menus, check boxes, and radio buttons on the form, we choose from among the values of the HTML."
John Müller wies in einer Antwort auf Twitter auf diesen Blogbeitrag hin. Zuvor war er gefragt worden, wie es sein könne, dass eine größere Anzahl interner Suchergebnisseiten einer Website von Google indexiert worden sei.
Müller schrieb, dies sei normalerweise ein Problem auf Regierungsseiten mit einer schlechten internen Verlinkung:
Wer sichergehen möchte, dass Google keine interen Suchergebnisseiten und andere Seiten indexiert, die auf ausgefüllten Formularen basieren, sollte die entsprechenden Seiten auf "noindex" setzen.