Nur wenn das 'lastmod'-Attribut für die einzelnen URLs in einer XML-Sitemap in einer vernünftigen Weise genutzt wird, kann Google etwas damit anfangen und das Crawlen entsprechend priorisieren.
Neben den URLs ist das Aktualisierungsdatum unter 'lastmod' die einzige Information in XML-Sitemaps, die Google verwendet. Damit lässt sich angeben, wann eine Seite zuletzt aktualisiert wurde. Auf diese Weise kann Google erkennen, welche Inhalte neu hinzugekommen sind und welche angepasst wurden.
Das kann Google zur Steuerung des Crawlens verwenden. Damit das funktioniert, sollte das 'lastmod'-Datum aber dem tatsächlichen Aktualisierungsdatum entsprechen, wie Johannes Müller im Webmaster im Webmaster-Hangout vom 7. Februar erklärte. Es bringe nichts, das Datum für alle URLs auf den aktuellen Tag zu setzen. Müller riet außerdem dazu, 'lastmod' für alle URLs in einer Sitemap anzugeben. Durch das Bereitstellen des richtigen Aktualisierungsdatums kann Google dann entscheiden, welche URLs beim Crawlen bevorzugt werden. Diese Empfehlung gilt im übrigen laut Müller für alle Arten von XML-Sitemaps, also zum Beispiel auch für News-Sitemaps.
Zusätzlich kann man außerdem durch das Setzen der Attribute datePublished und dateModified im HTML-Code Angaben zum Erstellungs- und Aktualisierungsdatum machen, die Google ebenfalls nutzen kann.
Titelbild: Copyright Wellnhofer Designs - Fotolia.com