KI: Wie wichtig sind strukturierte Daten für LLMs?
Braucht es strukturierte Daten, damit KI-Systeme die Inhalte von Webseiten besser verstehen können? Die Antwort: Es kommt darauf an.
Strukturierten Daten, also Metadaten, die beschreiben, was auf einer Webseite zu sehen ist, sind eine Möglichkeit, Suchmaschinen wie Google dabei zu helfen, die Inhalte besser zu verstehen. Dabei hört man oftmals die Empfehlung, strukturierte Daten seien auch für KI und LLMs wichtig und könnten die Chance auf Erwähnungen verbessern, etwa dann, wenn man Produkte oder Unternehmen mit Schema-Daten auszeichnet. Aber ist das wirklich so?
SEO-Beratung: Wir sind Ihre Experten
Wir bringen gemeinsam Ihre Website nach vorne. Profitieren Sie von jahrelanger SEO-Erfahrung.
Ein Experiment zeigt, dass zumindest ChatGPT und Perplexity strukturierte Daten zwar lesen, aber die Daten offenbar nur wie normalen Text behandeln. Mark Williams-Cook berichtet auf LinkedIn, er habe eine Webseite mit fiktiven und fehlerhaften strukturierten Daten zu einem erfundenen Unternehmen versehen. Trotzdem lieferten die Systeme auf Anfrage die gewünschten Informationen zurück. Die Frage nach der Adresse des Unternehmens wurde richtig beantwortet - und das, obwohl die Daten nicht im sichtbaren Text der Seite enthalten waren.

Das zeigt: Die strukturierten Daten wurden gelesen, weil sie Teil des HTML-Codes sind. Die Formatierung und die Validität spielen dabei aber offensichtlich keine Rolle.
Heißt das nun, dass strukturierte Daten für KI sinnlos sind und dass es genügt, die Angaben als normalen Text in die Webseiten zu integrieren? Ganz so einfach ist es nicht, denn strukturierte Daten sind beispielsweise für Google noch immer ein wichtiges Hilfsmittel. Google selbst empfiehlt nach wie vor die Verwendung von strukturierten Daten. Dabei sollte man auch auf die Dokumentation der von Google unterstützten Typen achten.
Was OpenAI angeht, so werden laut eigenen Angaben strukturierte Daten von Drittanbietern genutzt - zum Beispiel Preise oder Produktbewertungen.
Alleine deshalb sollte man weiterhin strukturierte Daten verwenden. Dafür spricht auch, dass der Aufwand, diese einzubinden, meist recht gering ist. Und auch wenn LLMs die Validität der Daten nicht prüfen, so können sie diese zumindest lesen und für ihre Antworten verwenden.

























