
Analyse: Zahl von KI-generierten Artikeln übertrifft von Menschen verfasste Inhalte

Eine aktuelle Untersuchung zeigt, dass im November 2024 erstmals mehr KI-Artikel als von Menschen geschriebene Artikel veröffentlicht wurden.
Das Wachstum der KI-Artikel stieg laut einer Untersuchung von Five Percent mit der Einführung von ChatGPT im November 2022 deutlich an. Nach nur zwölf Monaten machten KI-generierte Artikel bereits 39 Prozent der veröffentlichten Artikel aus.
Der Anteil der KI-generierten Artikel blieb in den letzten zwölf Monaten relativ stabil. Das kann verschiedene Ursachen haben. Ein möglicher Grund ist die Erkenntnis, dass rein KI-basierte Inhalte zumindest in einigen Fällen nicht die erhoffte Leistung und Qualität erbringen.
Methodik der Untersuchung
Als primäre Datenquelle diente Common Crawl, ein großes, öffentlich zugängliches Webarchiv. Es wurden zufällig 65.000 URLs ausgewählt, um eine repräsentative Stichprobe englischsprachiger Artikel zu erhalten. Die Rohdaten stehen als Google Doc zur Verfügung.
Jeder ausgewählte Artikel musste außerdem über ein Artikel-Schema-Markup verfügen, mindestens 100 Wörter umfassen und zwischen Januar 2020 und Mai 2025 veröffentlicht worden sein. Zudem erfolgte eine Klassifizierung als Artikel oder Listicle durch den Graphite Page Type Classifier.
Für die KI-Erkennung wurde ein Algorithmus verwendet, bei dem Blöcke von 500 Wörtern mit Surfers AI Detector klassifiziert wurden. Ein Artikel wurde als KI-generiert eingestuft, wenn der Algorithmus vorhersagte, dass mehr als 50 Prozent des Inhalts KI-generiert waren.
Die Genauigkeit und die Zuverlässigkeit solcher Erkennungsmethoden sind zu hinterfragen. Die sichere Einordnung eines Textes als KI-generiert oder nicht KI-generiert ist nur selten möglich. Mit der zunehmenden Verbesserung der LLMs wird eine solche Einstufung zusätzlich erschwert.
Einschränkungen der Analyse
Die Untersuchung bewertete nicht die Verbreitung von KI-generierten und anschließend von Menschen bearbeiteten Artikeln. Es ist wahrscheinlich, dass das KI-generierte und danach von Menschen überarbeitete Beiträge noch deutlich häufiger anzutreffen sind als rein per KI erzeugte Inhalte.
SEO-Newsletter bestellen
Verwandte Beiträge


Google: Watermarking und Erkennen von KI-Texten per SynthID jetzt als Open Source verfügbar
