Google Discover: Analyse zeigt, wie Inhalte ausgewählt werden
Welche Faktoren die Auswahl von Inhalten in Google Discover bestimmen könnten, zeigt eine aktuelle Analyse. Untersucht wurde die offizielle Google SDK.
Google Discover liefert täglich Inhalte an Hunderte Millionen Nutzer aus. Für viele Websites, insbesondere im Newsbereich, ist Google Discover mit Abstand die wichtigste Traffic-Quelle. Wie die Auswahl von Inhalten für Discover geschieht, ist dagegen wenig transparent. Von Google gibt es dazu nur wenige Angaben. Zum Beispiel wird empfohlen, interessante und zeitgemäße Inhalte zu erstellen. Das lässt viel Spielraum für Interpretationen.
Während viele Empfehlungen zu Discover nur auf Vermutungen beruhen, lassen sich durch die Analyse der Systeme tiefe Einblicke gewinnen.
Einen anderen Ansatz verfolgte SEO Metehan Yesilyurt. Er hat sich die offizielle Google SDK angesehen und daraus Rückschlüsse auf die Architektur von Google Discover sowie den Auswahlprozess der Inhalte gezogen.
Wie die Erkenntnisse ermittelt wurden
Die Erkenntnisse über Discover basieren nicht auf Spekulationen oder dem Reverse-Engineering von Google-Servern. Stattdessen wurden die Telemetriedaten, Namenskonventionen für Events und der clientseitige Status des offiziellen Google SDKs (Software Development Kit) während des regulären Betriebs analysiert. Das SDK ermöglicht weitreichende Rückschlüsse auf die internen Prozesse, weil es insgesamt 276 Event-Konstanten und verschiedene Telemetrie-Zähler offenlegt.
Discover Content: der 9-stufige Auswahlprozess (Pipeline)
Die Inhalts-Pipeline von Google Discover durchläuft 9 beobachtbare Stufen:
- Content Ingestion (Inhaltsaufnahme): Google crawlt Inhalte und weist erkannten Themen "Knowledge Graph MIDs" zu.
- Open Graph Tag Parsing: Das SDK liest exakt 6 spezifische Meta-Tags aus, um die Darstellung vorzubereiten.
- Content Classification (Klassifizierung): Inhalte werden in Typen (wie EVERGREEN_VIBRANT oder BREAKING_NEWS) eingeteilt und einem von 13 Clustern zugewiesen.
- Collection Gate: Eine entscheidende binäre Prüfung (isCollectionHiddenFromEmberFeed). Fällt diese negativ aus, werden sämtliche Inhalte eines Publishers sofort blockiert – noch bevor ein Ranking stattfindet.
- User Interest Matching: Die Entitäten (MIDs) des Artikels werden mit dem Interessenprofil des Nutzers abgeglichen.
- pCTR Evaluation: Ein Modell zur Vorhersage der Klickrate (predicted Click-Through Rate) bewertet den Inhalt.
- Feed Assembly (Feed-Erstellung): Der Feed wird hierarchisch zusammengebaut (MAIN_FEED → COLLECTION → CLUSTER → CARD).
- Delivery (Auslieferung): Die Inhalte erreichen das Endgerät über verschiedene Wege wie gRPC-Streaming oder Background-Syncs.
- Feedback Loop: Nutzerinteraktionen (z.B. Lesezeit oder das Ausblenden von Artikeln) fließen direkt in künftige Personalisierungen ein.
Das pCTR-Modell (Predicted Click-Through Rate)
Das pCTR-Modell berechnet die Wahrscheinlichkeit, mit der ein Nutzer auf einen Beitrag in Discover klickt. Aus den Telemetriedaten geht hervor, dass das Modell folgende konkrete Eingabedaten (Inputs) nutzt:
- Den Titeltext (direkt aus dem og:title bezogen).
- Die Bildqualität (minderwertige Bilder erhalten eine LOW_QUALITY_IMAGE Markierung).
- Die Aktualität (Freshness) des Beitrags.
- Die historische Klickrate und die Erfolgsrate beim Laden des Bildes.
Besonders wichtig: Weil historische Klicks und die Verweildauer (Feedback Loop) mit einbezogen werden, bestraft sich Clickbait selbst. Ein irreführender Titel führt anfangs zu Klicks, aber schnelle Absprünge (Bounces) reduzieren künftige pCTR-Werte drastisch.
Ausnahme für Web Stories
Google Web Stories (intern "STAMP" genannt) umgehen das klassische pCTR-Ranking und die Artikel-Pipeline vollständig. Sie verfügen über eine eigene Rendering-Umgebung (INLINE_STAMP_VIEWER_FRAGMENT), eigene Karussell-Platzierungen und eine völlig unabhängige Empfehlungs-Engine, die Folge-Storys sogar vorlädt, bevor die aktuelle Story beendet wurde.
SEO-Beratung: Wir sind Ihre Experten
Wir bringen gemeinsam Ihre Website nach vorne. Profitieren Sie von jahrelanger SEO-Erfahrung.
Die Freshness-Stufen (Aktualität)
Discover arbeitet mit einem klar definierten Alterungssystem für Artikel, das in Zeitfenster unterteilt ist, sie sogenannten Buckets:
|
Stufe / Bucket |
Zeitfenster |
Gewichtung |
|
1_TO_7_DAYS |
1–7 Tage alt |
Höchste Freshness-Gewichtung |
|
8_TO_14_DAYS |
8–14 Tage alt |
Mittlere Gewichtung |
|
15_TO_30_DAYS |
15–30 Tage alt |
Niedrige Gewichtung |
|
staleness_in_hours |
30+ Tage |
Kontinuierlicher Abbau der Relevanz (stundenbasiert) |
Anmerkung: Zwar können "Evergreen"-Inhalte weiterhin erscheinen, der Algorithmus arbeitet jedoch standardmäßig gegen ältere Inhalte.
Die Bedeutung der Open Graph (OG) Tags
Google Discover wertet exakt 6 OG-Tags aus:
- og:image (zwingend): Ohne dieses Tag wird keine Discover-Karte gerendert. Für die große "Hero"-Karte muss das Bild zudem mindestens 1200 Pixel breit sein.
- og:title (zwingend): Dient nicht nur der Anzeige, sondern füttert direkt das pCTR-Modell.
- og:site_name (empfohlen): Für die Zuordnung und Anzeige des Publishers.
- og:locale (empfohlen): Wird mit den Spracheinstellungen des Nutzers abgeglichen.
- og:image:secure_url (optional): Die HTTPS-Variante des Bildes wird bevorzugt.
- article:content_tier (empfohlen): Gibt an, ob der Inhalt kostenlos, eingeschränkt ("metered") oder hinter einer Paywall ("locked") ist.
Die 13 Cluster-Typen
Jede Karte im Discover-Feed gehört zu einem von 13 identifizierten Clustern:
- neoncluster
- geotargetingstories
- deeptrends
- deeptrendsfable
- freshvideos
- mustntmiss
- newsstoriesheadlines
- homestack
- garamondrelatedarticlegrouping
- trendingugc
- signinlure
- iospromo
- moonstone.
Die Cluster zeigen, dass das System Inhalte sehr genau kategorisiert, etwa in dringende "Must-reads" (mustntmiss) oder lokale Storys (geotargetingstories).
Personalisierung in Discover
Inhalte in Discover sind individuell auf die persönlichen Interessen und Vorlieben der einzelnen Nutzer ausgerichtet. Die Personalisierung von Discover ist komplex und besteht aus vier Schichten:
- Geller / AIP Interest Graph: Ein geräteinterner Interessens-Graph, der Themen (MIDs) und deren Relevanz speichert.
- NAIADES: Ein übergreifendes Google-System mit 18 Untertypen. Besonders spannend: Der Subtyp "WPAS" (Web Publisher Articles Signal) greift, sobald ein Publisher im Google News Publisher Center registriert ist, was dem Content eine spezielle Klassifizierung verleiht.
- Persistent State (Dauerhafter Status): Speichert Nutzerinteraktionen wie Follows, Likes oder Tombstones (dauerhaft blockierte Artikel).
- Engagement Signals: Misst Lesezeiten (Dwell time) und das generelle Engagement in einer Sitzung.
A/B-Experimente während der Nutzung
Das Nutzererlebnis bei Discover ist extrem volatil. Während einer einzigen Sitzung nimmt ein Nutzer durchschnittlich an etwa 150 serverseitigen A/B-Experimenten gleichzeitig teil. Das bedeutet, dass zwei ansonsten identische Nutzer aufgrund ihrer Experiment-Zuordnung drastisch unterschiedliche Feeds sehen können.
Zudem steuern 51 clientseitige "Feature Flags" zur Laufzeit das Layout. Außerdem nutzt Discover sogenannte "kontrafaktische Experimente". Dabei werden Artikel Testgruppen gezielt vorenthalten, oder es kommt zum sogenannten "Rug Pull": Artikel werden in den Feed gepusht, aber im Hintergrund sofort wieder entfernt, um Reaktionen zu messen.
Konkrete Empfehlungen für Publisher
Aufgrund der Erkenntnisse ergeben sich klare Empfehlungen für Publisher, mit denen sie die Chancen für eine Präsenz in Google Discover erhöhen können:
- Zwingend große Bilder nutzen: Das og:image-Tag ist Pflicht. Nutze Bilder mit einer Breite von mindestens 1200 Pixeln, um große Karten zu generieren.
- Optimiere den Titel für das Modell: og:title füttert direkt das Vorhersagemodell. Irreführende Titel senken die künftigen Ranking-Chancen durch schlechte Nutzersignale.
- Nutze den Freshness-Bonus: Konzentriere Dein Marketing und Traffic-Generierung auf die ersten sieben Tage nach Veröffentlichung, weil hier die höchste Gewichtung greift.
- Vermeide um jeden Preis Nutzersperren: Das System bestraft asymmetrisch. Klickt ein Nutzer bei einem Artikel auf "Keine Inhalte von [Publisher] anzeigen", blockiert die Collection-Ebene ab sofort alle Inhalte auf diesem Gerät, bevor das Ranking überhaupt beginnt.
- Setze auf Web Stories: Weil sie das hart umkämpfte pCTR-Ranking umgehen, bieten Web Stories eine hervorragende alternative Möglichkeit, Sichtbarkeit in Discover zu schaffen.
FAQs
Was passiert, wenn ich kein og:image-Tag in meinem Artikel habe?
Ohne ein valides og:image-Tag wird Google Discover definitiv keine Karte für diesen Artikel in den Feed rendern.
Wie lange profitiert mein Artikel von Freshness in Discover?
Dein Inhalt hat in den ersten 1 bis 7 Tagen die höchste "reshness-Gewichtung und damit die besten Chancen. Zwischen Tag 8 und 14 ist die Gewichtung mittel, und ab 30 Tagen verfällt die Aktualität kontinuierlich im Stundentakt.
Konkurrieren Web Stories direkt mit normalen Artikeln im Discover-Feed?
Nein. Web Stories umgehen das pCTR-Standardranking komplett. Sie besitzen eine isolierte Empfehlungs-Engine und werden separat, oft in Karussells, platziert.
Kann ein einziger schlechter Artikel meiner gesamten Domain schaden?
Ja. Discover nutzt ein asymmetrisches Filter-System auf "Collection-Ebene". Wenn Nutzer aufgrund eines irreführenden Artikels angeben, dass sie keine Inhalte mehr von einer Quelle sehen wollen, wird die gesamte Domain für diese Nutzer dauerhaft und vorab geblockt.
Was ist ein "Tombstone" in der Personalisierungs-Schicht?
Ein Tombstone (Grabstein) ist eine dauerhafte Blockade. Wenn ein Nutzer Inhalte explizit im Feed ausblendet (dismissed), wird ein permanenter Datensatz angelegt, der verhindert, dass dieser Inhalt jemals wieder im Feed dieses Nutzers auftaucht.

























