ACM SIGIR 2026: Neue Realität der Websuche

Seiteninhalt

TL;DR

KI-Antworten und klassische Google-Treffer nutzen kaum noch dieselben Quellen

SE Ranking kommt in einer deutschen AI-Mode-Studie zu dem Ergebnis, dass viele AI-Mode-Links aus den organischen Top 10 oder Top 20 stammen. Dort heißt es sinngemäß: Der AI-Mode-SERP-Bereich sehe nicht nur aus wie klassische Suchergebnisse, sondern nutze auch dieselben Quellen.

Eine andere empirische Studie mit 11.500 echten Nutzeranfragen zeichnet jedoch ein deutlich anderes Bild: Klassische Google-Suche, AI Overviews und Gemini greifen nur begrenzt auf dieselben Quellen zurück. Für SEO heißt das: Ein gutes Ranking beweist nicht mehr automatisch, dass eine Website auch in KI-Antworten sichtbar ist.

Wenn du heute etwas googelst, suchst du nicht mehr in einer einzigen Welt – sondern in zwei. Über den klassischen Treffern thront immer öfter eine KI-Zusammenfassung, die ihre Antwort aus ganz anderen Ecken des Netzes zieht. Eine aktuelle Untersuchung mit 11.500 echten Suchanfragen liefert jetzt die Zahlen zu einem Verdacht, den viele in der SEO-Szene längst hatten: Die KI-Suche und die klassische Suche schöpfen aus fast komplett getrennten Quellentöpfen.

Die Studie trägt den Titel „How Generative AI Disrupts Search: An Empirical Study of Google Search, Gemini, and AI Overviews“ (veröffentlicht für die ACM SIGIR Konferenz 2026). Hier geht’s zu den Quellen:

Die Erkenntnis aus der Arbeit wirft eine unbequeme Frage auf: Wenn die klassischen Top-10-Treffer und die neuen KI-Overviews zwar nebeneinander stehen, aber kaum noch dieselbe Basis teilen – worauf verlässt du dich dann eigentlich?

Die nackten Zahlen

Fangen wir mit dem Offensichtlichen an: KI ist in der Suche längst ein Fundament. Bei rund 51,5 % der untersuchten Anfragen wurde eine KI-Overview erzeugt und prominent über die organischen Ergebnisse gesetzt. Das heißt im Klartext: Bei jeder zweiten Suche ändert sich die komplette Hierarchie auf dem Bildschirm. Spannend ist aber nicht die Häufigkeit, sondern wie weit die beiden Systeme inhaltlich auseinanderdriften.

Der Jaccard-Wert: ein Maß für die Kluft

Um überhaupt messen zu können, wie weit klassische Suche, Google AI Overviews und Gemini auseinanderliegen, brauchten die Forscher eine harte Zahl statt eines Bauchgefühls. Ihre Wahl fiel auf den Jaccard-Koeffizienten – ein Maß, das im Grunde nur eine simple Frage beantwortet: Von allen Quellen, die irgendeines der Systeme nennt – wie viele tauchen in beiden auf?

➡️ Die Rechnung dahinter ist erfrischend unkompliziert: Du nimmst die gemeinsamen Quellen (die Schnittmenge) und teilst sie durch alle Quellen zusammengenommen (die Vereinigung). Ein kurzes Zahlenbeispiel macht’s greifbar: Liefert dir die klassische Suche zehn Quellen und die KI ebenfalls zehn, aber nur zwei davon sind identisch, dann landest du bei 2 geteilt durch 18 – also rund 0,11. Zwei von achtzehn beteiligten Seiten überschneiden sich, der Rest läuft komplett getrennt.

Genau in dieser Größenordnung bewegt sich das Studienergebnis: Die durchschnittliche Überschneidung lag bei unter 0,2. Damit du eine Vorstellung bekommst, was das bedeutet:

1,0 würde heißen: klassische Suche und KI ziehen exakt dieselben URLs heran.
0,0 wäre die totale Trennung: keine einzige gemeinsame Quelle.
Unter 0,2 bedeutet: Wir reden hier über zwei weitgehend voneinander isolierte Informations-Ökosysteme

Auch andere Analysen kommen auf ähnlich ernüchternde Werte – SISTRIX etwa maß für einen vergleichbaren Vergleich einen Jaccard-Index von 0,17, was bedeutet, dass nur 17 Prozent der Domains in beiden Antworten gemeinsam vorkommen. Die Trennung ist also kein Ausreißer, sondern ein stabiles Muster.

Der Beitrag von SISTRIX

Wie sich das in der Praxis anfühlt

Schau dir an, was das konkret heißt. In einer Untersuchung wurde dieselbe Alltagsfrage zwei Systemen gestellt: „Wie kann ich kostenlos online TV schauen?“ Das Ergebnis hätte kaum weiter auseinanderliegen können. Der eine Dienst verwies auf Vergleichsportale und TV-Guides wie Check24 oder Hörzu, der andere schickte die Nutzer direkt zu den Sendern – Arte, ZDF, 3sat. Dieselbe Frage, dieselbe Sekunde, dieselbe Absicht – und trotzdem zwei völlig verschiedene Antwort-Welten. Die eine schickt dich zum Mittelsmann, die andere zur Quelle.

Stell dir zwei Zeitungsredakteure vor, die an derselben Nachricht arbeiten, nur telefoniert jeder ausschließlich mit ihren eigenen Informanten. Ungefähr so weit liegen die beiden Welten im der Web-Suche auseinander – nur dass du als Nutzer gar nicht merkst, in welcher du gerade gelandet bist.

Warum laufen die Quellen so weit auseinander?

Eine Erklärung dafür liegt in in der Bauweise der Systeme.

Google: Synthese statt Verweis.
Die klassische Google-Suche ist darauf getrimmt, die *autoritärste* Seite zu einem Keyword zu finden – oft große Verlage, Wikipedia, etablierte Marken. Ein Sprachmodell sucht etwas anderes: gut verwertbares Wissen. Ein kleiner, spitzer Blogbeitrag, der genau deine Frage präzise beantwortet, ist für die KI oft wertvoller als eine riesige Corporate-Website – selbst wenn die ein viel höheres Domain-Rating hat.
KI: Andere Technik unter der Haube.
Gemini als eigenständiges Modell und die in die Suche integrierten AI Overviews arbeiten mit eigenen Index- und Abruf-Mechanismen (Stichwort Retrieval-Augmented Generation, kurz RAG). Sie bewerten, was für eine direkte Antwort „nützlich“ ist, völlig anders als der gute alte PageRank.

Welche Konsequenzen ergeben sich daraus?

Machtverhältnisse im Netz werden neu verteilt.

1. Das SEO-Modell wackelt

Bisher war die Ansage klar: Komm bei Google in die Top 3, dann kriegst du Traffic. Aber wenn bei der Hälfte aller Suchen eine KI über den Links sitzt – und ihre Fakten von Seiten holt, die im klassischen Ranking vielleicht auf Platz 15 oder 40 dümpeln –, dann bricht dieses Modell auseinander.
Sichtbarkeit ist plötzlich zweigeteilt: Du kannst im organischen Ranking dominieren und in den AI Overviews trotzdem komplett unsichtbar sein. Oder genau andersrum.

2. Filterblasen 2.0

Wenn der Algorithmus, der dir Links vorschlägt, und der Algorithmus, der dir Antworten formuliert, aus verschiedenen Töpfen schöpfen, dann stellt sich eine Vertrauensfrage: Welche Quelle ist „richtiger“? Die, die Google seit Jahren als autoritär einstuft – oder die, die das Sprachmodell für seinen Satz ausgewählt hat? Je nachdem, ob du klickst oder dir antworten lässt, landest du bei unterschiedlichen Urhebern und unterschiedlichen Erzählungen. Eine schleichende Fragmentierung dessen, was wir für gesichert halten.

Fazit: Willkommen in der Ära der doppelten Optimierung

An die Stelle der Suchmaschine, wie wir sie seit 20 Jahren kennen, tritt eine doppelte Informations-Architektur – mit zwei Logiken, die sich kaum überschneiden. Für dich als Publisher, Unternehmen oder SEO-Stratege heißt das: Es reicht nicht mehr, nur die Spielregeln des klassischen Google-Index zu erfüllen. Du musst zusätzlich verstehen, wie eine KI Wissen *synthetisiert* und auswählt. Denn wenn sich die Quellen zu weniger als 20 Prozent überschneiden, spielst du ohne eigene KI-Strategie bald nur noch auf dem halben Feld.

Um den theoretischen Ansatz der doppelten Optimierung in die Praxis umzusetzen, braucht es eine klare Verteilung von Ressourcen, eine Neudefinition bestehender Tools und das richtige Zusatz-Instrumentarium für GEO (Generative Engine Optimization).

1. Ressourcenallokation & Zeitmanagement

Ein fataler Fehler wäre es, das klassische SEO komplett über Bord zu werfen. LLMs und AI Overviews (AIO) ziehen ihre Daten zu einem riesigen Teil aus dem bestehenden Web-Index. Die Faustformel für die Ressourcenverteilung sieht daher wie folgt aus:

Ressourcenverteilung
Säule	Zeitaufwand	Kernfokus
Klassisches SEO (Säule 1)	60 %	Technische Hygiene, Core Web Vitals, Aufbau thematischer Autorität (Topical Authority) und Erstellung von Tiefen-Inhalten.
GEO / KI-Optimierung (Säule 2)	30 %	Umstrukturierung von Inhalten auf „Citation-First“-Formate, Optimierung von Entitäten (JSON-LD) und Prompt-Mapping.
Distribution & Brand Footprint	10 %	Signale außerhalb der eigenen Website stärken (Präsenz auf Plattformen wie Reddit, YouTube oder LinkedIn), da KI-Modelle diese als „Ground Truth“ (Nutzer-Validierung) heranziehen.

Wie du deine Aufwände einteilen könntest:

Der „Citation-First“-Umbau:
Nutze die 30 % GEO-Zeit vor allem dafür, bestehende Top-Seiten anzupassen. LLMs extrahieren bevorzugt Inhalte, die im Text ganz oben stehen. Das bedeutet: Bringe die konkrete Antwort auf die Core-Frage in den ersten 60 Wörtern unter (als prägnanten Absatztupel), bevor du in die Tiefe gehst.
Technisches Daten-Splicing:
➡️ Verwende Zeit darauf, deine JSON-LD-Strukturen (insbesondere Article, FAQ und Organization mit sameAs-Verknüpfungen) absolut lückenlos zu halten, damit KI-Crawler Entitäten fehlerfrei matchen können.

2. Die Rolle der Google Search Console (GSC)

Die Google Search Console bleibt das wichtigste Fundament, allerdings verschiebt sich die Interpretation der Metriken fundamental. Durch das aktuelle GSC AI Configuration Rollout fließen nun auch die Daten aus den KI-gestützten Suchoberflächen und AI Overviews direkt in den Leistungsbericht ein.

Die neue Metrik-Interpretation:

➡️ Wenn deine Inhalte in den AI Overviews als Quelle zitiert werden, steigen deine Impressionen massiv an, während die Klickrate (CTR) für rein informative Anfragen oft sinkt. Nutzer konsumieren die Antwort direkt in der Suche.
Das Umdenken bei Conversions:Lass dich von sinkenden Klickraten bei Informations-Suchbegriffen nicht täuschen. Die Daten zeigen, dass Nutzer, die trotz eines KI-Berichts noch auf deine Seite klicken, eine weitaus höhere Conversion-Absicht mitbringen. GSC dient hier zur Identifikation von „High-Intent-Keywords“.
Filterung nutzen:Nutze die neuen Segmentierungs-Filter im Leistungsbericht, um gezielt zu analysieren, welche Suchanfragen klassische Klicks generieren und wo du primär als KI-Synthese-Quelle (KI-Impressions) auftauchst.

3. Tool-Empfehlungen für die KI-Ära

Um die Sichtbarkeit innerhalb von Large Language Models (ChatGPT, Perplexity, Claude, Gemini) messbar zu machen, reichen klassische Rank-Tracker nicht mehr aus. Du bräuchtest Tools, die LLM-Citations und das sogenannte „Share of Voice“ in generativen Antworten tracken.

Für reines GEO-Tracking und Sichtbarkeit:

Profound / SE Visible:Diese Tools sind darauf spezialisiert, Tausende von Prompts durch echte UI-Interaktionen (nicht nur APIs) zu jagen. Sie zeigen dir exakt, wie oft deine Marke oder deine Domain in den Antworten von ChatGPT, Claude oder Perplexity als Quelle genannt wird und wie die Tonalität (Sentiment) ausfällt.
ZipTie / BrightEdge Generative Parser:Hervorragend geeignet, um die Anatomie von Google AI Overviews zu dekonstruieren. Sie tracken, ab wann ein AIO ausgespielt wird, welche Quellen herangezogen werden und wo Content-Lücken (Content Gaps) zwischen dir und den zitierten Mitbewerbern existieren.

Für semantische Optimierung und Entitäten:

Ahrefs (Brand Radar / Entity Tracking):Entwickelt sich stark in Richtung Entitäten-Mapping. Es hilft dir zu verstehen, wie gering die semantische Distanz zwischen deiner Brand und bestimmten Fachthemen im Knowledge Graph ist.
Surfer SEO:Nach wie vor die Benchmark, um Texte semantisch so dicht zu optimieren (über NLP-Begriffe), dass sowohl Google-Algorithmen als auch LLMs den Text als qualitativ hochwertig und strukturiert genug für eine Synthese erachten.