Glossar · GEO

Retrieval-Augmented Generation (RAG)

Architektur, bei der ein Sprachmodell vor der Antwort gezielt externe Quellen abruft und in die Antwort integriert.

Definition

Retrieval-Augmented Generation ist eine Architektur für KI-Antwortsysteme, die ein Large Language Model mit einer Such- oder Datenbank-Komponente kombiniert. Vor der Antwort-Generierung ruft das System relevante Dokumente ab (Retrieval), übergibt sie als Kontext an das Modell und lässt die Antwort darauf gestützt formulieren (Generation). Quellen werden anschließend in der Antwort referenziert.

Warum es für Entscheider zählt

RAG ist das technische Fundament fast aller modernen KI-Antwortsysteme – von Google AI Overviews über Perplexity bis hin zu ChatGPT mit Web-Browsing. Wer verstehen will, warum eine Domain als Quelle erscheint oder nicht, muss die RAG-Logik kennen: nicht das Modell entscheidet zuerst, sondern die Retrieval-Komponente.

Einordnung

Die zwei Stufen – und warum SEO Stufe eins ist

Retrieval: Die Such-Komponente entscheidet, welche Quellen überhaupt in den Kontext kommen. Sie nutzt klassische Such-Signale, Embeddings, Authority und Aktualität – sehr ähnlich zu organischem SEO.
Generation: Das Sprachmodell formuliert die Antwort aus den abgerufenen Quellen. Hier entscheidet vor allem, wie sauber, präzise und extrahierbar der Quell-Text geschrieben ist.

Konsequenz: Wer in Stufe eins nicht abgerufen wird, kommt in Stufe zwei nicht vor – egal wie gut der eigene Inhalt geschrieben ist. Klassisches SEO bleibt die Eintrittskarte in jede RAG-basierte Antwort.

Was Inhalte RAG-freundlich macht

Atomare, in sich verständliche Absätze: Modelle extrahieren Passagen – fließende Erzählstrukturen verlieren Information.
Klare Frage-Antwort-Strukturen: FAQ-Blöcke, Definitionen, präzise H2/H3 erleichtern die Retrieval-Zuordnung.
Eigenständige Statements: Aussagen, die nicht auf vorherige Absätze referenzieren, sind besser zitierfähig.
Saubere Schema.org-Auszeichnung: Macht Inhalts-Typen für Retrieval-Systeme explizit.

Was RAG-feindlich ist

Lange Marketing-Prosa ohne extrahierbare Kernsätze.
Wichtige Information nur in Grafiken oder PDFs.
Inhalte hinter JavaScript-Rendering ohne SSR – Retrieval-Crawler scheitern.
Fehlende Autoren-Signale und Quellenangaben – geringe Vertrauenswürdigkeit für die Generation-Stufe.

RAG und die Zukunft organischer Sichtbarkeit

Mit jedem RAG-basierten Antwortsystem (Google AI Overviews, Perplexity, Copilot, Gemini, ChatGPT-Search) verlagert sich ein Teil der Sichtbarkeit von Klick zur Zitation. Sichtbarkeit in RAG-Systemen wird zur eigenen Disziplin – GEO – die klassisches SEO ergänzt, nicht ersetzt. Operative Hebel dafür im Guide „Sichtbarkeit in ChatGPT, Perplexity & AI Overviews“.

Häufige Fragen

Was ist Retrieval-Augmented Generation einfach erklärt?

Eine Architektur, in der ein KI-Modell vor der Antwort gezielt externe Quellen abruft und auf deren Basis antwortet. Das verbindet aktuelles, belegbares Wissen mit der Formulierungs-Stärke von Sprachmodellen.

Welche bekannten Systeme nutzen RAG?

Google AI Overviews, Perplexity, Microsoft Copilot, ChatGPT mit Web-Browsing und nahezu alle KI-Suchsysteme. Auch viele Enterprise-Chatbots auf Basis interner Dokumente nutzen RAG.

Warum ist RAG für SEO relevant?

Weil die Retrieval-Stufe entscheidet, welche Domains überhaupt in der Antwort vorkommen. Wer in dieser Stufe nicht ausgewählt wird, wird auch nicht zitiert – klassisches SEO bleibt die Voraussetzung für KI-Sichtbarkeit.

Wie schreibt man RAG-freundlichen Content?

Atomare, in sich verständliche Absätze, klare Frage-Antwort-Strukturen, präzise Definitionen, saubere Schema-Auszeichnung und nachvollziehbare Quellenangaben. Marketing-Prosa ohne extrahierbare Kernsätze ist für RAG kaum nutzbar.

Verwandte Begriffe

AI OverviewsPerplexityVektor-SucheEmbeddings

Verwandte Inhalte

Guide