Retrieval
RAGRetrieval ist der Kernmechanismus in RAG-Systemen: das gezielte Abrufen relevanter Dokumente oder Passagen aus einer Wissensbasis als Grundlage für KI-Antworten.
Was ist Retrieval?
Retrieval (englisch für „Abruf”) beschreibt im Kontext von KI-Systemen den Prozess, aus einer strukturierten oder unstrukturierten Wissensbasis diejenigen Informationseinheiten zu finden, die für eine gegebene Anfrage am relevantesten sind. Dieser Schritt steht bei RAG-Systemen (Retrieval-Augmented Generation) am Anfang der Pipeline: Erst wird relevantes Wissen abgerufen, dann von einem Sprachmodell zu einer Antwort verarbeitet.
Im Unterschied zur klassischen Datenbankabfrage operiert modernes Retrieval nicht nur auf exakten Begriffen, sondern kann semantische Ähnlichkeit berücksichtigen — ein Dokument über „Heizungssteuerung” wird auch für die Anfrage „Temperaturregelung Anlage” gefunden, selbst wenn das Wort „Heizung” nicht in der Anfrage steht.
Retrieval-Methoden im Überblick
Die wichtigsten Retrieval-Ansätze unterscheiden sich in Technik und Einsatzgebiet:
- Sparse Retrieval (BM25, TF-IDF): Klassische Volltextsuche auf Basis von Worthäufigkeiten — schnell, gut bei Fachbegriffen und exakten Treffern.
- Dense Retrieval (Vektorsearch): Dokumente und Anfragen werden als Vektoren kodiert; Suche nach semantischer Nähe im Vektorraum.
- Hybrid Retrieval: Kombination beider Methoden für robuste Treffer bei verschiedenen Fragetypen.
- Reranking: Nachgelagerte Neubewertung initialer Treffer durch ein Cross-Encoder-Modell für höhere Präzision.
- Recursive / Multi-Hop Retrieval: Mehrere aufeinanderfolgende Retrieval-Schritte, bei denen jedes Ergebnis neue Suchanfragen informiert.
Retrieval-Qualität entscheidet
Kein noch so gutes Sprachmodell kann korrekte Antworten liefern, wenn das Retrieval falsche oder irrelevante Dokumente zurückgibt. Die Qualität des Retrieval-Schritts ist der wichtigste Hebel für die Gesamtleistung eines RAG-Systems.
Relevanz für den Mittelstand
Wer einen KI-Assistenten auf Basis unternehmenseigener Dokumente aufbaut, sollte dem Retrieval-Design mindestens so viel Aufmerksamkeit widmen wie der Wahl des Sprachmodells. Fehlerhaftes Retrieval — etwa weil Chunks zu groß sind oder Metadaten fehlen — ist die häufigste Ursache für halluzinierte oder ungenaue Antworten. Gezieltes Testen der Retrieval-Qualität mit realen Nutzeranfragen ist ein unverzichtbarer Schritt vor dem Produktiveinsatz.
← Zurück zum Glossar