Vektorsuche
RAGVektorsuche kodiert Texte als numerische Vektoren und findet inhaltlich ähnliche Dokumente auch dann, wenn keine gemeinsamen Schlüsselwörter vorhanden sind.
Was ist Vektorsuche?
Vektorsuche (auch Vector Search oder semantische Suche) nutzt Embedding-Modelle, um Texte in hochdimensionale numerische Vektoren zu übersetzen — Zahlenreihen, die die semantische Bedeutung eines Textes im Vektorraum repräsentieren. Ähnliche Bedeutungen liegen im Vektorraum nah beieinander. Eine Suchanfrage wird ebenfalls in einen Vektor umgewandelt; das System findet dann die Texte, deren Vektoren der Anfrage am ähnlichsten sind (Nearest-Neighbor-Suche).
Der entscheidende Vorteil gegenüber klassischer Schlüsselwortsuche: Semantisch verwandte Inhalte werden gefunden, auch wenn keine Wortübereinstimmungen vorliegen. „Fahrzeuginspektion” und „Auto-Hauptuntersuchung” werden als ähnlich erkannt, obwohl sie keine gemeinsamen Terme teilen.
Technische Grundlagen
Die wichtigsten Konzepte rund um Vektorsuche:
- Embeddings: Sprachmodelle (z. B. text-embedding-3-small von OpenAI oder BGE-M3) erzeugen für jeden Text einen Vektor mit typischerweise 768 bis 3072 Dimensionen.
- Approximate Nearest Neighbor (ANN): Algorithmen wie HNSW (Hierarchical Navigable Small World) ermöglichen schnelle Ähnlichkeitssuche in Millionen von Vektoren.
- Kosinus-Ähnlichkeit: Das gebräuchlichste Ähnlichkeitsmaß — misst den Winkel zwischen zwei Vektoren, unabhängig von ihrer absoluten Länge.
- Vektordatenbanken: Spezialisierte Systeme wie Qdrant, Weaviate, Milvus oder pgvector (PostgreSQL-Erweiterung) optimieren die Speicherung und Abfrage großer Vektormengen.
Vektorsuche vs. klassische Suche
Klassische Suche fragt: „Enthält das Dokument dieses Wort?” Vektorsuche fragt: „Hat dieses Dokument dieselbe Bedeutung wie die Anfrage?” Beide Ansätze ergänzen sich — deshalb kombiniert Hybrid Search beide Methoden.
Relevanz für den Mittelstand
Vektorsuche ist die technische Grundlage für alle modernen RAG-Implementierungen. Dank Open-Source-Lösungen wie Qdrant oder der pgvector-Erweiterung für PostgreSQL lässt sie sich On-Premise betreiben — relevant für Unternehmen mit strikten Datenschutzanforderungen. Der Aufbau eines eigenen Vektorindex aus internen Dokumenten ist heute mit vertretbarem Aufwand realisierbar und bildet die Basis für einen datenschutzkonformen KI-Assistenten.
← Zurück zum Glossar