Vektorsuche

RAG

Vektorsuche kodiert Texte als numerische Vektoren und findet inhaltlich ähnliche Dokumente auch dann, wenn keine gemeinsamen Schlüsselwörter vorhanden sind.

Zuletzt aktualisiert: Juni 2026 · Quelle: HostSpezial GmbH – ki·spezial

Was ist Vektorsuche?

Vektorsuche (auch Vector Search oder semantische Suche) nutzt Embedding-Modelle, um Texte in hochdimensionale numerische Vektoren zu übersetzen — Zahlenreihen, die die semantische Bedeutung eines Textes im Vektorraum repräsentieren. Ähnliche Bedeutungen liegen im Vektorraum nah beieinander. Eine Suchanfrage wird ebenfalls in einen Vektor umgewandelt; das System findet dann die Texte, deren Vektoren der Anfrage am ähnlichsten sind (Nearest-Neighbor-Suche).

Der entscheidende Vorteil gegenüber klassischer Schlüsselwortsuche: Semantisch verwandte Inhalte werden gefunden, auch wenn keine Wortübereinstimmungen vorliegen. „Fahrzeuginspektion” und „Auto-Hauptuntersuchung” werden als ähnlich erkannt, obwohl sie keine gemeinsamen Terme teilen.

Technische Grundlagen

Die wichtigsten Konzepte rund um Vektorsuche:

  • Embeddings: Sprachmodelle (z. B. text-embedding-3-small von OpenAI oder BGE-M3) erzeugen für jeden Text einen Vektor mit typischerweise 768 bis 3072 Dimensionen.
  • Approximate Nearest Neighbor (ANN): Algorithmen wie HNSW (Hierarchical Navigable Small World) ermöglichen schnelle Ähnlichkeitssuche in Millionen von Vektoren.
  • Kosinus-Ähnlichkeit: Das gebräuchlichste Ähnlichkeitsmaß — misst den Winkel zwischen zwei Vektoren, unabhängig von ihrer absoluten Länge.
  • Vektordatenbanken: Spezialisierte Systeme wie Qdrant, Weaviate, Milvus oder pgvector (PostgreSQL-Erweiterung) optimieren die Speicherung und Abfrage großer Vektormengen.

Vektorsuche vs. klassische Suche

Klassische Suche fragt: „Enthält das Dokument dieses Wort?” Vektorsuche fragt: „Hat dieses Dokument dieselbe Bedeutung wie die Anfrage?” Beide Ansätze ergänzen sich — deshalb kombiniert Hybrid Search beide Methoden.

Relevanz für den Mittelstand

Vektorsuche ist die technische Grundlage für alle modernen RAG-Implementierungen. Dank Open-Source-Lösungen wie Qdrant oder der pgvector-Erweiterung für PostgreSQL lässt sie sich On-Premise betreiben — relevant für Unternehmen mit strikten Datenschutzanforderungen. Der Aufbau eines eigenen Vektorindex aus internen Dokumenten ist heute mit vertretbarem Aufwand realisierbar und bildet die Basis für einen datenschutzkonformen KI-Assistenten.

← Zurück zum Glossar