Pipeline

Architektur

Verkettung mehrerer Verarbeitungsschritte: Daten laden → Vorverarbeiten → Modell → Nachverarbeiten → Ausgabe.

Was ist eine Pipeline?

Eine Pipeline im KI-Kontext ist eine strukturierte Abfolge von Verarbeitungsschritten, die Daten von der Eingabe bis zur fertigen Ausgabe durchlaufen. Jeder Schritt übernimmt eine definierte Aufgabe und reicht sein Ergebnis an den nächsten Schritt weiter. Eine typische KI-Pipeline umfasst: Daten laden, Vorverarbeitung (Bereinigung, Normalisierung), Modellvorhersage, Nachverarbeitung und Ausgabe. Das Konzept stammt aus der Softwareentwicklung und beschreibt die Modularisierung komplexer Abläufe in handhabbare Einzelschritte.

Wie funktioniert eine Pipeline?

KI-Pipelines lassen sich in zwei Hauptkategorien unterteilen. Training-Pipelines bereiten Daten auf, trainieren Modelle und evaluieren die Ergebnisse. Sie umfassen typischerweise Schritte wie Datensammlung, Datenbereinigung, Feature Engineering, Modelltraining, Validierung und Modellexport. Inference-Pipelines verarbeiten neue Eingaben im Produktivbetrieb: Sie nehmen Rohdaten entgegen, bereiten sie auf, führen die Modellvorhersage durch und formatieren die Ausgabe.

Moderne KI-Anwendungen bestehen oft aus mehreren verketteten Modellen und Verarbeitungsschritten. Eine RAG-Pipeline (Retrieval-Augmented Generation) beispielsweise besteht aus: Eingabe tokenisieren, relevante Dokumente aus einer Vektordatenbank abrufen, Kontext zusammenstellen, Sprachmodell aufrufen und Antwort nachverarbeiten. Frameworks wie LangChain oder Hugging Face Pipelines bieten vorgefertigte Bausteine für solche Verkettungen.

Warum sind Pipelines wichtig?

Pipelines sind der Schlüssel zum professionellen KI-Betrieb. Sie sorgen für Reproduzierbarkeit (jeder Durchlauf liefert nachvollziehbare Ergebnisse), Wartbarkeit (einzelne Schritte können unabhängig aktualisiert werden) und Skalierbarkeit (Engpässe lassen sich gezielt optimieren). Ohne strukturierte Pipelines werden KI-Projekte schnell unübersichtlich und fehleranfällig.

Für Unternehmen bedeutet eine gut entworfene Pipeline, dass KI-Lösungen zuverlässig in den Geschäftsbetrieb integriert werden können. Sie ermöglicht die Automatisierung von Datenflüssen, die Überwachung der Modellqualität und das schnelle Austauschen von Modellversionen. Die Pipeline-Architektur ist daher ein wichtiges Qualitätsmerkmal bei der Bewertung von KI-Dienstleistern.

Verwandte Begriffe

Inference · Training · RAG · MLOps · Feature Engineering

← Zurück zum Glossar