Zero-Shot Classification

Klassifikation

Klassifikation ohne Training auf den Zielkategorien. Modell versteht Kategorien aus Beschreibung.

Was ist Zero-Shot Classification?

Zero-Shot Classification ist die Fähigkeit eines KI-Modells, Texte in Kategorien einzuordnen, für die es nie explizit trainiert wurde. Anstatt dem Modell Tausende gelabelte Beispiele pro Kategorie zu zeigen, beschreibt man einfach die gewünschten Kategorien in natürlicher Sprache, und das Modell ordnet neue Texte diesen Kategorien zu. Beispielsweise kann ein Modell Kundenbewertungen als „Produktqualität", „Lieferung", „Kundenservice" oder „Preis-Leistung" klassifizieren, ohne je mit solchen Labels trainiert worden zu sein.

Wie funktioniert Zero-Shot Classification?

Zero-Shot Classification nutzt das umfangreiche Sprachverständnis, das ein Modell während des Pre-Trainings erworben hat. Technisch gibt es verschiedene Ansätze: Bei Natural Language Inference (NLI)-basierten Modellen wie BART-MNLI wird die Klassifikation als Textfolgerungsaufgabe formuliert. Das Modell prüft für jede mögliche Kategorie, ob der Eingabetext die Hypothese „Dieser Text handelt von [Kategorie]" stützt.

Bei großen Sprachmodellen (LLMs) wird die Klassifikation über den Prompt gelöst: „Ordne folgenden Text einer der Kategorien zu: [Liste]. Text: [Eingabe]". Das Modell kann dies dank seines breiten Weltwissens, ohne je ein spezifisches Klassifikationstraining durchlaufen zu haben. Die Genauigkeit hängt davon ab, wie gut die Kategoriebeschreibungen formuliert sind und wie komplex die Abgrenzung zwischen den Kategorien ist. Für einfache Kategorien erreicht Zero-Shot oft 80-90% Genauigkeit, bei feingliedrigen Unterscheidungen kann sie deutlich niedriger liegen.

Warum ist Zero-Shot Classification wichtig?

Für Unternehmen ist Zero-Shot Classification ein enormer Zeitsparer. Traditionelle Klassifikationssysteme erfordern das Sammeln und Labeln von Hunderten bis Tausenden Beispielen pro Kategorie, was Wochen dauern kann. Mit Zero-Shot kann ein funktionierendes System innerhalb von Minuten aufgesetzt werden. Das eignet sich besonders für Prototypen, sich häufig ändernde Kategorien oder Szenarien, in denen nur wenige Beispieldaten vorhanden sind. Bei steigenden Qualitätsanforderungen kann man dann auf Few-Shot oder vollständig trainierte Modelle umsteigen.

Zero-Shot Classification

Was ist Zero-Shot Classification?

Wie funktioniert Zero-Shot Classification?

Warum ist Zero-Shot Classification wichtig?

Verwandte Begriffe