Annotation
LabelingDas manuelle Markieren von Trainingsdaten, z.B. Texte als "positiv/negativ" labeln. Grundlage für überwachtes Lernen.
Annotation: Daten zum Sprechen bringen
Annotation (Labeling) versieht Rohdaten mit Labels, damit ein Modell daraus lernen kann. Ohne annotierte Daten kein überwachtes Lernen.
Beispiele
- Bilder: "Katze", "Hund", "Auto"
- E-Mails: "Spam" / "Nicht-Spam"
- Texte: Sentiment, Entitäten, Kategorien
Qualität ist entscheidend
"Garbage In, Garbage Out" – falsche oder inkonsistente Labels führen zu schlechten Modellen. Professionelle Annotation erfordert oft Domain-Experten.
LLMs als Annotatoren
LLMs können bei der Annotation helfen ("LLM-as-a-Judge"). Das spart Kosten, aber Vorsicht: Das Modell kann eigene Verzerrungen übertragen.