Annotation

Labeling

Das manuelle Markieren von Trainingsdaten, z.B. Texte als "positiv/negativ" labeln. Grundlage für überwachtes Lernen.

Annotation: Daten zum Sprechen bringen

Annotation (Labeling) versieht Rohdaten mit Labels, damit ein Modell daraus lernen kann. Ohne annotierte Daten kein überwachtes Lernen.

Beispiele

  • Bilder: "Katze", "Hund", "Auto"
  • E-Mails: "Spam" / "Nicht-Spam"
  • Texte: Sentiment, Entitäten, Kategorien

Qualität ist entscheidend

"Garbage In, Garbage Out" – falsche oder inkonsistente Labels führen zu schlechten Modellen. Professionelle Annotation erfordert oft Domain-Experten.

LLMs als Annotatoren

LLMs können bei der Annotation helfen ("LLM-as-a-Judge"). Das spart Kosten, aber Vorsicht: Das Modell kann eigene Verzerrungen übertragen.

← Zurück zum Glossar