Validation

Training

Pruefung der Modellqualitaet auf separatem Datensatz waehrend des Trainings.

Was ist Validation?

Validation (Validierung) ist der Prozess, bei dem die Leistung eines KI-Modells auf einem separaten Datensatz überprüft wird, der nicht zum Training verwendet wurde. Der Validation-Datensatz dient als Kontrollinstanz: Er zeigt, ob das Modell tatsächlich allgemeine Muster gelernt hat oder lediglich die Trainingsdaten auswendig kennt. In der Praxis werden die verfügbaren Daten typischerweise in drei Teile aufgeteilt: Trainingsdaten (70-80%), Validierungsdaten (10-15%) und Testdaten (10-15%).

Wie funktioniert Validation?

Während des Trainings wird das Modell nach jeder Epoche oder nach einer bestimmten Anzahl von Trainingsschritten auf dem Validation-Datensatz evaluiert. Dabei werden die gleichen Metriken gemessen wie beim Training (z.B. Accuracy, Loss, F1-Score), ohne dass die Modellgewichte angepasst werden. Der Vergleich zwischen Trainings- und Validierungsmetriken gibt Aufschluss über den Zustand des Modells.

Wenn der Trainingsfehler sinkt, aber der Validierungsfehler steigt, ist das ein klares Zeichen für Overfitting. Sind beide Fehler hoch, deutet das auf Underfitting hin. Der Validation-Datensatz wird auch genutzt, um Hyperparameter zu optimieren und den besten Trainingszeitpunkt zu bestimmen (Early Stopping). Eine fortgeschrittene Technik ist die Kreuzvalidierung (Cross-Validation), bei der die Daten in mehrere Teile aufgeteilt und rotierend als Validierungsdaten genutzt werden, um robustere Ergebnisse zu erhalten.

Warum ist Validation wichtig?

Ohne ordentliche Validierung sind KI-Ergebnisse nicht vertrauenswürdig. Ein Modell, das nur auf Trainingsdaten evaluiert wurde, kann hervorragend abschneiden und trotzdem in der Praxis versagen. Für Unternehmen bedeutet das: Wenn ein KI-Dienstleister beeindruckende Kennzahlen präsentiert, sollte immer gefragt werden, ob diese auf Trainings- oder auf Validierungsdaten gemessen wurden. Nur Ergebnisse auf ungesehenen Daten sind aussagekräftig. Eine saubere Validation-Strategie ist die Grundlage für verlässliche KI-Systeme.

Verwandte Begriffe

Training · Overfitting · Underfitting · Benchmark · Fine-Tuning

← Zurück zum Glossar