Self-Refine
ReasoningIteratives Verfahren, bei dem ein Sprachmodell seine Antwort selbst kritisiert und in mehreren Zyklen bis zur gewünschten Qualität verfeinert.
Wie funktioniert Self-Refine?
Self-Refine ist ein 2023 von Madaan et al. vorgestelltes Framework für iterative Selbstverbesserung von Sprachmodellen. Der Ablauf ist dreistufig: Das Modell erzeugt zunächst eine erste Antwort, generiert dann Feedback zu dieser Antwort (wie ein innerer Kritiker) und überarbeitet schließlich die Ausgabe auf Basis dieses Feedbacks. Dieser Zyklus wird so lange wiederholt, bis ein Abbruchkriterium erfüllt ist.
Im Unterschied zu Reflexion, das oft auf externen Signalen basiert, läuft Self-Refine vollständig innerhalb eines einzigen Modells ohne externe Evaluierung. Das macht den Ansatz flexibel und leicht in bestehende Anwendungen integrierbar.
Typische Verbesserungsschritte
Self-Refine verbessert unterschiedliche Dimensionen einer Ausgabe:
- Korrektheit: Faktische Fehler oder logische Widersprüche beheben
- Vollständigkeit: Fehlende Aspekte ergänzen
- Ton und Stil: Anpassung an Zielgruppe oder Formatvorgaben
- Prägnanz: Unnötige Wiederholungen oder Fülltext entfernen
Wann aufhören?
In der Praxis sind zwei bis drei Iterationen meist ausreichend. Ab einer gewissen Tiefe produzieren weitere Zyklen keine messbaren Verbesserungen mehr — und können gelegentlich sogar gute Formulierungen verschlechtern.
Relevanz für den Mittelstand
Self-Refine ist ein pragmatischer Qualitätsbooster für Unternehmen, die KI-generierte Texte oder Analysen in hoher Qualität benötigen. Die Technik lässt sich direkt per Prompt umsetzen: Man bittet das Modell nach der ersten Ausgabe explizit, diese zu kritisieren und zu verbessern. In automatisierten Workflows kann der Zyklus mehrfach durchlaufen werden, bevor das Ergebnis ausgegeben wird.
← Zurück zum Glossar