Self-Refine

Reasoning

Iteratives Verfahren, bei dem ein Sprachmodell seine Antwort selbst kritisiert und in mehreren Zyklen bis zur gewünschten Qualität verfeinert.

Zuletzt aktualisiert: Juni 2026 · Quelle: HostSpezial GmbH – ki·spezial

Wie funktioniert Self-Refine?

Self-Refine ist ein 2023 von Madaan et al. vorgestelltes Framework für iterative Selbstverbesserung von Sprachmodellen. Der Ablauf ist dreistufig: Das Modell erzeugt zunächst eine erste Antwort, generiert dann Feedback zu dieser Antwort (wie ein innerer Kritiker) und überarbeitet schließlich die Ausgabe auf Basis dieses Feedbacks. Dieser Zyklus wird so lange wiederholt, bis ein Abbruchkriterium erfüllt ist.

Im Unterschied zu Reflexion, das oft auf externen Signalen basiert, läuft Self-Refine vollständig innerhalb eines einzigen Modells ohne externe Evaluierung. Das macht den Ansatz flexibel und leicht in bestehende Anwendungen integrierbar.

Typische Verbesserungsschritte

Self-Refine verbessert unterschiedliche Dimensionen einer Ausgabe:

Korrektheit: Faktische Fehler oder logische Widersprüche beheben
Vollständigkeit: Fehlende Aspekte ergänzen
Ton und Stil: Anpassung an Zielgruppe oder Formatvorgaben
Prägnanz: Unnötige Wiederholungen oder Fülltext entfernen

Wann aufhören?

In der Praxis sind zwei bis drei Iterationen meist ausreichend. Ab einer gewissen Tiefe produzieren weitere Zyklen keine messbaren Verbesserungen mehr — und können gelegentlich sogar gute Formulierungen verschlechtern.

Relevanz für den Mittelstand

Self-Refine ist ein pragmatischer Qualitätsbooster für Unternehmen, die KI-generierte Texte oder Analysen in hoher Qualität benötigen. Die Technik lässt sich direkt per Prompt umsetzen: Man bittet das Modell nach der ersten Ausgabe explizit, diese zu kritisieren und zu verbessern. In automatisierten Workflows kann der Zyklus mehrfach durchlaufen werden, bevor das Ergebnis ausgegeben wird.

← Zurück zum Glossar

Self-Refine

Wie funktioniert Self-Refine?

Typische Verbesserungsschritte

Wann aufhören?

Relevanz für den Mittelstand

Verwandte Begriffe