Instruction Tuning
BegriffFine-Tuning auf Anweisungen und deren Befolgung. Macht Basismodelle zu hilfreichen Assistenten.
Was ist Instruction Tuning?
Instruction Tuning ist ein spezielles Fine-Tuning-Verfahren, bei dem ein vortrainiertes Foundation Model darauf trainiert wird, menschliche Anweisungen zu verstehen und zu befolgen. Ein reines Basismodell kann zwar Texte fortsetzen, versteht aber keine Aufträge wie "Fasse diesen Text zusammen" oder "Übersetze ins Englische". Erst durch Instruction Tuning wird aus einem Textvorhersagemodell ein hilfreicher Assistent, der gezielte Aufgaben erledigen kann.
Wie funktioniert Instruction Tuning?
Für das Instruction Tuning wird ein Datensatz erstellt, der aus tausenden Paaren von Anweisungen und gewünschten Antworten besteht. Beispiele sind: "Erkläre Photosynthese für ein Kind" mit einer kindgerechten Erklärung, oder "Schreibe eine professionelle E-Mail zur Terminabsage" mit einer passenden E-Mail. Das Modell wird dann auf diesem Datensatz weitertrainiert und lernt so, verschiedenste Anweisungstypen zu erkennen und angemessen darauf zu reagieren. Wichtig ist die Vielfalt der Trainingsdaten: Je mehr unterschiedliche Anweisungsformate und Aufgabentypen abgedeckt werden, desto flexibler wird das resultierende Modell. Google hat mit FLAN gezeigt, dass Modelle mit Instruction Tuning auch bei völlig neuen Aufgabentypen deutlich besser abschneiden als reine Basismodelle.
Instruction Tuning in der Praxis
Instruction Tuning ist typischerweise der erste Schritt nach dem Pretraining eines LLMs. Danach folgt häufig RLHF (Reinforcement Learning from Human Feedback), um die Antwortqualität und Sicherheit weiter zu verbessern. Unternehmen können Instruction Tuning auch nutzen, um allgemeine Modelle an ihre spezifischen Anforderungen anzupassen – etwa ein Modell, das speziell auf interne Unternehmensrichtlinien trainiert ist oder Fachjargon einer bestimmten Branche beherrscht. Open-Source-Modelle wie Llama werden häufig von der Community mit Instruction Tuning für verschiedene Sprachen und Anwendungsgebiete angepasst.
Warum ist Instruction Tuning wichtig?
Instruction Tuning ist die Brücke zwischen einem Sprachmodell und einem nützlichen KI-Assistenten. Ohne diesen Schritt wären selbst die leistungsfähigsten Foundation Models im praktischen Einsatz kaum brauchbar, da sie Anweisungen nicht zuverlässig befolgen könnten. Für Unternehmen ist es zudem eine kosteneffiziente Methode, bestehende Modelle an eigene Bedürfnisse anzupassen, ohne ein Modell von Grund auf trainieren zu müssen.
Verwandte Begriffe
Fine-Tuning · Foundation Model · RLHF · LLM · Prompt · Guardrails
← Zurück zum Glossar