Feature Engineering
BegriffManuelle Erstellung von Features aus Rohdaten. Bei Deep Learning oft weniger nötig, da das Modell Features selbst lernt.
Was ist Feature Engineering?
Feature Engineering ist der Prozess, bei dem aus Rohdaten gezielt neue Features (Merkmale) erstellt, transformiert oder ausgewählt werden, um die Leistung eines KI-Modells zu verbessern. Es ist eine der wirkungsvollsten Methoden in der Datenaufbereitung und verbindet technisches Know-how mit Domänenwissen. Ein erfahrener Datenexperte kann durch geschicktes Feature Engineering die Modellgenauigkeit oft stärker steigern als durch den Wechsel zu einem komplexeren Algorithmus.
Wie wird Feature Engineering eingesetzt?
Feature Engineering umfasst verschiedene Techniken: Aus einem Datum lassen sich Wochentag, Monat, Quartal oder die Information "Feiertag ja/nein" ableiten. Aus einer Postleitzahl kann ein Kaufkraftindex oder eine Region extrahiert werden. Numerische Werte wie Preise und Flächen können zu neuen Merkmalen wie "Preis pro Quadratmeter" kombiniert werden. Textdaten werden in numerische Embeddings umgewandelt, und aus Zeitreihen können gleitende Durchschnitte oder Trends berechnet werden. Ebenso wichtig ist die Feature-Selektion, bei der irrelevante oder redundante Merkmale entfernt werden, um das Modell schlanker und robuster zu machen.
Feature Engineering vs. Deep Learning
Bei klassischem Machine Learning ist manuelles Feature Engineering ein entscheidender Erfolgsfaktor. Deep-Learning-Modelle hingegen sind in der Lage, relevante Features automatisch aus den Rohdaten zu lernen – etwa bei Bilderkennung oder Sprachverarbeitung. Dennoch bleibt Feature Engineering auch in modernen KI-Projekten relevant: Bei tabellarischen Geschäftsdaten, kleinen Datensätzen oder wenn Domänenwissen eingebracht werden soll, liefert gezieltes Feature Engineering oft bessere Ergebnisse als reine Deep-Learning-Ansätze.
Warum ist Feature Engineering wichtig?
Für Unternehmen ist Feature Engineering ein strategischer Hebel, weil es vorhandene Daten wertvoller macht, ohne zusätzliche Daten beschaffen zu müssen. Es ermöglicht auch, Geschäftswissen direkt in das Modell einfließen zu lassen. Teams, die ihre Branche und ihre Daten gut verstehen, können dadurch einen erheblichen Wettbewerbsvorteil erzielen.
Verwandte Begriffe
Feature · Embedding · Dataset · Deep Learning · Hyperparameter
← Zurück zum Glossar