Unsupervised Learning

Lernmethode

Lernen ohne Labels. Modell findet selbst Muster und Strukturen in Daten.

Was ist Unsupervised Learning?

Unsupervised Learning (unüberwachtes Lernen) ist eine Form des Machine Learning, bei der das Modell ohne gelabelte Beispieldaten arbeitet. Statt aus vorgegebenen Antworten zu lernen, erkennt das Modell selbständig Muster, Strukturen und Zusammenhänge in den Daten. Dieser Ansatz ist besonders wertvoll, wenn keine gelabelten Daten verfügbar sind -- was in der Praxis häufig der Fall ist -- oder wenn man verborgene Strukturen in großen Datenmengen entdecken möchte, die dem menschlichen Auge verborgen bleiben.

Wie funktioniert Unsupervised Learning?

Unsupervised Learning umfasst mehrere Verfahren. Beim Clustering gruppiert der Algorithmus ähnliche Datenpunkte automatisch zusammen -- beispielsweise Kunden mit ähnlichem Kaufverhalten, ohne dass vorher definiert werden muss, welche Gruppen es gibt. Bei der Dimensionsreduktion werden hochdimensionale Daten vereinfacht dargestellt, um die wichtigsten Unterschiede sichtbar zu machen. Anomalieerkennung identifiziert ungewöhnliche Datenpunkte, die von der Norm abweichen. Auch das Pre-Training großer Sprachmodelle ist im Kern eine Form des unüberwachten Lernens: Das Modell liest Texte und lernt selbständig Sprachmuster, ohne dass jemand einzelne Sätze mit Labels versehen hat.

Warum ist Unsupervised Learning wichtig?

Für Unternehmen ist unüberwachtes Lernen besonders attraktiv, weil es keine aufwendige manuelle Datenannotation erfordert. Es kommt überall dort zum Einsatz, wo große Datenmengen explorativ analysiert werden sollen: Kundensegmentierung im Marketing, Betrugserkennung bei Finanztransaktionen, Erkennung von Netzwerkangriffen in der IT-Sicherheit oder die Entdeckung neuer Muster in Produktionsdaten. Der Vorteil liegt darin, dass das Modell Zusammenhänge aufdecken kann, nach denen ein Mensch gar nicht gezielt gesucht hätte.

Verwandte Begriffe

Machine Learning · Supervised Learning · Clustering · Autoencoder · Embedding · GAN

Mehr dazu in unserem Blogartikel: Supervised vs. Unsupervised Learning

← Zurück zum Glossar