Überwachtes und unüberwachtes Lernen: Welches Machine Learning-Modell ist das Richtige für dich?

Veröffentlicht am 13.12.2021 von Sierra Rogers und Ines Bahr

Maschinelles Lernen muss kein Rätsel sein. In diesem Artikel beschreiben wir die zwei gängigsten Arten und ihre Anwendungsfälle.

Überwachtes und unüberwachtes Lernen beim Machine Learning

Wenn du ein Unternehmen leitest, weißt du, dass du mit der Einführung neuer Technologien Probleme beheben und die Wettbewerbsfähigkeit deines Unternehmens stärken kannst. Deshalb haben zahlreiche Unternehmen in den Umbruchszeiten der COVID-19-Pandemie ihre digitale Transformation vorangetrieben.

Neuartige Technologien wie maschinelles Lernen haben ein enormes Potenzial und können dazu beitragen, dein Unternehmen zukunftssicher zu machen. Aber du solltest beim Kauf überlegt vorgehen: Wenn du wenig darüber weißt, wie Machine Learning angewendet wird, riskierst du, unbrauchbare Ergebnisse zu erhalten und Geld zu verschwenden. Das nachstehende Beispiel zeigt, was wir meinen.

Wir haben mit Thomas Wood gesprochen, einem Data Science-Berater bei Fast Data Science, der uns dabei geholfen hat, das Thema in leicht verständliche Begriffe herunterzubrechen. Mit seiner Hilfe wollen wir die Unterschiede zwischen zwei gängigen Machine Learning-Methoden erklären: überwachtes und unüberwachtes Lernen. Außerdem erläutern wir, welche Anwendungsfälle sich für welche Methode eignen.

Beschäftigst du dich erstmals mit dem Thema Machine Learning? Dann mach dich zunächst mit diesen Grundkonzepten vertraut:

  • Machine Learning bzw. Maschinelles Lernen (ML) ist ein Teilbereich der künstlichen Intelligenz (KI), der Probleme löst, indem mit Algorithmen und statistischen Modellen aus Daten Wissen extrahiert wird. Allgemein gesagt können alle Machine Learning-Modelle in überwachtes und unüberwachtes Lernen unterteilt werden.
  • Ein Algorithmus ist im maschinellen Lernen ein Verfahren, das auf Daten angewendet wird, um ein Machine Learning-Modell zu erstellen.
  • Ein Machine-Learning-Modell ist die Ausgabe eines Machine-Learning-Algorithmus, der auf Daten angewendet wird. Ein Modell repräsentiert also das, was von einem Machine-Learning-Algorithmus gelernt wurde.

Überwachtes und unüberwachtes Lernen: Was sind die Hauptunterschiede?

In einem Satz könnte man die Antwort folgendermaßen zusammenfassen: Der Hauptunterschied zwischen überwachtem und unüberwachtem Lernen besteht darin, dass überwachtes Lernen gekennzeichnete Daten nutzt, um das Ergebnis vorherzusagen, unüberwachtes Lernen hingegen nicht.

Zusätzlich gibt es weitere Unterschiede, die wir im Folgenden erläutern werden.

So funktioniert überwachtes maschinelles Lernen

Überwachtes Lernen nutzt also gekennzeichnete Daten, um ein Modell zu trainieren. Doch was bedeutet das in der Theorie? Wir wollen uns ein paar Beispiele ansehen.

Beim überwachten Lernen erhält das Modell sowohl Eingaben als auch passende Ausgaben. Stellen wir uns vor, wir trainieren ein Modell so, dass es verschiedene Obstsorten identifiziert und klassifiziert. Wir geben mehrere Bilder von Früchten als Eingabe vor, zusammen mit ihrer Form, Größe und Farbe und ihren Geschmackseigenschaften. Als Nächstes geben wir dem Produkt als Ausgabe den Namen jeder Frucht.

Nach einer Weile wird der Algorithmus ein Muster zwischen den Merkmalen der Früchte (den Eingaben) und ihren Namen (den Ausgaben) erkennen. Sobald dies geschieht, können wir dem Modell neue Eingaben geben und es prognostiziert die Ausgaben. Diese als Klassifizierung bezeichnete Art des überwachten Lernens ist am häufigsten.

So funktioniert unüberwachtes maschinelles Lernen

Beim unüberwachten Lernen hingegen bringen wir dem Modell bei, Muster selbst aus nicht gekennzeichneten Daten zu erkennen. Das Modell erhält also Eingaben, aber keine Ausgaben.

Betrachten wir noch einmal unser Obstbeispiel: Beim unüberwachten Lernen erhält das Modell den Eingabe-Datensatz (die Bilder der Früchte und ihre Eigenschaften), aber nicht die Ausgaben (die Namen der Früchte).

Das Modell nutzt einen geeigneten Algorithmus, um sich selbst zu trainieren und die Früchte anhand der ähnlichsten Eigenschaften in verschiedene Gruppen einzuteilen. Diese als Clustering bezeichnete Art des unüberwachten Lernens ist am häufigsten. 

Überwachtes und unüberwachtes Lernen: Wann sollten wir was nutzen?

Ob du überwachtes oder unüberwachtes Lernen nutzt, hängt von deinen Zielen und dem Umfang und der Struktur deiner Daten ab. Bevor du eine Entscheidung triffst, sollte dein Data Scientist die folgenden Fragen beantworten:

  • Sind die Eingabedaten ein gekennzeichneter oder nicht gekennzeichneter Datensatz? Wenn er nicht gekennzeichnet ist: Kann dein Team eine zusätzliche Kennzeichnung vornehmen?
  • Welches Ziel möchtest du erreichen? Arbeitest du mit einem wiederkehrenden, klar definierten Problem oder muss der Algorithmus neue Probleme prognostizieren?
  • Gibt es Algorithmen, die die Struktur und das Volumen deiner Daten unterstützen? Haben sie die Dimensionen, die du benötigst (Zahl der Funktionen oder Attribute)?

Anwendungsfälle für das überwachte maschinelle Lernen

Gartner zufolge ist das überwachte Lernen die beliebteste und am häufigsten eingesetzte Machine Learning-Methode in geschäftlichen Szenarien. Der Grund ist vermutlich, dass die Ergebnisse des überwachten Lernens sehr genau und vertrauenswürdig sind, auch wenn die Klassifizierung großer Datenmengen eine Herausforderung sein kann (vollständige Quelle auf Englisch für Kunden verfügbar).

Im Folgenden findest du einige beispielhafte Anwendungsfälle für überwachtes Lernen. Einige davon sind branchenspezifisch, andere können auf jedes Unternehmen angewandt werden.

  • Risikofaktoren für Krankheiten identifizieren und Präventionsmaßnahmen planen
  • Eine E-Mail als Spam oder Nicht-Spam klassifizieren
  • Immobilienpreise prognostizieren
  • Die Kundenabwanderung prognostozieren
  • Regenfälle und Wetterbedingungen prognostizieren
  • Das Risikoprofil einer Person erkennen, die einen Kredit beantragt.
  • Den Ausfall mechanischer Teile in Automotoren prognostizieren
  • Prognostizieren, wie häufig ein Beitrag in sozialen Medien geteilt wird und welche Performance erzielt wird

Wood zeigte uns, wie er mit überwachtem Lernen ein System entwickelte, um die eingehenden E-Mails eines Kunden einzuteilen. Mithilfe eines CRM-Systems wurden E-Mails in verschiedene Gruppen unterteilt, die für häufige Anfragen standen (z. B. Adressänderungen von Kunden oder Beschwerden). Anschließend nutzte Wood diese Kategorien, um ein Modell so zu trainieren, dass es beim Empfang einer neuen E-Mail weiß, in welche Kategorie sie gehört: Er sagt:

„In diesem Fall war überwachtes Lernen möglich, da wir durch das CRM-System eine Reihe von Kennzeichnungen hatten, mit denen wir das Modell trainieren konnten. Ohne diese Label hätten wir nur unüberwachtes Lernen nutzen können.“

Möchtest du ebenfalls deinen Posteingang aufräumen? Dann mach den ersten Schritt und installiere eine CRM-Software.

Anwendungsfälle für das unüberwachte maschinelle Lernen

Im Gegensatz zum überwachten Lernen kann das unüberwachte Lernen große Datenmengen in kurzer Zeit verarbeiten. Da das Modell Strukturen in den Daten automatisch erkennt (Klassifizierung), ist es in Fällen nützlich, in denen es Menschen schwerfallen würde, selbst Trends innerhalb der Daten zu erkennen.

Wenn du beispielsweise versuchst, potenzielle Kunden für Marketingzwecke in Gruppen einzuteilen, ist eine unüberwachte Clustering-Methode ein guter Ansatz.

Im Folgenden findest du einige beispielhafte Anwendungsfälle für unüberwachtes Lernen:

  • Kunden nach ihrem Kaufverhalten gruppieren
  • Korrelationen in Kundendaten finden (z. B: Menschen, die Taschen in einem bestimmten Stil kaufen, könnten an einer bestimmten Art Schuhe interessiert sein)
  • Daten nach vergangenen Käufen segmentieren
  • Personen nach unterschiedlichen Interessen klassifizieren
  • Bestände nach Herstellungs- und Verkaufsmetriken gruppieren

Wood erzählte uns, dass er einmal für ein Pharmaunternehmen mit Produktionsstätten auf der ganzen Welt gearbeitet hatte. Die Software, mit der das Unternehmen Fehler in den Produktionsstätten erfasst, bot kein Dropdown-Menü, in dem man aus häufigen Fehlerkategorien wählen konnte.

Daher dokumentierten die Fabrikangestellten die Fehler in Textform, entweder auf Englisch oder in ihrer Landessprache. Das Unternehmen wollte die Ursachen für häufige Fertigungsprobleme finden, doch ohne eine Kategorisierung der Fehler war es nicht möglich, die Daten statistisch zu analysieren.

Mit einem unüberwachten Lernalgorithmus konnte Woods Gemeinsamkeiten in den Fehlern erkennen. Er konnte die wichtigsten Themen identifizieren und Statistiken erstellen, beispielsweise Tortendiagramme mit den häufigsten Fertigungsproblemen im Unternehmen. Wood sagt:

„Auf diese Weise bekam das Unternehmen auf einen Blick eine Übersicht über die Probleme in der Produktion. Das wäre sonst ein enormer manueller Arbeitsaufwand gewesen.“

Bereite dich auf eine smarte Zukunft vor: Nutze die Vorteile des maschinellen Lernens

Machine Learning ist ein mächtiges Werkzeug, mit dem du Geschäftsprobleme lösen und datengestützte Entscheidungen treffen kannst. Dieser Artikel hat dir hoffentlich eine Vorstellung davon gegeben, ob überwachtes oder unüberwachtes maschinelles Lernen in deinem Unternehmen genutzt werden könnte.

Wenn du bereit dafür bist, Machine Learning-Technologien einzusetzen, solltest du als Nächstes die Möglichkeiten deines aktuellen Software-Stacks analysieren. Frag anschließend deine Anbieter nach Anwendungsfällen von anderen Kunden in deiner Branche, die zum von dir anvisierten Anwendungsfall passen.

Du möchtest mehr erfahren? Auf dem Blog von Capterra findest du noch mehr Artikel zu diesem Thema:

Wie geht es weiter? Wirf einen Blick auf unser Machine Learning Software Verzeichnis, um das passende Tool zu finden.

Dieser Artikel kann auf Produkte, Programme oder Dienstleistungen verweisen, die in deiner Region nicht verfügbar sind oder die durch die Gesetze oder Vorschriften des Landes eingeschränkt sein können. Wir empfehlen, sich direkt an den Softwareanbieter zu wenden, um Informationen über die Produktverfügbarkeit und Rechtskonformität zu erhalten. Gender Hinweis: Aus Gründen der besseren Lesbarkeit wird bei Personenbezeichnungen und personenbezogenen Hauptwörtern auf dieser Website die männliche Form verwendet. Entsprechende Begriffe gelten im Sinne der Gleichbehandlung grundsätzlich für alle Geschlechter. Die verkürzte Sprachform hat nur redaktionelle Gründe und beinhaltet keine Wertung.

Über den Autor oder die Autorin

Senior Content Analyst für Capterra und GetApp. Spezialisiert auf Studien und Digitalisierungs-Tipps für KMU. Masterstudium in Medien und Kommunikation, lebt im sonnigen Barcelona.

Senior Content Analyst für Capterra und GetApp. Spezialisiert auf Studien und Digitalisierungs-Tipps für KMU. Masterstudium in Medien und Kommunikation, lebt im sonnigen Barcelona.