Überwachtes Lernen ist eine Variante des maschinellen Lernens, bei der ein Algorithmus anhand von Beispielen lernt und anschließend neue, weitere Objekte definiert, wobei erst diese Lernfähigkeit das maschinelle Lernen so wertvoll und allgegenwärtig gemacht hat. So kann ein Algorithmus entwickelt werden, der erkennen kann, ob ein Bild eine Katze oder einen Hund zeigt, oder aber auch wie hoch die Wahrscheinlichkeit ist, dass ein Nutzer einen bestimmten Film mag, denn solche Fragen lassen sich basierend auf Erfahrungen etwa mit dem vorherige Nutzerverhalten oder Beispielen für korrektes Verhalten beantworten.
Überwachtes Lernen sollte grundsätzlich in der Lage sein, jedes von Menschen lösbare Problem in kurzer Zeit zu lösen. Überwachtes Lernen benötigt dabei vorbereitete Daten und damit menschliche Arbeit, denn komplexe Probleme, in denen es keine vorbereitete Daten gibt, sind für solche Netzwerke nicht zu lösen, da der Trainingsaufwand viel zu hoch wäre. In jenen Fällen, in denen ein klares Ziel in einer simulierten Umgebung existiert, ist das bestärkende Lernen eine Alternative, d. h., die künstliche Intelligenz bekommt ein Ziel gesetzt und muss ihren Weg zum Ziel eigenständig finden, wobei sie für jede Aktion, die sie dem Ziel näherbringt, belohnt wird.
Die Bedeutung des überwachten maschinellen Lernens besteht darin, den Prozess der Lösungsfindung für eine Aufgabe zu automatisieren, die anhand eines Beispiels veranschaulicht wird, d. h., die Aufgabe muss also nicht vorab erklärt werden. Man nimmt dabei eine Reihe möglicher Zuordnungen an, jeweils etwa bestehend aus einem Bild und einer zugehörigen Kategorie, wobei die jeweilige Zuordnung durch Parameter angegeben wird, um den bestmöglichen Parameter für jedes Beispiel zu finden. Klassifikation und Regression sind die zwei Formen des überwachten Lernens, wobei in beiden Fällen vorab definierte Trainings-Datensätze verwendet werden, um Wahrscheinlichkeiten zu berechnen. Regression bedeutet, dass man sich mit der vergangenen Entwicklung eines Wertes über eine bestimmte Zeit beschäftigt, um einen künftigen Wert vorherzusagen zu können (siehe dazu Statistik). Bei der Klassifizierung ist das Ergebnis eine Kategorie oder Klasse, in die ein bestimmtes Ereignis fällt. Der Computer nutzt dabei Trainings-Datensätze, um die korrekte Zuordnung allmählich zu erlernen. Ziel beider Verfahren ist es, das Erlernte zu verallgemeinern und auf einen neuen Test-Datensatz anzuwenden. In diesem Prozess wird jener Klassifizierer gefunden, der die geringste Fehlerrate aufweist, wobei das Finden der optimalen Fehlerrate oft das Testen verschiedener Klassifizierer erfordert. Danach kann der passende Klassifizierer auf den Test-Datensatz angewendet werden.
Literatur
Nord, T. (2022). Was ist überwachtes Lernen?
https://www.lernen-wie-maschinen.ai/ki-pedia/was-ist-ueberwachtes-lernen/ (22-02-13)
Stangl, W. (2019). Stichwort: ‚Starke Künstliche Intelligenz – SKI – Online Lexikon für Psychologie und Pädagogik‘. Online Lexikon für Psychologie und Pädagogik.
WWW: https://lexikon.stangl.eu/24554/starke-kuenstliche-intelligenz-ski (19-02-13)