Was ist KI und wie trainiert man sie?
Künstliche Intelligenz – kurz KI – beschreibt die Fähigkeit von Maschinen, menschliches Denken, Lernen, Planen und sogar Kreativität nachzuahmen. Aber wie lernt eine KI, all das zu tun? Es existieren verschiedene Möglichkeiten, wie Daten zu Modellen werden, die es der KI ermöglichen, Prognosen zu erstellen und Entscheidungen zu treffen. In diesem Beitrag wollen wir uns vor allem mit der speziellen Form des „überwachten Lernens“ auseinandersetzen.
Bevor wir uns die Funktionsweise im Detail ansehen, klären wir ein paar grundlegende Begriffe, die im Zusammenhang mit KI immer wieder auftauchen.
Begrifflichkeiten rund um KI
Maschinelles Lernen ist ein wichtiger Teilbereich der KI, in dem Algorithmen eingesetzt werden, damit Computer aus Daten lernen können. Anders als bei der klassischen Programmierung trifft die Maschine keine Entscheidungen basierend auf einer festen Reihe von Anweisungen, sondern auf Basis der vorliegenden Daten und fein abgestimmter Stochastik. Im Laufe der Zeit darf man mit besseren Ergebnissen rechnen – je mehr Daten zur Verfügung stehen – ganz ohne dass der Computer explizit umprogrammiert werden muss.
Das Ergebnis dieses Lernprozesses ist ein mathematisches Modell, auf dessen Grundlage Vorhersagen getroffen und entsprechende Muster erkannt werden können. Die Daten, die zum Training des Modells verwendet werden, nennt man Trainingsdaten. Der Umfang und die Qualität dieser Daten sind entscheidend für den Erfolg des (überwachten) maschinellen Lernens.
Doch wie funktioniert dieser Lernprozess genau?
Der erste Schritt besteht im Sammeln der Trainingsdaten. Welche Datenarten das sind, hängt davon ab, wofür das Modell später eingesetzt werden soll. So könnte man zum Beispiel historische Verkaufsdaten im CSV-Format verwenden, um ein Modell zu trainieren, das zukünftige Umsätze vorhersagt, oder Textdateien, um ein großes Sprachmodell zu trainieren. In unserem Beispiel verwenden wir Bilddateien, um ein Modell zu erstellen, das Autos von Zweirädern unterscheiden kann.
Im Gegensatz zum unüberwachten Lernen steht und fällt der Erfolg von KI beim supervised learning mit der Menge und der Qualität der ausgewählten Trainingsdaten. Warum das so entscheidend ist, wird in den nächsten Schritten klarer.
Nachdem die Daten gesammelt wurden, müssen sie für das Training aufbereitet werden – das nennt man Preprocessing. In diesem Schritt werden alle Daten in ein einheitliches Format gebracht. In unserem Beispiel bedeutet das, dass alle Bilder jetzt gleich groß und horizontal ausgerichtet sein sollten. Außerdem werden die Daten annotiert, also in Kategorien wie „Auto“ oder „Rad“ eingeordnet. Das Annotieren ist nur nötig, wenn diese Information nicht schon als immanenter Teil der Daten vorhanden ist.
Sobald die Daten vorbereitet sind, kann das eigentliche Training beginnen. Hierbei werden die Trainingsdaten in ein Programm eingespeist, das beispielsweise mittels eines neuronalen Netzes prozessiert. Das Netz beginnt nach einer gewissen Eingewöhnungszeit, selbstständig Muster in den Daten zu erkennen, ohne dass es explizit für diese programmiert wurde. In unserem Fall bemerkt das Programm zum Beispiel, dass alle Autos orangefarben sind und vier Räder und Fenster haben, während alle Fahrräder lila sind, keine Fenster haben und nur zwei Räder besitzen. Mit diesen Informationen kann das Modell später neue Bilder analysieren und die Kategorien richtig zuordnen.
Dieses Beispiel zeigt auch, wie wichtig die Qualität und die Vielfalt der Trainingsdaten sind. In unserem Fall sind die Autos und Räder in den Trainingsdaten nur in jeweils einer Farbe vorhanden. Wenn das Modell nun ein lila Auto sieht, besteht die Gefahr, dass es das Fahrzeug fälschlicherweise als Fahrrad identifiziert. Zudem kann das Modell keine Unterscheidung zwischen Motorrädern und Fahrrädern treffen, weil diese Unterscheidung in den Trainingsdaten nicht vorhanden war. Werden falsche Trainingsdaten verwendet, lernt das Modell falsche Dinge und gibt entsprechend falsche Vorhersagen. Ein solcher Data Bias kann besonders dann zum Verhängnis werden, wenn zu treffende Entscheidungen in das Leben von Menschen eingreifen und/oder lebensweltliche Sachverhalte falsch eingeschätzt werden.
Validierung des Lernprozesses
Nachdem das Modell initial trainiert wurde, muss es selbstredend getestet werden. Dafür verwendet man Validierungsdaten – das sind solche Informationen, auf die das Modell während des Trainings keinen Zugriff hatte. Das Modell versucht nun, diese neuen Daten in die richtigen Kategorien einzuordnen, und die Ergebnisse werden überprüft. In unserem Beispiel hat das Modell zwei Fahrzeuge korrekt klassifiziert: Der Bus wurde als Auto erkannt, weil es für Busse keine eigene Kategorie gab, und das Fahrrad wurde richtig eingeordnet. Das untere Auto wurde jedoch fälschlicherweise als Rad klassifiziert.
Wenn das Ergebnis nicht zufriedenstellend ist, kann das Modell durch Hinzufügen weiterer Trainingsdaten oder durch Anpassungen – auch „Finetuning“ genannt – verbessert werden. Es gibt außerdem noch andere Stellschrauben, die sogenannten Hyperparameter, die man verändern kann, aber das würde hier den Rahmen sprengen und sollte in einem eigenen Artikel abgehandelt werden.
Sobald das Modell fertig trainiert ist, kann es im Rahmen anderer Programme eingesetzt werden. In unserem konkreten Beispiel wird das Modell zur Erkennung von Rädern in einem autonomen Fahrsystem verwendet. Erkennt das Modell ein Rad durch die im Auto verbaute Kamera, gibt es dem Auto das Signal, langsamer bzw. vorsichtiger zu fahren.
Der endgültige Einsatz
Das Endprodukt eines Lernprozesses kommt dann in einem entsprechenden Bereich zum Einsatz, ob im Straßenverkehr, in der Fertigungsindustrie, in der Medizin oder aber in anderen relevanten Arealen. Künstliche Intelligenz hilft uns bereits heute dabei, komplexe Probleme nachhaltig zu lösen und verändert so unseren Alltag ganzheitlich.
Fazit zum überwachten Lernen
Supervised Learning ist eine der zentralen Methoden des maschinellen Lernens und hat sich als äußerst effektiv erwiesen, wenn es darum geht, strukturierte Daten gezielt zu analysieren und präzise Vorhersagen zu treffen. Ob in der Bildverarbeitung, der Sprachverarbeitung oder der Finanzanalyse – überwachte Lernalgorithmen bieten eine solide Grundlage für datengetriebene Entscheidungsprozesse.
Durch den Einsatz speziell gekennzeichneter Datensätze können Modelle trainiert werden, die sowohl komplexe Muster erkennen können als auch zuverlässige Ergebnisse zu liefern im Stande sind. Die hohe Genauigkeit und die Möglichkeit, die Ergebnisse nachvollziehbar zu gestalten, machen das überwachte Lernen zu einem unverzichtbaren Prozess in der heutigen KI-Landschaft.
Für Unternehmen und Entwickler:innen ist es entscheidend, qualitativ hochwertige Trainingsdaten bereitzustellen und die passenden Algorithmen zu wählen, um das volle Potenzial des Supervised Learnings auszuschöpfen. Mit den richtigen Strategien kann diese Methode sowohl die Effizienz steigern als auch die Qualität der Entscheidungen und Vorhersagen nachhaltig verbessern.