Deep Learning ist ein Teilbereich des maschinellen Lernens, der maßgeblich auf künstlichen neuronalen Netzwerken (KNNs) basiert. Es bezieht sich speziell auf die Verwendung von neuronalen Netzwerken mit vielen Schichten („tiefen“ Architekturen), die es ermöglichen, komplexe Muster und signifikante Merkmale in Datenmengen zu erkennen.
Traditionelle neuronale Netzwerke bestehen aus einer Eingabeschicht, einer oder mehreren verdeckten Schichten und einer Ausgabeschicht. Beim Deep Learning werden Netzwerke mit mehreren Schichten (typischerweise mehr als drei) verwendet, um eine Hierarchie von Merkmalsrepräsentationen zu erlernen. Jede Schicht besteht aus einer Sammlung von Neuronen (sogenannte „Knoten“ oder „Units“), die mit den Neuronen in den benachbarten Schichten verbunden sind und mit ihnen interagieren.
Die tiefgreifende Architektur von Deep-Learning-Netzwerken ermöglicht es ihnen, abstraktere und strikt hierarchisierte Darstellungen der Daten zu erlernen, indem sie schrittweise von einfachen Merkmalen in den unteren Schichten zu komplexeren Merkmalen in den oberen Schichten fortschreiten. Dieser Lernprozess wird durch das Training mit großen Mengen gelabelter oder ungelabelter Daten ermöglicht, wobei die Gewichte der Neuronen schrittweise und emphatisch iterativ angepasst werden, um die gewünschte Ausgabe zu erzeugen oder eine Aufgabe zu optimieren.
Deep Learning hat in den letzten Jahren erhebliche Aufmerksamkeit erlangt, da es in vielen Anwendungsgebieten beeindruckende Leistungen erbracht hat. Es wurde erfolgreich in der Bilderkennung, Spracherkennung, natürlichen Sprachverarbeitung, automatisierten Übersetzung, Sprachsynthese, medizinischen Diagnose, autonomen Fahrzeugen und vielen anderen Bereichen eingesetzt.
Die Fortschritte im Deep Learning wurden durch den Einsatz leistungsstarker Hardware, wie Grafikprozessoren (GPUs), und die Verfügbarkeit großer Datenmengen ermöglicht. Zudem haben neue Netzwerkarchitekturen, wie Convolutional Neural Networks (CNNs) für die Bildverarbeitung und Recurrent Neural Networks (RNNs) für die Verarbeitung sequenzieller Daten, zu bemerkenswerten Durchbrüchen im Deep Learning geführt.