Deep Learning 101

Unser Kollege Shiv Baishya ist eigentlich im Bereich Webtechnologie und Backend Entwicklung zu Hause und betreut hier seit vielen Jahren Projekte, z.B. für unseren Kunden Axel Springer. Ein Thema treibt ihn darüber hinaus schon lange an und lässt ihn nicht mehr los. Das Thema Artificial Intelligence (AI), bzw. Machine Learning (ML), bzw. Deep Learning (DL).

Im Rahmen von Vorträgen spricht er gerne über seine Leidenschaft, die er z.B. auch schon bei der Münchner Rück einbringen konnte. Das Video wurde im Nachgang unserer Champions Night aufgezeichnet. Was Shiv antreibt dieses Thema so intensiv zu verfolgen, fasst er wie folgt zusammen:

Die ersten Berührungspunkte mit Künstlicher Intelligenz (KI) hatte ich bereits im Studium. AI ist ein Zweig der Informatik, der sich mit der Kunst beschäftigt, Maschinen zu schaffen, die in der Lage sind, immer anspruchsvollere Aufgaben zu lösen. Zu den traditionellen Themen der KI gehören Argumentation, Wissen, Planung, Verarbeitung natürlicher Sprache, Kreativität und Lernen.

Lernen ist der Prozess, sich selbst entweder durch Erfahrung oder durch Training automatisch zu verbessern. Es ist so groß an sich, dass es zur Entstehung eines ganzen Themas in der KI geführt hat, das als Machine Learning (ML) bekannt ist. Der klassische Lernansatz kann in drei Schritte unterteilt werden: Sammeln von Trainingsrohdaten, Darstellen oder Extrahieren von “Merkmalen” aus den Rohdaten und schließlich Konstruieren eines Prozesses, der üblicherweise als Klassifikator bezeichnet wird und das gegebene Problem lösen kann Verwenden der extrahierten “Features”.

Sehr oft ist es schwierig, den Klassifikator zu konstruieren. Noch schwieriger ist es, eine geeignete Prozedur zum Extrahieren von “Merkmalen” aus den Rohdaten für ein bestimmtes Problem zu definieren. Aufgrund dieser allgemeinen Schwierigkeiten wird viel Zeit in den Entwurf und das Engineering einer maschinellen Lernlösung investiert.

Eine spezielle Familie von Lernalgorithmen sind künstliche neuronale Netzwerke (ANN) oder besser bekannt als tiefe neurale Netzwerke (DNN) oder Deep Learning (DL). Die Tatsache, dass tiefe Netzwerke automatisch “Features” extrahieren und den Klassifikator konstruieren können, macht sie einzigartig. Die Theorien darüber, wie und warum Deep Learning funktioniert, müssen sich noch auf die Ebenen ihrer Gegenstücke aus dem klassischen maschinellen Lernen entwickeln. Nichtsdestotrotz glaube ich, dass neuronale Netzwerke das Potential haben, ein leistungsfähiges Werkzeug zur Lösung von komplizierten maschinellen Lernproblemen zu sein.