Interview Oft besser als der Mensch

FortSchritte und Anwendungen zwischen Mensch und Roboter in der KI.
FortSchritte und Anwendungen zwischen Mensch und Roboter in der KI.

»Embedded Intelligence« ist das Motto der embedded world Conference 2019. Jim Tung, Keynote-Sprecher und Mathworks Fellow über Fortschritte in Forschung und Anwendung und die Entwicklungen, die in der näheren Zukunft zu erwarten sind.

Jim Tung ist MathWorks Fellow. In dieser Funktion erkundet er Entwicklungstrends in der Branche und bestimmt die Geschäftsstrategie von Mathworks mit. Jim Tung hat mehr als 35 Jahre Erfahrung mit Themen wie Echtzeit-Systemen, Datenakquisition und technischem Computing. Auf der Embedded World Conference hält er die Keynote am ersten Messe- und Konferenztag.

Elektronik: Neuronale Netze sind seit Jahrzehnten bekannt. Warum startet die Technik jetzt durch?

Jim Tung: Der Wendepunkt – bzw. das, was am meisten Interesse gefunden hat – ist die Qualität der Ergebnisse, die neuronale Netze in der Bilderkennung liefern. Sehr eindrucksvoll ist das in der Grafik zu sehen. Sie zeigt die Ergebnisse des ImageNet-Wettbewerbs der letzten acht Jahre. Die teilnehmenden Teams sind mit der Entwicklung von Tools zur automatischen Erkennung von Bildinhalten beauftragt. Man sieht, wie sich die Erkennung von Jahr zu Jahr verbessert hat. Dazu muss man wissen, dass ein Mensch bei diesem Test eine Genauigkeit von etwa 95 % erreicht. In den letzten Jahren haben die »Deep Networks« also besser abgeschnitten als der Mensch.

Dieser Fortschritt ist mehreren Faktoren zu verdanken. Einer davon ist die
Verfügbarkeit riesiger Datenmengen, die benötigt werden, um die vielen Ebenen eines Deep-Learning-Modells zu trainieren. Eine zweite ist die Hardware-Entwicklung. GPUs und andere Beschleuniger sind immer schneller geworden, und sie sind in der Lage, die Berechnungen zur Auswertung dieser Deep Networks unglaublich schnell durchzuführen. Das ist eine notwendige Voraussetzung für das Training der Millionen von Parametern in einem Deep Network.

Ein dritter, weniger beachteter Faktor liegt in der Mathematik. Trainings- und Auswertungsalgorithmen haben sich weiterentwickelt, um bei reduzierter Präzision (z.B. einfache Genauigkeit, 16-bit-Gleitkomma mit halber Genauigkeit und Binary Float16) die Geschwindigkeit zu verbessern. Dies hat die Verwendung komplizierterer Netzwerke ermöglicht, z.B. solche, die DAGs oder »Directed Acyclic Graphs« (gerichtete azyklische Graphen) verwenden. Dies wiederum hat zu neuen Fähigkeiten in Netzwerken und den Arten von Daten geführt, die erforscht werden können, und damit zu den Anwendungen, für die Deep Learning eingesetzt werden kann.

Elektronik: Neuronale Netze, die Kernelemente des maschinellen Lernens, existieren in mehreren Topologien. Wie finde ich heraus, welche Art von neuronalen Netzen für meine Aufgabe am besten geeignet ist?

Jim Tung: Da möchte ich klarstellen, dass Neuronale Netze Kernelemente speziell für das Deep Learning sind. Sie sind nicht für andere maschinelle Lernansätze gedacht. Die erste Frage ist, mit welcher Art von Daten Sie arbeiten: Bilder oder Bildsequenzen in der Bildverarbeitung, Zeitreihen-Daten, Text usw. Man weiß heute recht gut, welche Netzwerktypen für welche Arten von Daten am besten geeignet sind, und wir haben diese Informationen in unsere Produktdokumentation (von Matlab/Simulink, d. Red.) aufgenommen.

Der nächste Schritt ist die Definition der Netzwerkarchitektur. Eine Herangehensweise besteht darin, ein Netzwerk von Grund auf neu zu entwerfen und zu trainieren. Dies erfordert jedoch mehr Trainingsdaten, GPU-Zyklen, Trainingszeit und tiefes Fachwissen als es die meisten Menschen normalerweise haben, sodass es meistens nicht der beste Ansatz ist. Stattdessen ist es in der Regel sinnvoller, ein vortrainiertes Netzwerk zu wählen, insbesondere eines, das auf Daten basiert, die den Daten ähneln, die Sie haben, und es dann entweder so zu verwenden, wie es ist, oder es durch einen Prozess namens »Transferlernen« an Ihre spezifischen Bedürfnisse anzupassen.

Es kann schwierig sein, ein vortrainiertes Netzwerk zu finden, da sie typischerweise in einem von mehreren Deep-Learning-Frameworks wie TensorFlow, Caffe usw. beschrieben werden, und diese Frameworks sind nicht gerade für ihre Interoperabilität, Versionskompatibilität oder Benutzerfreundlichkeit für Nicht-Spezialisten bekannt. Um dies zu erreichen, haben wir die beliebtesen vortrainierten Netzwerke direkt aus Matlab heraus zugänglich gemacht. Wir bieten auch die Interoperabilität zwischen Matlab und anderen gängigen Deep Learning Frameworks, entweder direkt oder über das Datenformat ONNX.

Nachdem Sie ein oder mehrere vortrainierte Netzwerke ausgewählt haben, werden die Transfer-Lernschritte iterativ unter Verwendung Ihrer eigenen Daten durchgeführt. Einige Leute ziehen es vor, dies durch Programmierung zu tun, zum Beispiel in Matlab, während andere eine garfische Benutzerschnittstelle bevorzugen. So oder so, Visualisierungstools sind sehr hilfreich bei der Beurteilung der Leistung des Netzwerks für Sie.

Elektronik: Die Menschen befürchten, dass die KI menschliche Entscheidungen überflüssig macht. Machen wir uns nichts vor: Das ist wahr, ein Computer kann viel mehr Parameter für eine Entscheidung berücksichtigen als ein Mensch. Stimmt Sie diese Entwicklung nicht bedenklich?

Jim Tung: Für spezifische und sehr repetitive Aufgaben kann die KI einen Menschen entlasten und ihn dabei unterstützen, bessere und sicherere Entscheidungen zu treffen. Hier kann ich die KI als hilfreichen Assistenten für den Menschen betrachten, indem ich alltägliche und sich wiederholende Aufgaben abgebe und der Person mehr Einblicke und Informationen für komplexere Arbeiten zur Verfügung stelle. Ein Beispiel dafür ist die KI zur Objekterkennung an Traktoren oder Baustellenfahrzeugen; KI kann auch Objekte, Personen oder Tiere auf einer Baustelle erkennen und den Fahrer warnen, damit er auf unvorhergesehene Situationen reagieren kann.

In Fällen, in denen die Arbeit eines Menschen thematisch stark eingegrenzt ist, kann dies die KI übernehmen und den Mensch überflüssig machen. Ich fürchte mich nicht davor, denn es ist eine Chance für Fortschritte. Allerdings würde es tatsächlich Fortschritte geben, wenn wir diese Menschen so qualifizieren könnten, dass sie sich auf die komplexeren Aufgaben und Entscheidungen konzentrieren können, die die KI nicht erfüllen kann. Wie bei früheren Innovationsschüben müssen auch hier Industrie, Wissenschaft, Politik und Gesellschaft Maßnahmen ergreifen, um den Betroffenen bei der Umschulung zu helfen. Nicht zuletzt deshalb habe ich mich während meiner gesamten Karriere für Bildungstrends interessiert, nicht nur an Schulen und Universitäten, sondern auch für die Weiterbildung in der Industrie und durch Online-Systeme.