Memristor-Prozessor Wie KI in Smartphones und Edge-Geräte kommt

In dem Prototypen des programmierbaren Memristor-Chips, den das Team um Prof. Lu von der University of Michigan demonstriert hat, arbeiten rund 5.800 Memristoren. Würde man den Chip mit Hilfe heute üblicher Prozesstechniken fertigen, so könnten Millionen von Memristoren integriert werden.
In dem Prototypen des programmierbaren Memristor-Chips, den das Team um Prof. Lu von der University of Michigan demonstriert hat, arbeiten rund 5.800 Memristoren. Würde man den Chip mit Hilfe heute üblicher Prozesstechniken fertigen, so könnten Millionen von Memristoren integriert werden.

Den ersten programmierbaren Memristor-Chip haben Wissenschaftler an der University of Michigan entwickelt.

Damit will die Gruppe um Prof. Wei Lu Künstliche Intelligenz (KI) direkt in kleine Geräte wie Sensorknoten und Smartphones bringen, in denen nur wenig Energie zur Verfügung steht. »Jeder würde gerne einen KI-Prozessor in ein Smartphone einbauen, allerdings würde er die Batterie sehr schnell entleeren«, sagt Wei Lu, Professor für Electrical and Computer Engineering an der University of Michgan.

Das liegt daran, dass heute Neuronale Netze über Software auf digitale Prozessoren abgebildet werden. Das erfordert umfangreiche Berechnungen und es müssen große Datenmengen zwischen den Prozessoreinheiten und Speichern hin und hergeschoben werden. Deshalb erfordert die Berechnung auf Basis herkömmlicher Prozessoren viel Energie und Zeit. Ist die Hardware auf die dazu erforderlichen Berechnungen zugeschnitten, dann funktioniert es besser. So liegen die Leistungsaufnahme und der Durchsatz von GPUs um den Faktor 10 bis 100 besser als bei herkömmlichen Prozessoren. »Auf Memristors basierende KI-Prozessoren könnten dies noch einmal um den Faktor 10 bis 100 verbessern«, so Wei Lu.

Denn Memristoren (auch Resistive RAMs genannt) funktionieren analog. Derzeit arbeiten viele Firmen, Universitäten und Forschungseinrichtungen daran, neue alternative nichtflüchtige Speichertechniken auf ReRAM-Basis für KI nutzbar zu machen. Bisher sind aber die Speicher-Arrays und die Prozessoreinheiten getrennt voneinander. Weil Memristoren Speicher und Widerstand kombinieren und damit Informationen am selben Ort gespeichert und verarbeitet werden können, umgehen die neuen KI-Prozessoren auf Basis dieser Komponenten auch den bisherigen Flaschenhals zwischen den Prozessoren und den externen Speichern.

Würde ein solcher Memristor-Prozessor in einem Smartphone arbeiten, so müssten etwas Spachkommandos nicht erst zur Analyse in die Cloud geschickt werden, was die Reaktionszeit stark verkürzen würde.

Insbesondere wenn es um Maschinenlernen geht, fallen die Vorteile das ins Gewicht. Denn dazu müssen riesige Datenmengen verarbeitet werden, etwa in der Bilderkennung. Die dazu erforderlichen Algorithmen laufen heute bevorzugt in GPUs ab, weil deren Hardware auf diese Aufgaben besser zugeschnitten ist als die der Prozessoren. GPUs erreichen deshalb eine um den Faktor 10 bis 100 bessere Leistungsaufnahmen und Durchsätze. »Auf Memristoren basierende KI-Prozessoren könnten dies noch einmal um den Faktor 10 bis 100 verbessern«, so Wei Lu.

Denn jeder Memristor kann seine eigenen Berechnungen durchführen. Das erlaubt es, in einem Core Tausende von Opertionen parallel ablaufen zu lassen. In dem Prototypen, den das Team um Prof. Lu demonstriert hat, arbeiten rund 5.800 Memristoren. Würde man den Chip mit Hilfe heute üblicher Prozesstechniken fertigen, so könnten Millionen von Memristoren integriert werden.

Memristoren sind besonders geeignet, um neuronale Netze aufzubauen. Denn die für KI-Algorithmen erforderlichen Matrizenberechnungen lassen sich direkt auf ihnen abbilden. Simuliert man dagegen neuronale Netze über Software auf digitalen Prozessoren, dann müssen komplizierte Matrizenberechnungen durchgeführt und große Datenmengen in Speichern eingeschrieben und ausgelesen werden. Diese Matrizenberechnungen muss der KI-Prozessor von Prof. Lu nicht durchführen, weil die Gewichtungen direkt über den variablen Widerstand der Memristoren in das Netz eingehen. Damit kommen sie der Arbeitsweise biologischer Neuronen sehr viel näher als es die Simulation neuronaler Netze auf herkömmlichen Prozessoren gestattet. Deshalb konnten Memristor-Speicher schon bisher Maschinenlernen stark beschleunigen. Sie benötigten jedoch externe Prozessorfunktionen, um sie ins das System einzubinden. Diesen Flaschenhals konnten sie also nicht umgehen.

Das Team um Prof. Lu sowie Associate Prof. Zhengya Zhang und Prof. Michael Flynn von der Univerity of Michigan haben nun einen Chip entwickelt, auf dem sowohl das Memristor-Array als auch die übrigen Elemente integriert sind, die für den Betrieb und die Programmierung erforderlich sind, wie die Wissenschaftler in der Studie “A fully integrated reprogrammable memristor–CMOS system for efficient multiply–accumulate operations.” beschrieben haben.

Auf dem Chip arbeiten ein herkömmlicher digitaler Prozessor (OpenRISC) sowie das analoge Memristor-Array. Schnittstellen und mehrere Hundert speziell ausgelegte A/D-und D/A-Wandler vermitteln zwischen der analogen Matrix und den digitalen Einheiten. Das Team hat nicht nur die Hardware entwickelt und in der »Lurie Nanofabrication Facility« der University of Michgan gefertigt, sondern auch die Software erstellt, die erforderlich ist, um die Lernalgorithmen auf das Memristor-Array abzubilden. Das hat funktioniert: Der Chip konnte schlecht geschriebene griechische Buchstaben zu 100 Prozent erkennen und er konnte aus Bruchteilen vollständige Bilder rekonstruieren und sie zu 100 Prozent richtig erkennen. Außerdem realisierten sie ein zweistufiges neuronales Netz, das in der Lage ist, Muster in komplexen Daten zu erkennen, ohne vorher mit ausgewählten Bildern angelernt worden zu sein. Dem Netz wurden zudem Brustkrebsuntersuchungen vorgelegt. Es musste dann die wichtigen Strukturen erkennen und war danach in der Lage, auf den Bildern zwischen gut- und bösartigen Tumoren zu unterscheiden – mit einer Genauigkeit von 94,6 Prozent erkennen.

Noch kann der Demonstrationschip nicht direkt für Geräte des täglichen Gebrauchs eingesetzt werden. Die Memristoren lassen sich noch nicht mit der Präzision in großen Stückzahlen herstellen, wie das für verlässlich arbeitende kommerzielle Geräte erforderlich wäre. Und die Informationen lassen sich in der analogen Speichermatrix noch nicht mit der Zuverlässigkeit speichern, die heute für digitale Speicher selbstverständlich sind. Doch das Team um Prof. Lu arbeitet daran, auch diese Hürden zu nehmen, um schließlich den kommerzeilen Einsatz zu ermöglichen.

Dass dies schon bald funktioniert, davon ist Prof. Lu überzeugt. Denn er hat bereits mit MemryX eine Firma gegründet, der kommerzielle Chips auf Basis der Technik entwickeln soll. Lu ist auf diesem Gebiet kein Unbekannter, denn er stand auch hinter der Gründung der ReRAM-Firma Crossbar im Jahr 2010. Erst kürzlich hatte Microsemi den ReRAM-IP von Crossbar lizenziert. Beide Firmen werden daran arbeiten,  ReRAM-Technik in die ICs von Microsemi zu integrieren, die mit Hilfe von Prozesstechnologien unter 20 nm gefertigt werden. Die ReRAMs von Crossbar lassen sich mit Strukturgrößen bis unter 10 nm auf Basis von Standard-CMOS-Prozessen fertigen. Sie eignen sich für die Integration in ICs, die Einsatz im Edge-Computing, im KI-Umfeld, Industrie 4.0 und Automotive finden.

In dem Prototypen des programmierbaren Memristor-Chips, den das Team um Prof. Lu von der University of Michigan demonstriert hat, arbeiten rund 5.800 Memristoren. Würde man den Chip mit Hilfe heute üblicher Prozesstechniken fertigen, so könnten Millionen von Memristoren integriert werden.