Schwerpunkte

Welche Hardware ist die beste für KI?

Von unter 1 MOPS bis hin zu 1000 TOPS

12. Oktober 2020, 16:00 Uhr   |  Iris Stroh

Von unter 1 MOPS bis hin zu 1000 TOPS
© Infineon

Furtner, Infineon Technologies: »Kommerziell erhältliche Edge-NPUs leisten heute ca. 1 bis 2 TOPS/W, sind in kleineren Prozesstechnologien realisiert und verbrauchen viel Leistung durch externe Speicherzugriffe. Kleinere NPUs für einfache IoT-Anwendungen werden in älteren Technologien wie 28/22-nm-CMOS hergestellt, zeichnen sich hingegen durch eine niedrigere Leistungsaufnahme aus, weil keine externen Speicher benötigt werden.«

Inferenzieren im Edge – Anwendungsbeispiele in der Spracherkennung oder Bildverarbeitung benötigen vollkommen unterschiedlich hohe Rechenleistung.

Dementsprechend steht den Entwicklern mittlerweile eine große Auswahl an Komponenten zur Verfügung, um ihre KI im Endpunkt zu realisieren.
Auf welche Parameter, Eigenschaften oder Bedingungen muss ein Entwickler bei der Entscheidungsfindung achten, wenn er sich für eine MCU, eine MPU mit KI-Beschleuniger, ein FPGA oder ein ASSP entscheidet?

Eine einfache Antwort darauf gibt es nicht. Richard Terrill, Vice President Strategic Business Development von Blaize, ist zum Beispiel überzeugt, dass die Systemeffizienz – »Arbeit/Energie/Kosten« – ein entscheidender Parameter ist. Denn typische Werte hinsichtlich Rechenleistung oder Leistungsaufnahme gebe es bei KI nicht, alles hinge von der Aufgabe, der Geschwindigkeit und der Genauigkeit ab, mit der sie ausgeführt werden muss. Terrill: »Erst wenn ein System vollständig implementiert und in Betrieb genommen ist, kann man reale Ergebnisse in Bezug auf Durchsatz und Energieverbrauch erzielen. Darauf basierend würden die Entwickler eine Lösung auswählen. Darüber hinaus betont Terrill, dass TOPS (Tera Operations per Second) als Metrik für die Auswahl nur bedingt nützlich ist, da es darauf ankommt, wie effektiv die Rechenleistung genutzt wird. »Eine Maschine, die die Arbeit mit 1 TOPS erledigen kann, ist einer Maschine überlegen, die 2 TOPS benötigt. Es ist also wichtig, vollständige Systementwürfe zu analysieren und nicht nur Benchmarks oder Datenblatt-Angaben«, so Terrill weiter.

Schlüsselworterkennung bis zum autonomen Fahren

Auch wenn der TOPS-Wert noch nichts über die Effizienz aussagt, kann ein Überblick über die verschiedenen Anforderungen hinsichtlich der Rechenleistung zumindest eine Orientierung geben. Wo liegen also derzeit die geforderten Rechenleistungen?

Geht es um die Auswertung langsamer Umgebungssensoren, sind laut Wolfgang Furtner, Senior Principal bei Infineon Technologies, weniger als 1 MOPS (Mega Operations per Second) notwendig. Das Erkennen von einfachen akustischen Befehlen benötigt einige wenige MOPS. Geht es um natürliche Sprachverarbeitung (NLP), sieht die Sache schon ganz anders aus, denn hier sind laut Markus Levy, Director of Machine Learning Technologies von NXP Semiconductors, bereits High-End-Beschleuniger mit 2 bis 3 TOPS (Tera Operations per Second) notwendig. Für die Bildverarbeitung in einer Türklingel-Kamera mit rund 10 fps (Bilder pro Sekunde) »reichen MCUs mit geringem Stromverbrauch«, so Levy weiter, und Furtner fügt hinzu: »Hochauflösende Bilderkennung und Tracking mit Kameras benötigen zwischen rund 100 GOPS bis zu wenige TOPS.«

Auch im Automotive-Segment fallen die Anforderungen extrem unterschiedlich aus. So erklärt Eric Pinton, Director Automotive Solution Business Unit bei Renesas Electronics, dass für isolierte ADAS-Funktionen wie Verkehrszeichenerkennung, Hinderniserkennung 1 TOPS ausreichend wären. Für fortschrittliche Funktionen wie Hindernisumgehung, automatisiertes Fahren (unter Kontrolle des Fahrers), oder die Kombination einzelner Funktionen sind rund 10 TOPS erforderlich. Autonomes Fahren unter bestimmten Bedingungen wie auf der Autobahn ohne Kontrolle des Fahrers benötigen schon bis 100 TOPS. Und: »Für vollständig autonome Fahrzeuge sind 1000 TOPS notwendig«, so Pinton weiter.

1 MOPS bis 1000 TOPS – eine große Spanne. In dem einen Fall reichen Standard-Mikrocontroller, in anderen Fällen sind High-End-Anwendungsprozessoren mit dediziertem NN-Beschleuniger erforderlich. Stefano Tansini, Senior Manager IoT and Infrastructure Business Unit bei Renesas Electronics, zeigt, dass auch im Industriebereich die Leistungsanforderungen sehr unterschiedlich ausfallen: »Eine KI im Edge zur Beurteilung der Richtigkeit oder Anomalie von Signalverläufen ist mit Standard-MCUs oder MPUs möglich, ohne dass eine Beschleuniger-IP erforderlich ist. Eine Echtzeit-Bildverarbeitung zur Erkennung von Anomalien wiederum erfordert MPUs mit mehreren ARM-Kernen und/oder GPU aus der 100-GOPS/W-Klasse.«

Seite 1 von 3

1. Von unter 1 MOPS bis hin zu 1000 TOPS
2. Mindestverarbeitungsleistung von 30 fps
3. FPGAs

Auf Facebook teilenAuf Twitter teilenAuf Linkedin teilenVia Mail teilen

Das könnte Sie auch interessieren

NXP beschleunigt ML-Anwendungen durch Glow-Compiler
Syntiant bringt KI in Edge-Geräte
Wie lässt sich mit KI Geld verdienen?
Gesetzliche Regeln für künstliche Intelligenz gefordert
KI wird allgegenwärtig
KI viel seltener genutzt als gedacht
Robotik und KI erobern die Inspektion
Neuronale-Netzwerk-Beschleuniger
KI trainieren ohne den Datenschutz zu verletzen

Verwandte Artikel

INFINEON Technologies AG Neubiberg, IMEC vzw, NXP Semiconductors Germany, Renesas Electronics Europe GmbH, STMicroelectronics GmbH, LATTICE Semiconductor GmbH, XILINX GmbH, Molex Deutschland GmbH