Startseite > Embedded > Entwicklungstools > Neuronale Netze auf FPGAs umsetzen

Workflow hilft Entwicklern

Neuronale Netze auf FPGAs umsetzen

9. August 2021, 15:00 Uhr | Von Dimitri Hamidi, Jack Ericson und Wang Chen, The MathWorks

In Embedded-Systemen spielt Deep Learning auf FPGAs eine immer größere Rolle. Jedoch sind für für die Umsetzung tiefe Kenntnisse der Hardware nötig. Ein Workflow von MathWorks hilft Entwicklern dabei, neuronale Netze auf FPGAs zu implementieren.

▶ Diesen Artikel anhören

Künstliche Intelligenz (KI) treibt einen Technikwandel in nahezu allen Branchen und Anwendungsbereichen voran. In der Welt der KI gilt Deep Learning als Schlüsseltechnologie für verschiedene Bereiche wie autonome Systeme, Industrie 4.0 oder die »intelligente« Produktion. Aufgrund der besonderen Kombination von Eigenschaften wie Parallelität, Rekonfigurierbarkeit, geringer Latenzzeit, flexibler Schnittstellen sowie der Leistung pro Watt eignet sich die Inferenz von Deep Learning auf FPGAs hervorragend für viele eingebettete Anwendungen. Allerdings ist das Implementieren tiefer neuronaler Netze auf FPGAs sehr herausfordernd. So enthält beispielsweise AlexNet 61 Millionen Modellparameter und benötigt 230 MB Speicherplatz auf einem Off-Chip-RAM.

Jobangebote+ passend zum Thema

MACNICA ATD EUROPE - Ihre berufliche Zukunft

MACNICA ATD Europe GmbH, Ingolstadt

Alle Jobangebote im Elektroniknet Karrierebereich anzeigen

Ein naives Implementieren würde es zudem nötig machen, 3,1 Millionen Aktivierungen im Block-RAM (BRAM) sowie 720 Millionen DSP-Slices für die Multiplikations- und Additionsoperationen (MAC) zu speichern, wie in Bild 1 dargestellt. Eine derartige Register-Transfer-Level- (RTL)-Beschreibung per Hand zu schreiben ist zeitaufwendig und fehleranfällig. Ohne sorgfältiges Implementieren und Maximieren von Ressourcen-Sharing ist ein Design aufgrund der begrenzten Logikressourcen auf einem FPGA nicht direkt zu implementieren. Unabhängig hiervon muss die Architektur so generisch sein, dass sie mit verschiedenen tiefen neuronalen Netzen wiederzuverwen-den ist und die Abwägung von Trade-offs im Entwurfsraum erlaubt. Ingenieure aus dem Bereich Deep Learning verfügen in der Regel nicht über die erforderlichen Kenntnisse im Hardware-Design und sind daher auf eine enge Zusammenarbeit sowohl mit Hardware- als auch mit Systemingenieuren angewiesen, um das angestrebte Systemdesign zu erzielen. Darüber hinaus erfordert der Entwicklungsprozess üblicherweise eine Vielzahl von Design-Iterationen sowohl für die Netzwerkarchitektur als auch für die FPGA-Implementierung.

Der Artikel stellt einen integrierten Workflow für das Design, Prototyping und Bereitstellen tiefer neuronaler Netze zur Inferenz auf FPGA- und SoC-basierten Edge-Geräten vor. Der integrierte Workflow bindet Algorithmen-, System- und Hardware-Teams gemeinsam ein. So ermöglicht er eine frühzeitige Zusammenarbeit und ein Beschleunigen des Entwicklungsprozesses – sowohl in der Konzept- als auch in der Implementierungsphase.

KI-gestützte Systementwicklung

Die vorgeschlagene Möglichkeit für das Deep Learning auf FPGAs ist Teil eines kompletten Frameworks für die KI-gestützte Systementwicklung mit Deep Learning als einer der tragenden Säulen. Mit Matlab und Simulink arbeitenden Ingenieuren und Wissenschaftlern bietet das Framework die nötigen Funktionen und Tools. So ist es ihnen möglich, KI-gestützte Systeme für ihre jeweiligen Spezialgebiete zu entwickeln. Bild 2 veranschaulicht den KI-gestützten Workflow für das Systemdesign. Im Folgenden sind die Phasen beschrieben.

1. Aufbereiten der Daten

Mit Matlab lässt sich der Zeitaufwand für ein Vorverarbeiten von Daten auf ein Minimum reduzieren. High-Level-Funktionen bieten auf spezifische Disziplinen zugeschnittene Transformationen sowie Funktionen zur Merkmalsextraktion. Weiterhin enthält die Software Tools zum Synchronisieren heterogener Zeitreihen, zum Filtern von Rauschen und Ausreißern sowie zum Visualisieren von Daten. So lassen sich etwa Trends erkennen und die Datenqualität beurteilen. Matlab-Apps erleichtern das automatische Ground Truth Labeling von Bild-, Video-, Lidar- und Signaldaten. Zum Vortraining und Testen von Algorithmen, noch bevor Daten von Sensoren oder anderen Geräten verfügbar sind, lassen sich mit Matlab und Simulink zudem synthetische Daten erzeugen.

2. Modellieren des KI-Modells

Matlab gestattet es, tiefe neuronale Netze grafisch zu erzeugen, zu trainieren und auszuwerten sowie eine große Anzahl an Deep-Learning-Experimenten effizient und systematisch zu verwalten. Anwender können ferner mit »TensorFlow« und »PyTorch« Modelle im Open-Neural-Network-Exchange- (ONNX)-Format austauschen sowie Modelle aus TensorFlow-Keras und Caffe direkt importieren.

3. Systemdesign

Komplexe KI-gestützte Systeme erfordern die Integration weiterer Algorithmen. Ein Modellieren und Simulieren des Modells ist hierzu unerlässlich, da die Effektivität der KI-Modelle vom Gesamtsystem abhängt.

Zum Erzeugen und Analysieren von Systemarchitekturen eignet sich »System Composer« von MathWorks. Für schnelle Design-Iterationen und Closed-Loop-Tests können Ingenieure auf Simulink zurückgreifen. So wird Simulink beispielsweise in Systemen für das autonome Fahren zum Modellieren der Fahrzeugdynamik, zum Entwickeln der Fahrzeugsteuerung sowie zur Fusion verschiedener Sensorsignale eingesetzt. Außerdem lässt sich das KI-Modell zur System-Level-Simulation in Simulink einbinden.

4. Bereitstellung

Entwickler können KI-Modelle zusammen mit anderen in Matlab und Simulink entworfenen Algorithmen über automatische Codegenerierung auf CPUs, GPUs oder FPGAs im späteren System bereitstellen und integrieren.

Neuronale Netze auf FPGAs umsetzen
Workflow für das Deep Learning auf FPGAs

Für die autonome Fabrik

KI-Mehrwertdienste von anacision

Mit Intel-Prozessoren der 11. Generation

5 neue Computermodule verfügbar

Sommerlektüre für Entwickler

Die Top-10 der Maker & Developer

Künstliche Intelligenz

Experte erwartet Wettrüsten mit Hackern

Funktionale Sicherheit von Software

Statische Code-Analyse für dynamische Teams

6 Gigawatt

Strategische Partnerschaf zwischen AMD und OpenAI

Workflow hilft Entwicklern

Neuronale Netze auf FPGAs umsetzen

Jobangebote+ passend zum Thema

KI-gestützte Systementwicklung

Lesen Sie mehr zum Thema

Das könnte Sie auch interessieren

Für die autonome Fabrik

KI-Mehrwertdienste von anacision

Mit Intel-Prozessoren der 11. Generation

5 neue Computermodule verfügbar

Sommerlektüre für Entwickler

Die Top-10 der Maker & Developer

Künstliche Intelligenz

Experte erwartet Wettrüsten mit Hackern

Funktionale Sicherheit von Software

Statische Code-Analyse für dynamische Teams

Weitere Artikel zu Künstliche Intelligenz (KI)

6 Gigawatt

Strategische Partnerschaf zwischen AMD und OpenAI

EU-Strategie für KI

„AI first“ soll Europas KI-Wettbewerbsfähigkeit stärken

MathWorks

Mit KI-basiertem MATLAB Copilot produktiver werden

HOSE&SPÖRRLE: Mensch. Maschine. Morgen.

Folge 11: Digitale Resilienz

»Health Electronics Summit«

Kontroverse Paneldiskussion: Wie digital ist die Versorgung 2030?

Weitere Artikel zu Entwicklungswerkzeuge

Anritsu

Evaluierung von »Hybrid eCall«

Cross-Compiler-Tests

Embedded-Tools von KMC jetzt mit SuperTest validiert

Trends in Entwicklung, Debugging + Test

Cross-Debugging von Steuergeräten auf virtuellen Prototypen

Würth Elektronik/Nexperia

Evaluierungs-Kit für eine schnelle Motorsteuerungsentwicklung

Voller Debug- und Trace-Support

TRACE32 unterstützt PX5 RTOS

Weitere Artikel zu Betriebssysteme

Jetzt noch zum Frühbucherpreis anmelden!

Zephyr Entwicklerforum am 14. Oktober in Garching

Betriebssystem für die Automatisierung

ctrlX OS ist bereit für Cyber Resilience Act

Infineon Technologies

AURIX TC3x unterstützt FreeRTOS

From X to labwc

Raspberry Pi released a new version of its »Raspberry Pi OS«

Von X zu labwc

Raspberry Pi veröffentlicht neue Version von »Raspberry Pi OS«

Weitere Artikel zu Industrie-Computer / Embedded PC

Kontron

High-End-Industrie-PC für KI und Machine Vision

Neousys / Bressner

Embedded-PCs für Machine Vision und Edge-KI

Spectra

Kompakter Box-PC für Edge Computing

embedded world Conference 2026

Der Call for Papers ist eröffnet

PowerBox 130 with Alder Lake N processor

Box PCs from Spectra for edge computing applications