Cadence Tensilica Vision Q7 DSP IP Core Doppelte Vision- und KI-Leistung für Automotive

Der neue Cadence Tensilica Vision Q7 DSP erreicht durch optimierte Befehlssatz-Erweiterungen für SLAM-Algorithmen bis zu 1,82 TOPS.
Der neue Cadence Tensilica Vision Q7 DSP erreicht durch optimierte Befehlssatz-Erweiterungen für SLAM-Algorithmen bis zu 1,82 TOPS.

Cadence erweitert den oberen Bereich der Tensilica Vision DSP Serie mit dem Vision Q7 DSP, der bis zu 1,82 TOPS erreicht. Der Baustein wurde speziell für SLAM-Operationen optimiert, ein Verfahren, das z.B. zum Einsatz kommt, um automatisch eine Karte einer unbekannten Umgebung zu erstellen.

Die steigende Nachfrage bei Bildsensoren in Edge-Anwendungen hat ein entsprechendes Wachstum im Markt für Embedded-Vision zur Folge. Die aktuellen Bildanwendungen erfordern eine Mischung aus Bildverarbeitung und künstliche Intelligenz, wodurch die entsprechenden Edge-SoCs eine flexible und leistungsfähige Bildverarbeitungs- und KI-Lösungen enthalten und eine niedrige Leistungsaufnahme aufweisen müssen. Außerdem wird bei Edge-Anwendungen mit einer integrierten Kamera gefordert, dass ein Vision-DSP eine Vor- oder Nachbearbeitung vor einer KI-Aufgabe ausführen kann. Für eine SLAM-Verarbeitung benötigt das entsprechende Edge-SoC auch eine Offload-Engine, um die Leistung erhöhen, die Latenz reduzieren und eine niedrigere Leistungsaufnahme für batteriebetriebene Geräte gewährleisten zu können. Da bei SLAM-Operationen sowohl eine Fest- als auch eine Fließkomma-Arithmetik zum Einsatz kommt, um die notwendige Genauigkeit zu erreichen, muss ein für SLAM-Operationen verwendeter Vision-DSP eine hohe Rechenleistung für beide Datentypen zur Verfügung stellen.

Mit seiner geringen Stromaufnahme sowie den Architektur- und Befehlssatz-Erweiterungen ist der Vision Q7 DSP ideal für anspruchsvolle Edge-Vision- und KI-Verarbeitungsanforderungen geeignet und gewährleistet eine hohe Leistungsfähigkeit in verschiedenen wichtigen Bereichen:

  • Die VLIW-SIMD-Architektur erreicht eine bis zu 1,7-fach höhere TOPS-Leistung als der Vision Q6 DSP bei gleicher Fläche
  • ŸEin erweiterter Befehlssatz unterstützt 8/16/32-Bit Datentypen und eine optionale VFPU-Unterstützung für einfache und halbe Genauigkeit ermöglicht eine bis zu doppelt so hohe Leistung bei SLAM-Kernels im Vergleich zu Vision Q6 und Vision P6 DSPs
  • ŸBietet eine bis zu doppelt so hohe Leistung bei FLOPS/mm2 sowohl für FP16 als auch für FP32 im Vergleich zu Vision Q6 und Vision P6 DSPs
  • Bietet eine bis zu doppelte KI-Leistung bei gleicher Fläche im Vergleich zum Vision Q6 DSP, was eine bis zu doppelte Verbesserung bezogen auf GMAC/mm2 im Vergleich zum Vision Q6 DSP bedeutet

Für KI-Anwendungen stellt der Vision Q7 DSP eine flexible Lösung zur Verfügung, die 512 8-Bit-MACs enthält, während beim Vision Q6 DSP nur 256 MACs vorhanden sind. Um eine höhere KI-Leistung zu erreichen, kann der Vision Q7 DSP mit dem Tensilica DNA 100 Prozessor gekoppelt werden. Neben einer höheren Rechenleistung zeichnet sich der Vision Q7 DSP durch mehrerer iDMA Erweiterungen einschließlich 3D DMA, Komprimierung und AXI 256-Bit-Schnittstelle aus. Der Vision Q7 DSP ist eine Obermenge des Vision Q6 DSP, der die vorhandenen Software-Investitionen schützt und eine einfache Migration von Vision Q6 oder Vision P6 DSPs ermöglicht.

Der Vision Q7 DSP unterstützt KI-Anwendungen, die mit Caffe, TensorFlow und TensorFlowLite Frameworks und dem Tensilica Xtensa Neural Network Compiler (XNNC) entwickelt wurden, der neuronale Netze in ausführbaren und hoch optimierten Code für den Vision Q7 DSP umwandelt. Der Vision Q7 DSP unterstützt auch das Android Neural Network (ANN) API zur KI-Beschleunigung in Geräten mit Android-Betriebssystem. Die Softwareumgebung bietet auch einen vollständigen und optimierten Support für mehr als 1.700 OpenCV-basierte Vision-Bibliotheken, was eine schnelle High-Level-Migration von vorhandenen Vision-Anwendungen ermöglicht. Außerdem wurden Entwicklungstools und Bibliotheken für SoC-Anbieter entwickelt, um eine ISO-26262-ASIL-D-Zertifizierung zu erreichen.

Der Baustein wurde bereits als Muster ausgeliefert und ist voraussichtlich ab dem zweiten Quartal 2019 allgemein verfügbar.