Cadence Design Systems Tensilica Vision C5 DSP für neuronale Netze

Vollständiger, eigenständiger DSP erreicht eine Verarbeitungskapazität von 1 TMAC/s.
Vollständiger, eigenständiger DSP erreicht eine Verarbeitungskapazität von 1 TMAC/s.

Der Tensilica Vision C5 DSP von Cadence Design Systems ist laut Unternehmensangabe der erste eigenständige und geschlossene DSP IP Core für rechenintensive neuronale Netze.

Der Vision C5 DSP von Cadence adressiert besonders den Automotive-, Überwachungs-, Drohnen- und Mobil/Wearable-Markt und bietet eine Verarbeitungskapazität von 1 TMAC/s für alle Aufgaben aus dem Bereich der neuronalen Netze. Der optimierte Vision C5 DSP beschleunigt die Berechnungen auf allen Schichten des neuronalen Netzes (Faltung, vollständig verknüpft, Pooling und Normalisierung) und nicht nur der Faltungsfunktionen. Dadurch wird der Vision/Bildverarbeitungs-DSP von einigen Aufgaben befreit und kann die Bilderverbesserungsanwendungen unabhängig ausführen, während der Vision C5 DSP die Inferenzaufgaben abarbeitet. Durch die Vermeidung von unnötigem Datenaustausch zwischen dem neuronalen Netz DSP und demVision/Bildverarbeitungs-DSP ermöglicht der Vision C5 DSP eine Lösung mit geringerem Energieverbrauch als ein vergleichbarer Neural Network Accelerator. Zudem bietet er auch ein einfaches Ein-Prozessor-Programmiermodell für neuronale Netze.

Der Vision C5 DSP weist folgende Merkmale auf:

  • 1 TMAC/s Verarbeitungskapazität (4x höherer Durchsatz als der Vision P6 DSP) auf einer Halbleiterfläche von weniger als 1 mm2. Dies gewährleistet einen sehr hohen Verarbeitungsdurchsatz für Deep-Learning-Kernels
  • 1024 8-Bit-MACs oder 512 16-Bit-MACs für eine außergewöhnliche Leistung sowohl bei 8-Bit- als auch bei 16-Bit-Auflösung
  • VLIW SIMD Architektur mit dem 128-Wege, 8-Bit-SIMD oder 64-Wege, 16-Bit-SIMD
  • Ausgelegt für Multi-Core-Designs, ermöglicht eine Multi-TeraMAC-Lösung in kleiner Baugröße
  • Integrierte iDMA- und AXI4-Schnittstelle
  • Nutzt dasselbe bewährte Software-Toolset wie die Vision P5 und P6 DSPs
  • Im Vergleich zu anderen verfügbaren GPUs ist der Vision C5 DSP bis zu 6x schneller bei der bekannten AlexNet CNN Performance Benchmark und bis zu 9x schneller bei der Inception V3 CNN Performance Benchmark

Der Vision C5 DSP wird auch mit dem Neural Network Mapper Toolset von Cadence geliefert, das jedes neuronale Netz, das mit Tools wie Caffe und TensorFlow trainiert wurde, auf einen ausführbaren und hoch optimierten Code für den Vision C5 DSP abbildet, unter Ausnutzung eines umfangreichen Satzes handoptimierter Neurale-Netzwerk-Bibliothek-Funktionen.