Das Referenzdesign für multimodale KI-Verarbeitung kann Sprach- und Bilddaten verarbeiten und kombiniert dazu Chips von Renesas und Syntiant.
Das Referenzdesign RZV-SYNTIANT-MVV zielt auf Systeme, die mehrere Eingabedatenströme – in diesem Fall Bild und Sprache – verarbeiten. Das können z.B. Self-Checkout-Automaten, Sicherheitskameras und Videokonferenzsystemen sowie intelligente Geräten wie Reinigungsroboter sein.
Die neue Lösung kombiniert den Vision-KI-Mikroprozessor RZ/V2M von Renesas mit dem »Neural Decision Processor« NDP120 von Syntiant für die Spracherkennung. Die Kombination bietet eine Always-on-Funktionalität mit schneller sprachgesteuerter Aktivierung aus dem Standby-Modus zur Durchführung von Objekterkennung, Gesichtserkennung und anderen bildgesteuerten Aufgaben. Während beispielsweise benutzerdefinierte Sprachhinweise die Aktivierung und den Systembetrieb steuern, verfolgt die KI-Erkennung das Verhalten des Bedieners und steuert den Betrieb oder gibt eine Warnung aus, wenn verdächtige Aktionen erkannt werden.
Die multimodale Architektur erleichtert die Entwicklung kontaktloser Benutzerinteraktionen auf Basis von KI-Algorithmen. Der dedizierte, stromsparende Chip für die Spracherkennung reduziert die Stromaufnahme im Standby-Modus und beschleunigt die Systementwicklung, da die Software unabhängig von der Vision-KI-Funktionalität entwickelt werden kann.
Der RZ/V-Mikroprozessor für Bildverarbeitungs-KI enthält den DRP-AI-Beschleuniger (Dynamically Reconfigurable Processor-AI) von Renesas und kombiniert präzise KI-Inferenz mit optimaler Energieeffizienz. Maßnahmen zur Wärmeableitung wie Kühlkörper oder Lüfter sind nicht erforderlich.
Das Referenzdesign für die neue multimodale AI-Lösung ist ab sofort verfügbar, einschließlich Schaltplänen und Stücklisten. Weitere Informationen finden Sie unter Multimodale KI-Lösung.