Untether AI

KI-Chip mit sehr hoher Leistung und Effizienz

24. August 2022, 9:08 Uhr | Iris Stroh
künstliche Intelligenz
© AdobeStock

Untether AI hat seine Architektur der nächsten Generation zur Beschleunigung von KI-Inferenz-Workloads vorgestellt. Die »speedAI«-Komponenten (Codenamen »Boqueria«) kommen auf 30 TFlops/W und eine Leistung von 2 PetaFlops.

Untether AI hatte 2020 seine runAI-Prozessoren auf den Markt gebracht, die damals noch mit 8 TOPS/W bei Int8 aufwarten konnten. Die neue speedAI-Architektur übertrifft diesen Wert mit 30 TFlops/W noch einmal deutlich. Untether AI führt die hohe Energieeffizienz auf mehrere Punkte zurück, angefangen bei der zweiten Generation der »At-Memory«-Architektur, über die mehr als 1.400 optimierten RISC-V-Prozessorkerne mit benutzerdefinierten Befehlen, bis hin zu einem energieeffizienten Datenfluss und einem neuen FP8-Datentyp. Alles zusammen habe zur Vervierfachung der Effizienz im Vergleich zur vorherigen Generation der runAI-Geräte beitragen. Das erste Mitglied der Familie, der speedAI240-Baustein, kommt auf eine Leistung von 2 PetaFlops mit dem FP8-Datentyp und auf 1 PetaFlop bei dem BF16-Datentyp. Dies führt laut Unternehmensangabe zu einer branchenführenden Leistung und Effizienz bei neuronalen Netzen wie BERT, die speedAI240 mit über 750 Abfragen pro Sekunde und Watt (qps/w) ausführen kann, 15-mal mehr als der aktuelle Stand der Technik bei führenden GPUs.

speedAI-Bausteine werden sowohl als Standalone-Chips als auch in einer Vielzahl von m.2- und PCI-Express-Formfaktor-Karten angeboten. Die Bemusterung von speedAI240 und -Karten für Early-Access-Kunden wird voraussichtlich in der ersten Hälfte des Jahres 2023 beginnen.


Das könnte Sie auch interessieren

Verwandte Artikel

elektroniknet

Künstliche Intelligenz