Untether AI

KI-Chip mit sehr hoher Leistung und Effizienz

24. August 2022, 9:08 Uhr | Iris Stroh
© AdobeStock

Untether AI hat seine Architektur der nächsten Generation zur Beschleunigung von KI-Inferenz-Workloads vorgestellt. Die »speedAI«-Komponenten (Codenamen »Boqueria«) kommen auf 30 TFlops/W und eine Leistung von 2 PetaFlops.

Diesen Artikel anhören

Untether AI hatte 2020 seine runAI-Prozessoren auf den Markt gebracht, die damals noch mit 8 TOPS/W bei Int8 aufwarten konnten. Die neue speedAI-Architektur übertrifft diesen Wert mit 30 TFlops/W noch einmal deutlich. Untether AI führt die hohe Energieeffizienz auf mehrere Punkte zurück, angefangen bei der zweiten Generation der »At-Memory«-Architektur, über die mehr als 1.400 optimierten RISC-V-Prozessorkerne mit benutzerdefinierten Befehlen, bis hin zu einem energieeffizienten Datenfluss und einem neuen FP8-Datentyp. Alles zusammen habe zur Vervierfachung der Effizienz im Vergleich zur vorherigen Generation der runAI-Geräte beitragen. Das erste Mitglied der Familie, der speedAI240-Baustein, kommt auf eine Leistung von 2 PetaFlops mit dem FP8-Datentyp und auf 1 PetaFlop bei dem BF16-Datentyp. Dies führt laut Unternehmensangabe zu einer branchenführenden Leistung und Effizienz bei neuronalen Netzen wie BERT, die speedAI240 mit über 750 Abfragen pro Sekunde und Watt (qps/w) ausführen kann, 15-mal mehr als der aktuelle Stand der Technik bei führenden GPUs.

speedAI-Bausteine werden sowohl als Standalone-Chips als auch in einer Vielzahl von m.2- und PCI-Express-Formfaktor-Karten angeboten. Die Bemusterung von speedAI240 und -Karten für Early-Access-Kunden wird voraussichtlich in der ersten Hälfte des Jahres 2023 beginnen.


Lesen Sie mehr zum Thema


Das könnte Sie auch interessieren

Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu elektroniknet

Weitere Artikel zu Mikroprozessoren