Untether AI
Die »speedAI«-Komponenten (Codenamen »Boqueria«) von Untether AI kommen auf 30 TFlops/W und eine Leistung von 2 PetaFlops. Die hohe Energieeffizienz dieser Bausteine ist darauf zurückzuführen, dass sie auf der zweiten Generation der »At-Memory«-Architektur basieren, dass sie über mehr als 1.400 optimierte RISC-V-Prozessorkerne mit benutzerdefinierten Befehlen verfügen, ein energieeffizienter Datenfluss möglich ist und ein neuer FP8-Datentyp. Alles zusammen hat zur Vervierfachung der Effizienz im Vergleich zur vorherigen Generation der runAI-Bausteine beitragen. Das erste Mitglied der Familie, der »speedAI240«-Baustein, kommt auf eine Leistung von 2 PetaFlops mit dem FP8-Datentyp und auf 1 PetaFlop bei dem BF16-Datentyp. Dies führt laut Unternehmensangabe zu einer branchenführenden Leistung und Effizienz bei neuronalen Netzen wie BERT, die speedAI240 mit über 750 Abfragen pro Sekunde und Watt (qps/w) ausführen kann, 15-mal mehr als der aktuelle Stand der Technik bei führenden GPUs.
www.untether.ai