Energiesparen mit 64 bit NXP’s kleinster ARMv8-Chip

Nur 1 W Leistungsaufnahme mit 64-bit-CPU, 800 MHz Taktfrequenz und zahlreichen I/O-Schnittstellen verspricht NXP für seinen kleinsten QorIQ-Prozessor. Die Konkurrenz ist daher sehr übersichtlich.

Der Low-Power-QorIQ »LS1012A« implementiert einen 64-bit-Single-Core-ARM-Cortex-A53, bis zur Vorstellung von Cortex-A35/A32 war dieser die energieeffizienteste ARMv8-CPU aus dem Hause ARM. Zielmarkt des LS1012A ist laut NXP, neben IoT-Gateways und Routern, auch die Fabrikautomatisierung. Bei der maximalen Taktfrequenz von 800 MHz soll der Chip, der selbst die hauseigenen 32-bit-LS1-SoCs in Bezug auf Fläche und Energieaufnahme schlägt, typischerweise 1 W aufnehmen. Betrachtet man allerdings die für einen so kleinen Chip zahlreichen I/O-Schnittstellen, dürfte die maximale Leistungsaufnahme rund doppelt so groß sein, wobei auch 2 W noch immer ein bemerkenswert niedriger Wert sind.

Der A53 ist mit jeweils 32 KB Cache für Daten und Instruktionen und einem 256 KB großen L2-Cache ausgestattet, daneben gibt es 128 KB SRAM auf dem Chip. Um Platz und Energie einzusparen, wurde die Schnittstelle zu externem DDR3L-Speicher 16 bit breit ausgeführt, was zu einer maximalen Bandbreite von nur 2 GB/s führt. Dies ist im Vergleich zu konkurrierenden Produkten wenig, für einen Single-Core-A53 mit 800 MHz Taktfrequenz jedoch hinreichend. Vorteil: das SoC mit nur 211 Pins passt in ein 9,6 mm großes Package. Im Vergleich dazu erfordert der kleinste 32-bit-LS1 in einem 19 mm großen FCBGA-Gehäuse schon 525 Pins.

Gespart wurde, mit Ausnahme der fehlenden DPAA2 (Data Path Acceleration Architecture, Generation 2), an kaum etwas: Zwei GbE-Controller können 2.5GbE verarbeiten, der IPSec-Durchsatz beträgt wegen der SEC-Security-Engine Version 5.5 bis zu 1,1 Gbit/s und dank SATA3-Schnittstelle braucht es keinen externen SATA-Controller. Ein PCI-Express-Controller der zweiten Generation (1 Leitung), ein USB-3-Controller mit PHY, ein USB-2.0-Controller und zahlreiche serielle Schnittstellen (u. a. QuadSPI) ergänzen das reichhaltige Peripherie-Angebot. Was den Wettbewerb angeht, steht NXPs Chip derzeit ziemlich allein auf weiter Flur da, denn die Konkurrenz im Leistungsbereich von 1 W und darunter basiert noch auf 32-bit-CPUs.

Als erstes fällt einem zu den Konkurrenten des LS1012A die Sitara-Familie von Texas Instruments ein. Der AM437x kommt mit unterschiedlich schnell getakteten Cortex-A9-CPUs (800 MHz oder 1 GHz) und nimmt mit den kleinsten Derivaten etwa 600 mW Leistung auf. Manche Modelle dieser Familie enthalten sogar eine GPU des Typs PowerVRSGX530, eine 24-bit-RGB-Schnittstelle und die PRU, das ist ein IP-Block, der in der Industrie gängige Kommunikationsprotokolle wie EtherCAT oder Profinet implementiert. Ergänzend dazu gibt es eine 32-bit-Speicherschnittstelle zu DDR3L, LPDDR2 und DDR3. Was jedoch im Vergleich fehlt, sind PCIe, SATA, USB3.0 und ein Hardwarebeschleuniger für die Verarbeitung von Datenpaketen.

Die neuen AM57x mit ihren ARM-Cortex-A15 beseitigen diese Defizite, sind jedoch deutlich teurer, haben größere Gehäuse und vor allen Dingen nehmen deutlich mehr Leistung auf – der Cortex-A15 ist ja dafür bekannt, dass er sicherlich nicht ARMs energieeffizientester Prozessor ist. Je nach Derivat werden 3 W oder mehr aufgenommen.

Broadcom hat mit dem StrataGX BCM583xx ebenfalls ein Cortex-A9-basierendes Produkt auf dem Markt, das mit 1,25 GHz getaktet wird und von der absoluten Rechenleistung her mit dem A53 bei 800 MHz mithalten kann. Die höhere Frequenz fordert Tribut in Form höherer Leistungsaufnahme (1,5 W). Weitere Defizite sind das größere Gehäuse (17 mm FCBGA-561), die langsamere Ethernet-Schnittstelle sowie der Wegfall von USB 3.0, SATA-Schnittstelle und Paket-Beschleuniger in Hardware.

Der LS1012A wird wie NXPs übrige LS1-Chips bei TSMC mit dem 28-nm-HPM-Prozess gefertigt und schätzungsweise zwischen 13 und 16 Dollar kosten (bei 1000 Stück Abnahme). Die Massenproduktion wird in Q4 2016 aufgenommen, für gute Kunden gibt es jedoch schon jetzt Muster.

Was sind NXPs Verkaufsargumente? Als erstes ist da die ARMv8-Architektur zu nennen, die eine Aufwärtsskalierung zu weiteren 64-bit-Produkten mit Cortex-A57 und zukünftig A72 zulässt und es den Kunden erlaubt, die 32-bit-Welt auch am unteren Ende der Preis/Leistungs-Skala zu verlassen. Hinzu kommen das kleine Gehäuse, die geringe Leistungsaufnahme, die schnellen Ethernet-Ports und der Hardware-Beschleuniger für die Datenpaketverarbeitung.

Der LS1012A ist ein weiterer Mosaikstein in NXPs umfangreicher QorIQ-Produktfamilie, er besetzt eine weitere der ohnehin nur noch kleinen Applikationslücken in NXPs großem Angebot. Die technischen Daten des Bauteils sind stimmig, alles weitere entscheidet wie immer der Markt.