Hard-Macro Atom-Killer Cortex-A9?

Der Dual-Core Cortex-A9 von ARM, der in einem 40-nm-Hard-Macro angeboten wird und über 2 GHz Taktfrequenz erreichen soll, kann sich nach neuesten Benchmark-Ergebnissen zur ernsthaften Bedrohung von Intels Atom-Prozessor entwickeln.

Bislang musste ARM tatenlos zusehen, wie Intel insbesondere den Netbook-Markt mit seinem Atom-Prozessor quasi im Alleingang vereinnahmte. Zwar waren die ARM-Cores Cortex-A8 und -A9 schon immer energiesparender als Atom, der die Last der x86-Kompatibilität mit sich herumträgt, die Rechenleistung reichte aber nicht einmal ansatzweise an Atom heran.

Mit dem Osprey genannten Dual-Core-Design von zwei Cortex-A9-Cores in einem Hard-Macro gehört dies der Vergangenheit an. Mit dem vom Embedded Microprocessor Benchmark Consortium (EEMBC) entwickelten Benchmark »Coremark« wurde der für Embedded-Systeme ausgelegte Atom N270, ein Single-Core-Prozessor, der mit 1,6 GHz getaktet wird, mit zwei Osprey-Designs verglichen. Ersteres wurde mit 2 GHz getaktet und soll laut ARM Atom um Faktor 2,5 geschlagen haben, ein weiteres mit 800 MHz immer noch leicht über der Atom-Leistung liegen. Obwohl keine genaue Coremark-Ergebnisse von ARM veröffentlicht wurden, klingt diese Behauptung auf Grund der Drystone-Ergebnisse plausibel: Der Atom N270 kommt auf 3900 DMIPS, während Osprey auf 10000 DMIPS (2 GHz) bzw. 4000 DMIPS (800 MHz) kommt.

Besonders wehtun dürfte Intel die Tatsache, dass Osprey statt 24,18 mm2 nur 6,7 bzw 4,9 mm2 Silizium beansprucht und im aktiven Modus statt 2,5 W nur 1,9 bzw. 0,5 W aufnimmt (erster Wert jeweils für die 2 GHz-Version, der zweite für die 800 MHz-Version).

Seit den Zeiten eines ARM922 und ARM 926 gab es keine Hard-Macros mehr, da ARM selbst argumentiert hatte, dass hiermit die Variabilität reduziert würde. So enthält Osprey eine Neon-SIMD-Engine und eine Fliesskomma-Einheit, primär um Video- und Multimedia-Anwendungen zu unterstützen - Designer von Netzwerk-SoCs werden wohl nur wenig auf diese zurückgreifen. Ein Grafikprozessor ist dagegen nicht enthalten.

Etwas überraschend wurde die Intrinsity-Fast14-Logik, mit deren Hilfe Samsung seinen Cortex-A8-Prozessor auf über 1 GHz brachte, nicht implementiert, auch wenn ARM diese nicht generell für zukünftige Versionen ausschliesst.

Osprey beinhaltet die üblichen von ARM bekannten Energiesparansätze: Clock-Gating, sechs unabhängige Power-Domänen, Abschalten der Versorgungsspannung von signifikaten Teilen des Prozessors, wenn keine Befehle in der Pipeline stecken, Abschalten der Integer-Pipeline mit SRAM-Retention und separte Steuerung der Spannung an Cache und Cache-Controller.

Ein Argument kann Intel dennoch in die Wagschale werfen: Dank 100prozentiger x86-Kompatibilität kann Windows ausschließlich auf Intel-Netbooks laufen. Und solange die Endkunden Microsoft-Software nachfragen, kann ARM einen 100000 DMIPS-Prozessor mit 1 nW Leistungsaufnahme bringen – es wird nichts helfen. Im Bereich Drucker, Smartphones, MIDs, Fernseher und andere Multimedia-Endgeräte könnte Osprey hingegen einen neuen Maßstab setzen, der eine Ausbreitung von Atom-Designs von Anfang an verhindert.