IDF 2014 Intels Mikroarchitektur Broadwell und Core-M-SoC enthüllt

Noch immer versucht der weltgrößte Chip-Hersteller Intel, Land im von ARM dominierten Mobilgeräte-Markt zu gewinnen. Eine neue CPU-Familie mit der Bezeichnung Core-M wird im neuesten 14-nm-Prozess gefertigt und könnte zumindest am oberen Ende der Tablet-Leistungsskala erfolgreich sein.

In der Vergangenheit waren es immer die PC-Prozessoren der Core-i-Familie, die zuerst von einer neuen Mikroarchitektur und einem geschrumpften Fertigungsprozess profitieren konnten. Auf Grund der Marktgegebenheiten mit erodierenden PC- und Laptop-Verkäufen und stark wachsenden Tablet-Verkäufen hat Intel seine Strategie geändert, und als erste 14-nm-CPUs eine Reihe mit der Bezeichnung Core-M speziell für Tablets und sogenannte „Konvertibles“ aufgelegt. Für Nicht-High-End-Geräte verbleibt es beim Atom-Prozessor, der gegen die ARM-Armada ins Feld ziehen muss.

Wie immer in einem „Tick“-Jahr, in welchem ein neuer Fertigungsprozess eingeführt wird, wird die Mikroarchitektur nur begrenzt verändert, um die Risiken zu minimieren. Größere Veränderungen wird es 2015 mit der Einführung von „Skylake“, dem Nachfolger von „Broadwell“ geben. Nichtdestotrotz hat Intel auch „Broadwell“ einige Verbesserungen auf CPU- und vor allen Dingen GPU-Seite spendiert, die wir in der Folge genauer beleuchten wollen.

CPU – 5 Prozent höhere IPC als Haswell

Gegenüber Haswell wurden auf der CPU-Seite diverse Verbesserungen vorgenommen. Mit größeren Instruktions-Schedulern und Puffern sollen die CPU-Cores besser „gefüttert“ werden können, dazu wurde das Out-of-Order-Scheduler-Fenster von 60 auf 64 Einträge erweitert, um das Reordern von mehr Befehlen zu ermöglichen. Der Level-2-Cache-TLB wurde von 1 auf 1,5 K Einträge erweitert, um die Adress-Übersetzungs-Misses zu reduzieren.

Die TLBs selbst wurden ebenfalls verändert. Ein zweiter Miss-Handler wurde für TBL-Pages ergänzt, so dass Broadwell beide Handler parallel nutzen kann, um sich durch Speicher-Pages zu bewegen. Dazu gibt es einen allerdings primär für Server wichtigen 1 GB-Page-Modus (ergänzend zu den 4 KB und 2 MB großen Pages bei Haswell). Die Sprungvorhersage wurde ebenfalls optimiert, um die Fehlvorhersagen und unnötige Speicher-Operationen zu reduzieren.

Viel hat Intel bezüglich mathematischer Operationen getan. Dank Verbesserungen im entsprechenden Hardware-Block konnte die Latenzzeit einer Gleitkomma-Multiplikation von 5 auf 3 Taktzyklen verringert werden, die Division konnte durch Einsatz eines größeren Radix-1024 (10 bit) Dividierers beschleunigt werden. Auch Vektor-Berechnungen sollen in Broadwell schneller laufen.

Bilder: 3

CPU-Architektur von Broadwell

Auch in Intels "Tick"-Jahr wurden einige Verbesserungen an der Mikroarchitektur vorgenommen.

Am interessantesten sind in diesem Zusammenhang die Vorgaben bezüglich der Leistungsaufnahme. Während bei Haswell noch ein 1:1-Verhältnis bestand – 1 % Verbesserung der Rechenleistung durfte zu nicht mehr als 1 % höherer Leistungsaufnahme führen – musste Broadwell für jedes Prozent mehr Leistungsaufnahme sogar 2 % mehr Rechenleistung liefern. Diese Vorgabe ist zwar nicht neu – schon Nehalem musste sie 2008 erfüllen, seitdem sind jedoch soviele Optimierungen passiert, dass es für CPU-Architekten immer schwieriger wird sowas umzusetzen. Im Fall Broadwell ist es jedoch gelungen, die 5 Prozent Steigerung der Rechenleistung wurden mit „nur“ 2,5 % höherer Leistungsaufnahme erkauft.

Da diese nichtsdestotrotz für Mobilgeräte immer schlecht ist, hat Intel auf einer anderen Ebende gegengesteuert: Natürlich bringt die 14-nm-Fertigung alleine drastische Reduktionen im Energieverbrauch, Intel hat zusätzlich jedoch durch erweitertes Clock- und Power-Gating für die diversen SoC-Blöcke auch noch weitere Maßnahmen ergriffen.