IDF 2011 Ivy-Bridge-Prozessoren mit optimierter Mikroarchitektur

Fellow und Grafik-Guru Tom Piazza stellte Intels neue Mikroarchitektur Ivy-Bridge vor.
Fellow und Grafik-Guru Tom Piazza stellte Intels neue Mikroarchitektur Ivy-Bridge vor.

Eigentlich ist 2011 in Intels »Tick-Tock-Modell« ein Tick-Jahr, d.h. die Mikroarchitektur bleibt unverändert und der Fertigungsprozess schrumpft um eine weitere Generation. In diesem Jahr wurden gegenüber der 2010 eingeführten Sandy-Bridge-Architektur jedoch einige Veränderungen vorgenommen.

In einer »Technology Inside« genannten Session gab Intel-Fellow Tom Piazza einen Einblick auf die neue Ivy-Bridge-Prozessorgeneration. Wie wir bereits berichteten, wird Intel neben dem Schrumpfen des Fertigungsprozesses auf 22 nm die Planar-Transistoren durch Tri-Gate genannte FinFet-Transistoren ersetzen.

Die aktuellen planaren Transistoren basieren auf einem Design, welches bereits 1974 entwickelt wurde. Anschließend wurden diverse Maßnahmen umgesetzt, um die Leckströme zu minimieren und die Transistoren bei einer kleineren Fertigungstechnik zu beherrschen. Zwei Beispiele sind mit der Einführung der 90-nm-Fertigung der Wechsel auf  Strained-Silicon-Transistoren im Jahr 2003 sowie der Wechsel zu High-k/Metal-Gate-Transistoren mit der 45-nm-Generation.

Herstellen wird Intel die neuen Prozessoren in insgesamt fünf Fabs, die auf den 22-nm-Prozess umgerüstet werden oder es schon sind. Neben den Fabs in Oregon werden auch die beiden Fabs in Arizona und die Fab in Israel sein.

Neben der Fertigung wurde aber auch die aktuelle Sandy-Bridge-Mikroarchitektur verbessert (siehe Bilderstrecke). Viele Dinge bleiben aber identisch: Es wird weiterhin CPU und separaten Chipsatz geben, integriert sind hingegen neben den CPU-Cores die GPU, eine Media- und Display-Engine, der Speicher-Controller, der PCI-Express-Controller und der Ringbus für den Datentransfer zwischen Cores und L3-Cache.

Kommen wir zu den Optimierungen: Die GPU unterstützt jetzt  DirectX11, womit folgende  wesentliche Neuerungen nutzbar sind:  Shader Model 5, mit dem die sogenannten »Compute Shaders« eingeführt werden, womit Microsoft die GPU-Programmierung vereinheitlichen möchte, grafikkartenseitige Unterteilung von 3D-Flächen in Dreiecke (Tessellation), durch die der Detailgrad von 3D-Szenen ohne Belastung des restlichen Systems erhöht werden kann und verbesserte  Thread-Unterstützung der Rendering-Pipeline, insbesondere in Hinblick auf effizientere GPGPU-Programmierung. DirectX 11 ist als Teil von Windows 7 bereits im vierten Quartal 2009 erschienen.

Die Ivy-Bridge-GPU bekommt desweiteren eine erhöhte Rechenleistung durch mehr Ausführungseinheiten und interne Optimierungen. Die neue Ivy-Bridge-Grafikeinheit hat bis zu 16 Ausführungseinheiten (Sandy Bridge: 6 oder 12), die zum Shader-Model 5.0 und folglich auch zu DirectX 11 kompatibel sind. Sie eignen sich also auch für universelle Berechnungen via DirectCompute 11.0 oder OpenCL 1.1. Ausgestattet sind sie mit geteiltem lokalen Speicher, der einen effizienteren Datenaustausch zwischen den Shader-Cores ermöglicht, und Scatter-Gather, um Daten aus verschiedenen Speicherbereichen zusammenzuführen. Auch neue Formate für komprimierte Texturen (BC6H/7) beherrscht die GPU. Weiterhin gibt es eine Fix-Function-Tessellation-Einheit, die Hull- und Domain-Shader kommen als programmierbare Stufen hinzu. Auch die fürs anisotrope Filtern (AF) zuständigen Einheiten sollen genauer arbeiten und eine bessere Bildqualität liefern.

Dazu gehören ein Blitter sowie Controller für drei gleichberechtigte Display. So kann beispielsweise ein Notebook mit zwei externen Monitoren betrieben werden, wenn es zugeklappt ist. Das geht bisher nicht bei allen Geräten, weil das interne Display in der Regel auch elektrisch der erste Monitor ist. Piazza führte dazu aus, dass bei Ivy-Bridge auch etwas verbaut wird, das schon für Sandy Bridge vorgesehen war: Die GPU bekommt ihren eigenen L3-Cache. Dass dieser beim Vorgänger eingespart wurde, liegt laut Piazza an seiner bei Sandy Bridge geringen Effizienz. Höchstens 5 bis 10 Prozent mehr Grafikleistung hätte der L3-Cache bei Sandy Bridge gebracht, sagte der Chipdesigner. Da bei Ivy Bridge aber sowohl CPU als auch GPU viel schneller werden sollen, kann der L3-Cache der GPU den Ringbus soweit entlasten, dass sich sein Einsatz dann doch wieder lohnt. Wie auch bei anderen Cache-Größen gab Piazza die Kapazität des GPU-L3 aber nicht an.

Mit Sandy-Bridge führte Intel seine erste High-End-Architektur ein, die eine direkt im Chip integrierte Grafiklösung besitzt. Bei Core-i-Prozessoren für Notebooks lautet die offizielle Bezeichnung für diese integrierte GPU (Graphics Processing Unit) »Intel HD Graphics 3000«. In CPUs für den Desktop kommt auch die langsamere »HD Graphics 2000«-GPU zum Einsatz. Der schnellste integrierte Grafikprozessor von Ivy Bridge soll nun deutlich mehr Leistung liefern als die HD Graphics 3000. Intel erwartet laut eigenen Angaben ein um 60 Prozent gesteigertes Ergebnis beim 3DMark Vantage Benchmarktest und etwa um 30 Prozent mehr bei Tests mit dem 3DMark 06. Es wird auch wieder eine langsamere Grafikeinheit der Ivy-Bridge CPUs geben, deren Geschwindigkeitszuwachs im Vergleich zu HD Graphics 2000 »nur« etwa 10 bis 20 Prozent ausmachen soll.

Bilder: 7

IDF 2011

Die neue Mikroarchitektur Ivy-Bridge weist im Vergleich zur Vorgängergeneration Sandy-Bridge einige Veränderungen auf.

Auch der Core-Bereich bekommt ein Update: Hier sind zuerst einige Veränderungen bei den Befehlssätzen, insbesondere für die SSE- und AVX-Einheiten zu nennen. So können z.B. 16-bit-Gleitkomma-Werte einfacher in 32-bit-Werte fr SSE und AVX konvertiert werden und umgedreht.  Eine weitere Sicherheitsfunktion ist ein Generator für Zufallszahlen, der je nach Länge der Werte (16, 32 oder 64 bit) zwischen 2 und 3 GBit/s erzeugen kann. Dieser Generator soll anerkannten Standards wie denen von ANSI und NIST entsprechen und damit für sichere Transaktionen im Internet sorgen können. Dafür gibt es auch einen neuen x86-Befehl namens RDRAND.

Eine neue Adressierung von Speicher namens SMEP. soll einen der häufigsten Angriffe von Schadprogrammen verhindern: Ein Programm, das mit eingeschränkten Rechten läuft, kann mit SMEP nicht mehr Rechte von Betriebssystemteilen oder gar dem Kernel erlangen. Die Umwandlung von virtuellen in physische Speicheradressen ist für User-Mode-Programme und das OS zwar schon jetzt unterschiedlich, werden diese Unterschiede aber im selben Kontext plötzlich übersprungen, kann Ivy-Bridge das erkennen.

Vergleichsweise viel hat Intel im Bereich  Power-Management verbessert. So kann Ivy Bridge den DDR -I/O komplett abschalten, wenn man sich in einem Deep-Sleep-Modus befindet. Die maximal zulässige Verlustleistung (TDP) kann konfiguriert werden, ebenso die Low-Power-Modi, in die sich der Prozessor begeben darf.  Besonders interessant ist die TDP-Konfigurierung, mit der man denselben Die in unterschiedlichen Gehäusen und Einsatzgebieten anwenden kann. Vom rechenleistungsoptimierten Desktop-PC mit Lüfter bis zum Mobilgerät mit kleinem Form-Faktor. In Zeiten von Ultrabooks und dem Trend hin zu immer leichteren und flacheren Geräten ist die TDP, also die thermische Verlustleistung eines Prozessors wichtiger als jemals zuvor, da sie der entscheidende Wert ist, um Kühlsysteme entsprechend zu dimensionieren, beziehungsweise Notebook-Designs festzulegen.

Ultra Low Volt (ULV) und Extreme Edition CPUs der Ivy Bridge Serie sollen mit drei unterschiedlichen TDP-Angaben ausgeliefert werden. Dabei soll es einen nominellen, einen verminderten und einen erhöhten TDP-Wert geben. Die Verwendung der CPU mit einem dieser konfigurierbaren Werte hängt ganz von den äußeren Einsatzbedingungen und den vorhandenen Kühllösungen ab. Ein Beispiel dazu: ULV Ivy Bridge CPUs sollen mit einer TDP von 17 Watt klassifiziert sein. Intel wird aber nun in diesem Fall auch die Funktion der Prozessoren mit einer höheren Taktfrequenz und einer maximalen TDP von 33 Watt garantieren. Hersteller könnten also für ein Notebook, ähnlich dem aktuellen MacBook Air, eine Docking Station mit zusätzlicher Kühllösung anbieten, bei deren Nutzung es möglich ist die Ivy Bridge CPU effizienter zu kühlen und so auch die höhere TDP von 33 Watt auszunutzen. Der Prozessor würde also in diesem Fall einfach mit höherem Takt und damit schneller arbeiten. Diese Technik funktioniert natürlich auch genau anders herum. Soll die CPU in noch flacherem Gehäuse eingesetzt werden kann sie auch mit einer TDP von nur 13 Watt arbeiten, um weniger Hitzeentwicklung zu gewährleisten.

Der System-Agent kann im Vergleich zu Sandy-Bridge mit geringeren Spannungen betrieben werden und eine  Power-Aware-Interrupt-Rating (PAIR) genannte Funktionalität wählt bei der Verarbeitung von Interrupts automatisch den »besten Core« in Bezug auf die zur Verfügung stehende Rechenleistung und den Energieverbrauch aus. Last but not least wird die Versorgungsspannung besser als zuvor je nach aktueller Taktfrequenz des Prozessors angepasst.

Mit Ivy-Bridge-Chips kann jetzt DDR3-2133-Speicher (getaktet mit 266,7 MHz, Burst-Rate 17067 Mbyte/s) offiziell eingesetzt werden und die Display-Einheit kann nun drei Monitore ansteuern.