Intel stellt erste 45-nm-Prozessoren vor

Die Strukturverkleinerung von 65 auf 45 nm ist nur die halbe Medaille. Wichtiger ist das neue High-k/Metal-Gate- Herstellungsverfahren, das die Leckströme und damit den Ruhestrom in den Transistoren auf ein Fünftel senkt. Durch Einstellen verschiedener Arbeitspunkte gelingt es Intel dadurch, Mobil- Prozessoren zu bauen, die genügsamer sind, und Desktop-/ Server-Prozessoren, die mehr leisten.

Die Strukturverkleinerung von 65 auf 45 nm ist nur die halbe Medaille. Wichtiger ist das neue High-k/Metal-Gate- Herstellungsverfahren, das die Leckströme und damit den Ruhestrom in den Transistoren auf ein Fünftel senkt. Durch Einstellen verschiedener Arbeitspunkte gelingt es Intel dadurch, Mobil- Prozessoren zu bauen, die genügsamer sind, und Desktop-/ Server-Prozessoren, die mehr leisten.

Am 12. November 2007 stellte Intel die ersten 45-nm-Prozessoren vor. Bereits bei Einführung der Core-Mikroarchitektur vor drei Jahren hatte Intel angekündigt, jedes Jahr abwechselnd eine neue Mikorarchitektur und einen neuen Herstellungsprozess zu verwirklichen. Nachdem die Core-Architektur im letzten Jahr zu „Core 2“ weiterentwickelt wurde, steht dieses Jahr eine Strukturverkleinerung an, die Intel nun mit den „Penryn“-Prozessoren in die Tat umsetzt. Trotzdem sind auch einige Architekturoptimierungen „außer der Reihe“ erfolgt. Das wichtigste Kennzeichen der neuen Prozessoren aber ist der 45-nm-Prozess, der nicht nur eine Schrumpfung von bisher 65 nm darstellt, sondern bei dem signifikant die Leckströme reduziert werden konnten. Dies gelingt durch das sog. „High-k/Metal Gate“-Verfahren, bei dem die Transistoren durch Einführung eines neuen Dielektrikums mit hohem k-Wert und einer Metallschicht am Gate modifiziert wurden. Eine ausführliche Darstellung, wie diese Herstellungsmethode den Stromfluss in den Transistoren beeinflusst, findet sich in Elektronik 5/2007 auf S. 26. Durch die neue Fertigungstechnik ist der Chip um etwa ein Drittel kleiner geworden (Bild 1). Gleichzeitig steigt die Zahl der Transistoren von 293 auf 410 Millionen. Dass Stromverbrauch und Wärmeentwicklung nicht gestiegen sind, ist dem neuen High-k/Metal-Gate-Verfahren zu verdanken. Ein großer Teil der zusätzlichen Transistoren und des Leistungszuwachses geht auf das Konto des Level-2-Caches, der von 4 auf 6 Mbyte vergrößert wurde. Zusätzlich wurden aber auch noch 47 neue SSE4-Befehle für die Beschleunigung von Multimedia-Applikationen sowie weitere Stromsparfunktionen für die Mobil-Versionen der Penryn- Prozessoren implementiert.

Gleicher Chip für Mobil- und Desktop-Prozessoren

Für Mobil- und Desktop-/Server-Prozessoren wird der gleiche Chip eingesetzt. Allerdings werden die Transistoren auf jeweils andere Arbeitspunkte eingestellt. Grundsätzlich hat das High-k/Metal-Gate-Verfahren den Effekt, dass bei gleichem Durchlassstrom gegenüber den bisherigen SiO2-Transistoren ein fünffach geringerer Leckstrom fließt. Diese Tatsache macht sich Intel für die auf Stromsparen optimierten Mobil-Prozessoren zu Nutze. Man kann den Arbeitspunkt aber auch so einstellen, dass der Leckstrom konstant bleibt, indem man 20 Prozent mehr Strom durch die Transistoren jagt. Das Ergebnis sind dann kürzere Schaltzeiten und damit eine höhere Taktfrequenz des Chips. Dieser Arbeitspunkt wird für die Desktop- und Server-Prozessoren eingestellt.

Die Mobil-Prozessoren haben obendrein noch zusätzliche Stromspar- Funktionen, die bei den Desktop-Prozessoren deaktiviert sind. Gegenüber den Vorgänger-Chips (Codename „Merom“) hat Intel bei Penryn einen zusätzlichen „Deep Power Down“- Modus eingeführt, bei dem der Leerlaufstrom nahe Null ist. Ein Core-2- Mobil-Prozessor schaltet während des Betriebs je nach Auslastung zwischen den Modi C0 bis C4 um. Mit „Deep Power Down“ kommt jetzt ein zusätzlicher Modus C6 hinzu. In diesem Modus wird die Kernspannung stark reduziert und die L1- und L2-Caches werden abgeschaltet (Bild 2). Die C-Modi dürfen nicht mit den „Powersave“-Funktionen (Modi S0 bis S5) verwechselt werden, die zum partiellen bis vollständigen Ausschalten des Computers dienen. Die Aufwachzeit aus den Powersave-Modi liegt im Bereich einer bis mehrerer Dutzend Sekunde( n). Die C-Modi sind für den Nutzer fast unmerklich in den Betrieb integriert. Ein Prozessor schaltet u.U. mehrere hundert Mal pro Sekunde zwischen verschiedenen C-Zuständen um. Begrenzt wird die Zahl der Umschaltvorgänge durch die Wirtschaftlichkeit, denn jedes Umschalten benötigt zusätzliche Befehlsabläufe, die ausgeführt werden müssen. Zu häufige Umschaltvorgänge verbrauchen mehr Strom als sie sparen.

Für Single-Threaded-Applikationen, die von einem Mehrkern-Prozessor nicht profitieren, führt Intel die „Enhanced Dynamic Acceleration Technology“ ein: Ist einer der beiden Kerne nicht oder nur wenig beansprucht, der andere dagegen voll, dann kann der belastete Kern leicht oberhalb der Nennfrequenz getaktet werden (Bild 3). Dazu wird auch die Spannung des betreffenden Kerns erhöht. Der Prozessor bleibt dann trotzdem noch in seinem thermischen Soll-Bereich. Auch dieses Feature findet sich nur in Mobil-Prozessoren, da bei Desktop-/Server-Prozessoren keine so strikten thermischen Grenzen bestehen. Insofern ist die Reserveleistung bei Desktop-/Server-Prozessoren immer zugeschaltet.

SSE4-Befehle: nur nützlich für Spezialanwendungen

Zwar steht die Strukturverkleinerung im Mittelpunkt der Penryn-Prozessorgeneration, doch auch einige Architekturerweiterungen sind im neuen Silizium zu finden. Dazu zählen vor allem 47 neue SSE4-Befehle. Diese neuen Befehle verbessern die Performance bei der Video-Codierung, z.B. indem die Bewegungsextraktion auf einen größeren Suchradius ausgedehnt werden kann. Dadurch können die Videos mit höherer Qualität codiert werden. Wohlgemerkt: Die Codierung der Videos geht nicht grundsätzlich schneller vonstatten – nur das Codieren in hoher Qualität wird beschleunigt. Der Video-Codec DivX 6.6.1 verrichtet seine Arbeit bei hoher Qualität auf den neuen Prozessoren etwa 1,6-mal so schnell wie auf einem gleich schnell getakteten Merom-Chip. Ansonsten beträgt der Leistungszuwachs für den Anwender unmerkliche 10 Prozent, die wohl zum größten Teil auf die größeren Caches zurückzuführen sind. Auch für Spiele oder Anwendungen wie PhotoShop geht der Leistungszuwachs nicht über dieses Maß hinaus. Weitere Verbesserungen erfolgten bei der Virtualisierungstechnik VTx. Kontext-Wechsel zwischen virtuellen Maschinen laufen doppelt so schnell ab.

Der erste 45-nm-Prozessor, den Intel offiziell angekündigt hat, ist der Vier-Kern-Prozessor Core 2 Extreme QX9650 mit einer Taktfrequenz von 3 GHz und FSB 1333. Wie bei allen Intel-Quad-Cores, befinden sich hier zwei Dual-Core-Chips in einem Gehäuse. Die TDP beträgt 130 W. Speziell für Spieler und Übertakter ist die Overspeed Protection deaktiviert. Der Prozessor soll bei Abnahme von 1000 Stück 999 Dollar kosten. Für Server kommen die ersten 45-nm-Prozessoren als Xeon 54xx auf den Markt. Genaue Taktfrequenzen und Preise hat Intel bis Redaktionsschluss noch nicht verraten.

Joachim Kroll, Elektronik