Die Kraft der vier Herzen

Erst im letzten Jahr haben sich Doppelkern-Prozessoren auf breiter Front durchgesetzt. Schon folgt der Umstieg auf Vierkern-Prozessoren bis ins Desktop-Segment hinein. Nach einer Reihe von Server-Prozessoren der Xeon-Baureihe gibt es die Vierfach-Herzen jetzt auch für den Rechner zu Hause.

Erst im letzten Jahr haben sich Doppelkern-Prozessoren auf breiter Front durchgesetzt. Schon folgt der Umstieg auf Vierkern-Prozessoren bis ins Desktop-Segment hinein. Nach einer Reihe von Server-Prozessoren der Xeon-Baureihe gibt es die Vierfach-Herzen jetzt auch für den Rechner zu Hause.

Intel (www.intel.com) läutet nun auch bei Desktop-PCs das Vierkern-Zeitalter ein. Nach der ersten Ankündigung von Vierkern-Prozessoren für Server Mitte November 2006, gibt es nun mit dem Q6600 auch einen echten Desktop-Prozessor, der die Familienbezeichnung „Core 2 Quad“ trägt. Für zahlungskräftige Spiele-Freaks wurde zeitgleich mit den Server-Prozessoren (Xeon-Baureihe) der mit 999 Dollar relativ teure „Core 2 Extreme QX6700“ vorgestellt.

Der Desktop-Prozessor Q6600 verfügt über vier Kerne der neuen Core-Mikroarchitektur, die mit jeweils 2,4 GHz getaktet sind. Allerdings sind diese vier Kerne nicht monolithisch integriert, sondern als zwei separate Dies in einem Prozessorgehäuse des Typs LGA775 untergebracht. Jeder der beiden 143 mm2 großen, in einem 65-nm-Prozess gefertigten Dies integriert rund 291 Mio. Transistoren, die auf zwei Rechen-Cores und 4 Mbyte an „Advanced Smart Cache“ verteilt sind. So verfügt der Q6600 insgesamt über 8 Mbyte L2-Cache. Der Front-Side-Bus ist mit 1066 MHz getaktet, und die Leistungsaufnahme gibt der Hersteller mit 130 W (wie bei der „Extreme“-Version) an. Für den Massenmarkt dürfte der Q6600 mit 851 Dollar bei 1000 Stück noch zu teuer sein.

Die Core-Mikroarchitektur wurde bislang nach wie vor nur mit zwei Cores pro Die realisiert. Folgende Eigenschaften kennzeichnen sie:

  • Advanced Digital Media Boost: Die Core-Mikroarchitektur stellt 14 neue SSE-Befehle zur Verarbeitung von Grafik- und Videodaten zur Verfügung. Die Ausführungseinheiten für SSE-Instruktionen arbeiten nun mit 128 bit breiten anstelle von 64-bit-Registern. So können sie komplette Befehle in einem einzigen Takt ausführen und verdoppeln das Ausführungstempo für Multimedia-Anweisungen.
  • Advanced Smart Cache: Der Level-2-Cache wird von zwei CPU-Kernen gemeinsam genutzt. Dadurch kann sehr granular dem momentan stärker beanspruchten Kern mehr Cache zugeteilt werden, anstatt bei getrennten Pufferspeichern einen Teil ungenutzt zu lassen. Im Extremfall kann eine CPU auf den gesamten Cache-Block zugreifen. Außerdem tauschen die beiden CPUs über den Cache auch äußerst effizient Daten aus, die ansonsten per Bus aus dem Hauptspeicher geholt werden müssten.
  • Intelligent Power Capability: Für ungenutzte Bereiche des Prozessors kann die Spannung in kleinen Stufen bis zum Tiefschlaf abgeregelt werden. Der Cache-Speicher lässt sich sogar ganz abschalten. Daten gehen dabei nicht verloren, sondern werden in den Hauptspeicher ausgelagert.
  • Mikro-Fusion: Zwei gleichartige Mikro-Operationen werden zu einer einzigen verschmolzen und innerhalb eines Taktes ausgeführt.
  • Makro-Fusion: Zwei Anweisungen (x86-Instruktionen) werden zusammengefasst und als eine Instruktion behandelt.
  • Smart Memory Access: Befehle werden spekulativ bereits vorausschauend ausgeführt, obwohl die verwendeten Daten aus dem Speicher möglicherweise ungültig sind. Um zu vermeiden, dass viele dieser Ausführungen wiederholt werden müssen, verfügt die Core-Architektur über eine Funktion, die die Wahrscheinlichkeit von Speicherkollisionen im voraus berechnen kann.
  • Wide Dynamic Execution: Bei der Core-Architektur handelt es sich um den ersten „vierfach superskalaren“ Prozessor: Pro Takt werden vier Mikrooperationen simultan ausgeführt, während im Vorgängermodell maximal drei Befehle auf die Ausführungseinheiten verteilt werden.