Bisherige Ansätze stoßen an Grenze Multi-Chip-Technologien für Leistungssteigerung?

Reduzierung der Leistungsaufnahme mit Hilfe eines ausgeklügelten Power-Managements

Die Rechenleistung ist in den letzten Jahrzehnten deutlich gestiegen. Damit auch weiter Fortschritte möglich sind, fordert Dr. Lisa Su, President und CEO von AMD, neue Ansätze, denn bisherige Methoden verlieren an Schlagkraft.

Waren 1992 15 GFLOPs höchste Rechenleistung, kommt eine Spielekonsole 25 Jahre später bereits auf 5 bis 6 TFLOPs. Historisch betrachtet wurde die Rechenleistung in der PC-Ära alle 1,5 Jahre verdoppelt, ebenso die Leistungseffizienz. Dr. Su: »Diese Entwicklung hat sich in den letzten Jahren verlangsamt, weil die Skalierung der Transistoren immer schwieriger wird. Also wurden viele andere Techniken einschließlich System-, Architektur- und Software-Innovationen genutzt, um die Leistung weiter zu steigern.« Wobei die Prozesstechnik ganz klar in den letzten zehn Jahren einen wichtigen Beitrag zu den Verbesserungen geleistet hat. Su erklärt, dass rund 40 Prozent der erreichten Performance-Gewinne auf die Prozesstechnik zurückzuführen sind. Die restlichen 60 Prozent wurden über Integration von Systemkomponenten, Verbesserung der Mikroarchitektur, Verbesserung des Power-Managements und über Software erreicht.

Was das im Einzelnen heißt, macht Su an diversen Beispielen deutlich. So hat AMD beispielsweise 2006 die Memory-Controller in die Opteron-Prozessoren integriert und damit die 48 W, die die externen Speicher-Controller aufgenommen haben, eingespart. Hinsichtlich der Verbesserungen auf der Mikroarchitekturseite verweist Su darauf, dass der IPC-Wert (Instructions per Cycle) seit zehn Jahren im Durchschnitt um 7 Prozent pro Jahr verbessert wurde. Auch hier greift Su auf ein Beispiel aus dem eigenen Haus zurück: die CPU-Architektur Zen. Dank zusätzlicher Ausführungseinheiten, höherer Cache-Bandbreite, intelligenter Daten-Prefetches, verbesserter Sprungvorhersage und Caches mit geringerer Latenzzeit konnte der IPC-Wert um 52 Prozent gegenüber der Piledriver-Architektur verbessert werden.

Wie bereits gesagt, leistete das Power-Management in den letzten zehn Jahren ebenfalls einen wichtigen Beitrag, um die Prozessorleistung zu verbessern. Su: »Mittlerweile sind tausende Sensoren auf den Chips integriert, um die Spannung gemäß der Last zu steuern.« Ihrer Aussage nach konnte mit Verbesserungen im Power-Management pro Generation ein Performance-Gewinn im Bereich von 15 Prozent erreicht werden. Su weiter: »Vergleicht man ein Epyc-SoC mit und ohne Power-Management, so fällt die Leistungsaufnahme des Epyc-SoCs mit Power-Management um knapp 50 Prozent niedriger aus als bei einem Epyc ohne Power-Management.«

Schlussendlich hat AMD auch überprüft, wie viel Performance-Gewinn über die Software erreicht wird. Das Ergebnis: Verbesserungen im Compiler tragen rund 2 bis 5 Prozent zu den jährlichen Leistungssteigerungen von CPUs bei.

Verbesserungen auf der Technologieseite machten größere Dies möglich, wodurch dank zusätzlicher Prozessorkerne auch eine höhere Parallelität möglich wurde. Erhöht man die Anzahl der Prozessorkerne, steigt der Durchsatz, aber aufgrund von Speicher, I/Os etc. führt eine Verdoppelung der Prozessorkerne nicht zu einer Verdoppelung der Rechenleistung, sondern Arbeitslasten wie SPECint_rate2006 zeigen, dass die Leistung um nur etwa 70 Prozent erhöht wird. Su: »In der Summe gehen wir davon aus, dass die Vergrößerung der Die-Fläche in der Vergangenheit zwischen 9 und 15 Prozent zur gesamten Leistungssteigerung beigetragen hat.«

Schlussendlich hat AMD auch getestet, wie viel der Leistungsverbesserungen auf die Mikroarchitektur und auf Software-Verbesserungen zurückzuführen ist. Das Ergebnis: Verbesserungen auf der Mikroarchitekturseite haben ungefähr zu einer 17-prozentigen Steigerung, Verbesserungen bei den Compilern rund 2 bis 5 Prozent zur jährlichen Leistungssteigerung von CPUs beigetragen.