AMDs Prozessor-Architektur Wie relevant ist Zen für Embedded?

Es ist wohl nur eine Frage der Zeit, bis die Zen-Architektur in den Embedded-Bereich Einzug hält.

Die neue, hoch skalierbare „Zen“- x86-Mikroarchitektur von AMD bietet deutlich mehr Rechenleistung, Energieeffizienz und Leistung pro Watt für den Workstation-, Server- und Consumer-Markt. Diese Eckdaten können auch für Embedded-Applikationen von großem Nutzen sein.

Im März 2017 lieferte AMD die ersten Prozessoren mit der neuen Zen-Mikroarchitektur aus. Sie wurden wegen ihrer außergewöhnlichen Effizienzgewinne heiß erwartet. Im Detail bieten sie im Vergleich zur vorherigen „Excavator“-Architektur mit 52% mehr Befehlen pro Taktzyklus (IPC) eine gesteigerte Single-Thread-Performance und eine um 270% bessere Performance pro Watt. Wie im Consumer-Segment üblich, wurden diese offiziell angekündigten Verbesserungen von Technik-Experten einer strengen Prüfung unterzogen – und die neuen Prozessoren lieferten.

So bietet beispielsweise AMDs Ryzen-5-1600X-Prozessor bis zu 87% mehr generische Verarbeitungsleistung im Vergleich zu Intels Core-i5-7600K-Prozessor. Performance-hungrige Rendering- und Video-Transcoding-Demos auf Basis von Blender und Handbrake zeigen, dass eine AMD-Ryzen-Octacore-CPU bei vielen komplexen, kreativen Aufgaben das Leistungsniveau des Intel-Core-i7-6900K-Prozessors – ebenfalls ein 8-Core/16-Thread Prozessor – erreicht oder übertrifft. Der 140-W-TDP-Core i7-6900K lief dabei mit seinem Werkstakt und -boost gegenüber dem deutlich genügsameren 95-W-TDP-Ryzen-Prozessor mit 3,4 GHz ohne Boost. Im Cinebench R15 übertrifft der Ryzen 7 1800X mit 1601,43 Punkten den Core i7-6900K Extreme um 9%, der lediglich 1473,79 erreichte.

Doch Performance ist bekanntlich nur die eine Seite der Medaille, Effizienz die andere. Die Ryzen-Prozessoren liefern in diesem Zusammenhang außergewöhnliche Werte: So bietet zum Beispiel der Ryzen-7-1700-Prozessor 18,22% mehr Leistung pro Watt als der Core i7-6900K. Auch hier liefen beide Systeme mit dem Cinebench-R15-Benchmark. Der AMD-Prozessor verbrauchte dabei 115 W, um eine Punktzahl von 1410 zu erreichen. Daraus resultiert eine Energieeffizienz von 12,26 Punkten pro Watt. Das Intel-System benötigte hingegen 142 Watt für eine Punktzahl von 1473 und lieferte damit eine Energieeffizienz von nur 10,37 Punkten pro Watt. Diese Benchmarks sind besonders für die Desktop-, Workstation- und PC-Gaming-Märkte wichtig.

Darüber hinaus ist die Zen-Mikroarchitektur aber auch mühelos bis zu extrem anspruchsvollen Applikationen skalierbar, die 16 und mehr Cores verlangen. Das belegen AMDs neuen „Threadripper“-Prozessoren. Laut unabhängigen Tests mit Benchmarks wie dem Cinebench R15 liefert Ryzen Threadripper 1950X 34% mehr Performance als der vergleichbare Core-i9-7900X-Prozessor.

Auch in Bezug auf echte Rechenzentrums-Workloads wie High-Performance Computing, virtualisiertes Cloud Computing, maschinelles Lernen, Big Data und andere Analytik-Aufgaben, in denen Codierung gefordert ist, erzielt Zen außergewöhnliche Ergebnisse: AMDs neuer EPYC-7601-System-on-Chip errang gleich vier neue Weltrekorde für Standalone-Prozessoren in den SPEC-CPU-2006-Benchmarks für Zwei-Sockel- und Ein-Sockel-Server. Auf Zwei-Sockel-Servern bietet er eine bis zu 25% höhere Integer-Performance und eine bis zu 59% bessere Floating-Point-Performance im Vergleich zu Intels Xeon-Prozessor E5-2699A V4. Für Ein-Sockel-Server liegt die Integer-Performance sogar um 32%, bei der Floating-Point-Performance bis zu 66% höher.

Verantwortlich für diese beeindruckenden Werte sind zahlreiche Verbesserungen in der Zen-Mikroarchitektur. Um mit nur einer Plattform verschiedene x86-Anwendungsfälle effizient bedienen zu können, kombinierte AMD vier Zen-Cores zu einem CPU Complex (CCX), in dem jeder Core mit derselben Latenz auf die bis zu 16 MByte des L3-Caches zugreifen kann.

Die Zen-Cores basieren auf energieeffizienten FinFET-Transistoren mit 14-nm-Technologie. Sie integrieren mehr Transistoren auf einer kleineren Die-Größe, sodass die Chips eine höhere Packungsdichte haben und energieeffizienter sind. Zudem bieten sie ein für eine hohe Single-Thread-Performance optimiertes Design. Und sie sind die ersten AMD-Prozessoren, die für bessere Multitasking-Fähigkeiten über simultanes Multithreading verfügen, was für einen hohen Durchsatz sorgt. Damit können sie erstmals zwei Threads parallel verarbeiten.