A11-Chip pulverisiert gesamte Konkurrenz iPhone 8: Prozessor schneller als Intels Core-i-5

Eine unglaubliche Rechenleistung legt Apples neues SoC "Apple A11" an den Tag. Nicht nur die gesamte ARM-Konkurrenz von Qualcomm, Samsung und Huawei wird geradezu pulverisiert, sogar ein Notebook mit Intels x86-Prozessor Core-i5 hat das Nachsehen. Dazu gibt es die im iPhone8 verbauten Chips im Bild.

Daß Apples SoC-Designer die besten ihrer Zunft sind, haben sie Jahr für Jahr aufs neue bewiesen. Die im iPhone eingesetzten eigendesignten CPUs haben stets die Konkurrenz insbesondere im Punkt Energieeffizienz (Rechenleistung/W) hinter sich gelassen.

Noch nie war allerdings der Abstand so groß wie beim A11 genannten SoC mit einer Rekordzahl von 4,3 Mrd. Transistoren, das in iPhone 8, 8 Plus und X (gesprochen “Zehn”) zum Einsatz kommt. Trotz der geringsten Taktfrequenz aller Hingh-End-ARM-basierten SoCs werden beim recht breit gefächerten Benchmark “GeekBench” neue Rekordwerte erreicht, und zwar mit einem Vorsprung, der insbesondere bei der Single-Thread-Rechenleistung, die für immer noch viele Anwendungen, die nicht über mehrere CPUs skalieren, wichtig ist, neue Dimensionen erreicht.

Wie Tabelle 1 zeigt, werden z.B. die Ergebnisse von Qualcomms Snapdragon-835, der ebenso wie der A11 in einem 10-nm-Prozess gefertigt wird, trotz um 25 % höherer Taktfrequenz vom A11 um mehr als 100 % übertroffen. Gleiches gilt für Samsungs Flagschiff Exynos-8895, immerhin Herzstück des Galaxy S8, und HiSilicons (Halbleiter-Tochter von Huawei) Kirin-960. Heruntergerechnet auf die Rechenleistung pro MHz spielt der A11 in seiner eigenen Welt, er ist mehr als doppelt so schnell pro MHz wie der Kirin-960 mit seinen Cortex-A73-CPUs.

Beim Multicore-Test, wo der GeekBench alle zur Verfügung stehenden CPUs gleichmäßig berücksichtigt (ein in der Realität eher seltenes Szenario), ist der Abstand geringer, da der A11 “nur” 2 High-Performance-Cores und 4 Low-Power-Cores implementiert, während die Konkurrenz mit 8 Cores aufwartet. Aber auch hier liegt der A11 nicht taktfrequenzbereinigt mehr als 50 % vor der Kokurrenz.

A11 schlägt Intels Core-i-5-7567U

Was es noch nie gegeben hat bislang war ein Szenario, wo ein für Smartphones designte SoCs schneller als in vollwertigen Laptops eingesetzten x86-Prozessoren von Intel gerechnet haben. Aber auch hier setzt der A11 neue Maßstäbe. Zwar kann der Core-i-5 der 7. Generation, der im untersuchten MacBook Pro mit 3,5 GHz getaktet wird, in der Single-Thread-Performance den A11 gerade noch auf Distanz halten, mit seiner Dual-Core-Architektur kann er beim Multicore-Test trotz dieser im Vergleich exorbitanten Taktfrequenz nicht mehr mithalten. Auch Apples eigener A10X-Chip aus dem iPad Pro hat trotz drei High-Performance-Cores keine Chance mehr gegen den A11.

Fairerweise muß man ergänzen, daß der Core-i-5 einen großen Vorteil hat: Während dieser in dem großen Laptop-Gehäuse seine Leistung dauerhaft abrufen und sogar zeitweise auf 3,9 GHz gepusht werden kann, wird der A11 aus thermischen Gründen in dem kleinen iPhone-Gehäuse niemals dauerhaft auf Vollast betrieben werden können – das Gehäuse würde die Wärme einfach nicht abführen können. Wenn es daher z.B. darum geht, stundenlang 4K-Videos zu encodieren, dürfte der Core-i-5 in der Praxis deutlich vorne liegen, da der A11 die meiste Zeit heruntergetaktet werden muß.

Unklar ist jedoch, wie Apples SoC-Designer diese Rechenleistung insbesondere unter Berücksichtigung der Energieeffizienz erreichen konnte. Das iPhone 8 beinhaltet nämlich eine kleinere Batterie als sein Vorgänger (6,96 Wh gegenüber 7,45 Wh im iPhone 7).

UPDATE:

Nachdem wir zahlreichen Testcode geschrieben haben, um die einzelnen Elemente der Pipeline, die Sprungvorhersage und den Scheduler untersuchen zu können, glauben wir dem Geheimnis des A11 zumindest grob auf die Spur gekommen zu sein. Es sind die Low-Power-Cores, der Scheduler und die entfallende 32-bit-Unterstützung.

Während die Konkurrenz für das Low-Power-Cluster entweder ARMs Cortex-A53 im Original (Samsung, HiSilicon) oder ein davon abgewandeltes Derivat (Kryo 280 genannt von Qualcomm) einsetzt und diese mit maximal 1,7 bzw.1,8 Ghz taktet, liefern die Apple-CPUs nicht nur absolut gesehen eine höhere Rechenleistung, sondern sind offenbar auch energieeffizienter als die Cortex-A53. Dazu schafft es der von Apple entwickelte Scheduler in Kombination mit dem OS, diese deutlich besser auszulasten bzw. einen Workload symetrischer zu verteilen als die Konkurrenz. Tatsächlich wurde ein asymetrisches Multiprozessing implementiert, bei dem alle CPUs unabhängig voneinander in beliebigen Kombinationen betrieben werden können.

Im Ergebnis laufen auf dem iPhone 8 deutlich mehr Tasks entweder ausschließlich auf den Low-Power-Cores, oder die High-Performance-Cores können zumindest in geringerem zeitlichen Umfang eingesetzt werden. Diese beiden “Rechenmonster” sind nämlich doch vergleichsweise Energiefresser, wenn man sie durch entsprechenden Code “zwingt”, längere Zeit aktiv zu bleiben als das bei realen Anwendungen der Fall ist.

Die beiden Out-of-Order-High-Performance-Cores profitieren nach unseren Messungen neben ihrer breiten Mikroarchitektur mit vielen Ausführungseinheiten im Backend (mindestens jeweils zwei für Integer- und Gleitkommaoperationen, dazu vermutlich weitere zwei getrennt für Lade-/und Speicherbefehle) und 3 Dekodern im Frontend vor allen Dingen von der Entfernung der 32-bit-Kompatibilität. Die ARMv8-A-Architektur beinhaltet ja bekanntlich zwei Ausführungmodi AArch32 und AArch64 für 32- und 64-bit-Anwendungen. Bislang wurden diese auch von Apples eigenentwickelten CPUs unterstützt, doch dies ist mit dem A11 Geschichte. iOS 11 und die darunterliegende Hardware unterstützt nunmehr nur noch in Arch64 entwickelte Anwendungen, was in der Praxis natürlich heißt, daß zahlreiche 32-bit-Alt-Apps nicht mehr funktionieren, soweit sie der Entwickler nicht neu kompiliert hat. Die Folge für die CPUs ist, daß nicht nur das OS, sondern auch alle Hardware-Blöcke komplett auf 64-bit optimiert werden konnten, was der Rechenleistung einen enormen Schub gegeben hat. Dies gilt natürlich in geringerem Umfang für die vier Low-Power-Cores, die ebenfalls auf 64-bit-only-Instruktionen optimiert wurden.

 Apple A11Apple A10XIntel Core-i-5-7576UQualcomm Snapdragon-835Samsung Exynos-8895HiSilicon Kirin-960
GerätiPhone 8/XiPad ProMacBook ProOnePlus 5Galaxy S8Huawei P10
Taktfrequenz*2,5 GHz2,4 GHz3,5 GHz2,45 GHz2,3 GHz2,4 GHz

Anzahl CPUs (High-Performance/ Low-Power)

6 (2+4)6 (2+4)2 (2+0)8 (4+4)8 (4+4)8 (4+4)
GeekBench SingleCore**424332234588193720141858
GeekBench SC normiert pro MHz1,701,341,310,790,880,77
GeekBench MultiCore**1045493229606656067346639

 

Ergebnisse des Benchmarks GeekBench für verschiedene Prozessoren. *: High-Performance-CPUs. **: Höherer Wert ist besser.