iPhone-5S-Prozessor entlarvt Neuer Apple A7 kommt mit zwei Cyclone-Cores

Wie schon der im iPhone 5 und 5C eingesetzte A6-Prozessor basiert auch sein 64-bit-Nachfolger A7 auf einer eigens von Apple entwickelten Mikroarchitektur: Beim A6 hiess diese „Swift“, beim A7 nennt sie Apple „Cyclone“. Auch sonst hält der A7 einige Überraschungen bereit.

Konnte man bei Apple schon einen eher konservativen Ansatz vermuten, hat sich dieser vollends bestätigt: Der A7 beinhaltet „nur“ 2 Cores, die unverändert zum A6 mit 1,3 GHz getaktet werden. Dafür wurde die Größe des Level-1-Caches für Daten und Befehle von 32 auf jeweils 64 KB erhöht, bei einer 64-bit-Architektur wie ARMv8, auf deren Basis Cyclone designt wurde, keine große Überraschung (den CPU-Core in dem M7-Bewegungssensor-Koprozessor hat Apple übrigens „Oscar“ getauft).

Die Latenzzeit beim L1-Zugriff erhöhte sich von 2 auf 3 Taktzyklen, die allerdings durch die erhöhte Treffer-Quote überkompensiert wird. Der L2-Cache bleibt mit 1 MB zum A6 unverändert groß, die Zugriffs-Latenzzeiten haben sich gegenüber dem A6 in vielen Fällen fast halbiert.

Durch die schnellere und 64 bit breite Dual-Channel-Speicherschnittstelle zum LPDDR3-Speicher konnte die Datenübertragungsrate bis zu 60 % gegenüber dem A6 beschleunigt werden – mit dem Benchmark Geekbench und der „Stream Add“-Operation auf fast 6 GB/s.

Die Rechenleistung im Integer-Bereich stieg gegenüber dem A6 im Schnitt um rund 40 %, bei den Gleitkommaoperationen sogar um fast 70 % an, sicher eine Folge der Verdoppelung der Gleiktomma/NEON-Register von 16 auf 32 zusammen mit dem Sprung von 64 auf 128 bit Breite pro Register. Dazu kommen neue leistungsfähigere SIMD-Instruktionen mit der ARMv8-Architektur.

Eine Analyse der im iOS7 laufenden Prozesse ergab, das diese zu 100 % im 64-bit-Modus AArch64 laufen.

Die unbekannte GPU entlarvt

Anders als bei den Vorgängergenerationen des A6 und A6X (iPad 4) nennt Apple in seiner Entwickler-Dokumentation keinen expliziten GPU-Namen sondern lediglich „Apple A7 GPU“.

Nichtsdestotrotz konnten wir die verwendete GPU als Imagination PowerVR G6430 (Rogue) mit 4 Clustern identifizieren.

Zunächst versprach Apple die Unterstützung von Open GL ES 3.0. Diese leisten derzeit ausschließlich Adreno 3XX (wird nur in Qualcomm-SoCs verbaut), ARMS Mali-T6XX-Familie und eben Imaginations PowerVR-6-Serie.

Ein Eintrag bezüglich der hardwareseitigen Anti-Aliasing-Unterstützung in der Entwicklerdokumentation gibt den entscheidenden Hinweis: MAX_SAMPLES=8. Ein Multisample-Anti-Aliasing (MSAA) mit 8 Samples wird von ARMs Mali-GPUs nicht unterstützt (4 bzw. 16).

Weitere zwei Aussagen aus Apples Entwicklerdokumentation bestätigen die Rogue-GPU: Zum einen ist von einer skalaren Architektur die Rede (zu der Imagination mit Rogue wechselte), dazu rechnen die Schattierer laut Apple mit 16-bit-Gleitkommawerten – wie dies auch Imagination in seiner Dokumentation bestätigt.

Auf Basis der gemessenen Werte mit diversen Benchmarks spricht vieles, wenn nicht alles, für eine GPU des Derivates PowerVR G6430 (eine Variante, die mehr auf Rechenleistung als auf Siliziumfläche optimiert ist), die mit 300 MHz oder mehr getaktet wird (die exakte Taktfrequenz konnte zu diesem Zeitpunkt noch nicht ermittelt werden). UPDATE: Die PowerVR G6430 konnte mittlerweile durch eine Systemanalyse des Benchmark-Programms 3DMark bestätigt werden (siehe Bild).

PowerVR G6430

Die Rechenleistung pro Cluster sind 64 32-bit-Gleitkommaoperationen pro Taktzyklus, also in Summe 256 FLOPS/Taktzyklus. Bei 300 MHz käme die GPU daher auf 76,8 GFLOPS, exakt dem doppelten Wert der im iPad 3 verbauten PowerVR SGX543MP4 und derselbe Wert wie die im iPad 4 eingesetzte PowerVRSGX 554MP4.

Durch die architektonischen Verbesserungen wurde beim Benchmark GLBenchmark 2.7-T-Rex HD mit 37 Frames/s der höchste Wert aller Zeiten auf einem Smartphone gemessen und erstmals überhaupt die 30 Frames/s-Marke übertroffen. Zum Vergleich: Das iPhone 5 kommt auf 14, das Samsung Galaxy S4 auf 12 und das HTC One auf 8 Frames/s. Lediglich die Entwicklungsplattform von Qualcomm für den Snapdragon MSM8974 (Adreno-330-GPU) kommt mit 26 Frames/s annähernd in den Bereich des iPhone 5S.

Bleibt die Frage nach dem Auftragsfertiger: Auf Grund der vergleichsweise geringen Chipfläche glauben wir an eine 28-nm-High-K/Metal-Gate-Fertigung bei TSMC (HPM-Prozess, der auch von Qualcomm genutzt wird)– auch wenn der Beweis durch eine Chipanalyse aussteht. Erinnern Sie sich, wie überrascht Samsung auf Apples Ankündigung des ersten 64-bit-Prozessors reagiert hat? Noch wenige Tage zuvor haben die Koreaner eine Weiterentwicklung ihres Exynos-Octa-Cores bekanntgegeben (sie können jetzt die 4 Cortex-A15- bzw. 4 Cortex-A7-CPUs gemeinsam als echten Octa-Core betreiben) – es würde uns wundern, wenn die Brandmauern zwischen dem Handy- und Foundry-Bereich bei Samsung so hoch wären, dass da nichts von Apples Plänen durchgesickert ist, zumal Chip-Designer und Fertiger ja schon Monate vor Produtionsstart eng zusammenarbeiten müssen.

Fazit: Nicht wie erwartet ein Server-Prozessor, sondern ein Smartphone-SoC von Apple implementiert als erster Chip die 64-bit-ARMv8-Architektur. Auch wenn der Nutzen für den Anwender limitiert sein dürfte, solange die App-Entwickler ihre Software nicht auf 64-bit-Versionen umprogrammieren, ist dies technisch der Weg in eine neue Ära – wer hätte noch vor wenigen Jahren an ein Handy mit 64-bit-CPU gedacht?