Qualcomm Snapdragon Technology Summit 17 Snapdragon-845 ist erster DynamIQ-Prozessor

Als Nachfolger von ARMs Big.LITTLE-Technologie wurde Anfang 2017 auf ARMs TechDay DynamIQ angekündigt. Der Snapdragon-845 ist das erste SoC mit dieser Technologie, heute enthüllte Qualcomm endlich die lange erwarteten Details über seinen neuen High-End-Prozessor.

Über die DynamIQ-Technologie haben wir bereits nach ARMs TechDay ausführlich an dieser Stelle berichtet. Wie schon beim Snapdragon-835 (dessen Detailanalyse Sie hier finden), der auf mit Hilfe einer ARM-Architekturlizenz modifizierte CPUs des Typs ARM Cortex-A73 (ausführliche Analyse findet sich an dieser Stelle) und ARM Cortex-A53 beinhaltet, basiert auch der Snapdragon-845 auf acht CPUs, allerdings vier High-Performance-Cores des Typs ARM-Cortex-A75 und vier Low-Power-Cores des Typs ARM Cortex-A55. Beide waren als Grundlage für Qualcomms wie auch immer geartete Optimierungen (hierzu schwieg man sich wie üblich aus) alternativlos, da sie derzeit die einzigen ARM-CPUs für einen Einsatz mit DynamIQ sind. Ausführliche technische Analysen beider CPUs inklusive von seitens der DESIGN&ELEKTRONIK erstellten Schaubildern für die Mikroarchitekturen und Vergleichen zu ihren Vorgängern gibt es für technisch interessierte Leser in zwei Berichten an diesen Stellen: Cortex-A75 und Cortex-A55.

Qualcomm nennt die modifizierten CPUs „Kryo 385“, wir allerdings glauben auf Grund der angegebenen Steigerungen der Rechenleistung und der kurzen Entwicklungszeit des Snapdragon-845, dass sich die Optimierungen im Rahmen halten und auf das Speichersubsystem beschränkt sind.

Obwohl DynamIQ den Einsatz von theoretisch 1.000 CPUs in einem Cluster ermöglicht, separierte Qualcomm die High-Performance- und Low-Power-Cores in zwei Cluster. Der erste wird mit bis zu 2,8 GHz getaktet (gegenüber 2,45 GHZ im Snapdragon-835), was der Fertigung in Samsungs optimierten 10-nm-FinFET-Prozess zu verdanken ist. Dieser heißt 10LPP und soll gegenüber dem 10LPE (eine detaillierte Beschreibung dieses Prozesses findet sich hier), in welchem der Snapdragon-835 gefertigt wurde, eine Frequenzsteigerung von bis zu 10% bei gleicher Leistungsaufnahme oder eine reduzierte Leistungsaufnahme von bis zu 15% bei gleicher Taktfrequenz bringen.

Laut ARM bringt der Cortex-A75 bei gleicher Energieeffizienz wie der Cortex-A73 eine um rund 20 % höhere Rechenleistung als sein Vorgänger. Zusammen mit einer 14-prozentigen Erhöhung der Taktfrequenz würde der High-Performance-Cluster somit rund 34 % höhere Rechenleistung liefern, Qualcomm selbst geht von einem Anstieg von 25-30% aus. Auch diese Zahlen sprechen dafür, dass Qualcomms „Kryo 385“-CPUs keine deutlich höhere IPC liefern als ARMs Originale.

Was allerdings damit auch feststeht, ist die Tatsache, dass die vier Hochleistungs-CPUs absolut rechnerisch etwas mehr Leistung aufnahmen müssten als im Snapdragon-835, dessen CPUs bei Spitzenlasten jeweils mit etwas über 1 W zu Buchen standen.

Jeder „Kryo 385“-CPU steht ein L1-Cache von jeweils 64 KB für Daten und Befehle sowie ein privater L2-Cache von 256 KB Größe zur Seite. Dank des sogenannten Cache-Stashing von DynamIQ gehen wir davon aus, dass auch die GPU, der Hexagon-DSP und andere Hardwarebeschleuniger über den ACP bzw. AMBA-CHI-Port direkt Daten in den L2-Cache spezifischer CPUs schreiben können.

Die vier „Kryo 385“-Low-Power-Cores werden mit 1,8 GHz sogar 100 MHz langsamer getaktet als der Cortex-A53 beim Snapdragon 835, nichtsdestotrotz werden dank Verbesserungen der Mikroarchitektur des A55 gegenüber dem A53 rund 15% mehr Rechenleistung erzielt. Diesen CPUs stehen ebenfalls 64 KB L1-Cache für Daten und Befehle sowie pro CPU 128 KB privater L2-Cache zur Verfügung.

Der geteilte L3-Cache auf der DynamIQ-DSU ist zu 2 MB konfiguriert und arbeitet 16-fach assoziativ. Technisch gesehen ist er pseudoexklusiv, laut ARM arbeitet er real und sozusagen vollständig exklusiv, das heißt, die Cache-Line einer Adresse ist nur einmal in allen Cache-Leveln vorhanden.

Eine Cache-Line zu Adresse A im L1-Cache ist nicht zusätzlich im L2- oder L3-Cache vorhanden. Wird sie aus dem L1-Cache verdrängt, so kann sie entweder gänzlich verworfen werden, oder muss explizit in den L2-Cache kopiert werden. Dort wird somit ebenfalls eine (andere) Cache-Line verdrängt, um für die aus dem L1 Platz zu machen. Diese andere kommt nun ihrerseits in den L3-Cache, wo somit eine dritte Cache-Line weichen muss.

Bemerkenswert ist, dass nur drei Spannungs- und Frequenzebenen implementiert wurden: Eine für das High-Performance-CPU-Cluster, eine für die Low-Power-Cores und eine für L3-Cache und DSU. Tatsächlich wäre es mittels DynamIQ möglich gewesen, jeder CPU eine eigene Spannungs-/Frequenzebene zuzuweisen. Auf Nachfrage der DESIGN&ELEKTRONIK erklärte Qualcomms SVP Alex Katouzian, dass Test ergeben hätten, dass man sich eine höhere Granularität natürlich mit mehr Aufwand erkauft hätte und die Ergebnisse diese Investitionen nicht rechtfertigen würden.

Außerhalb der CPU gibt es einen weiteren 3 MB großen sogenannten Systemcache. Dieser ist an die Schaltmatrix angebunden und dient allen übrigen SoC-Einheiten, um die Anzahl externer Speicherzugriffe und damit die Leistungsaufnahme zu reduzieren.

Die Speicherschnittstelle zu externem LPDDR4-Speicher blieb gegenüber dem Snapdragon-835 mit vier 16-bit-Kanälen und 1866 MHz unverändert – der maximale Datendurchsatz beträgt weiterhin 29,9 GB/s.

X20 Modem mit fünffacher Träger-Aggregation

Das neue Modem gemäß LTE Kategorie 18 ermöglicht Downlaod-Geschwindigkeiten von bis zu 1,2 Gbit/s, da es 5x20 MHz Trägeraggregation bietet im Gegensatz zu 4xTrägeraggregation des X16, das auf dem Snapdragon 835 verbaut ist. Dies ermöglicht eine flexiblere Nutzung des verfügbaren lizenzierten und nicht lizenzierten Spektrums mit über 1000 möglichen Trägeraggregationsband-Kombinationen. Die Träger-Aggregation ist ein Verfahren der Trägerbündelung, das in Mobilfunknetzen zur Erhöhung der Datenraten eingesetzt wird. Die höheren Datenraten werden durch das Zusammenfassen von mehreren kleineren Bandbreiten zu größeren Frequenzbändern erreicht. Da sich in Mobilfunknetzen die Bandbreiten nicht erweitern lassen, kombiniert man bei Carrier Aggregation mehrere Einzelkanäle zu einem breitbandigen Übertragungskanal.

Das X20 erhöht auch die Anzahl der verwendbaren Funkstrecken von 10 auf 12, indem 4x4 MIMO auf drei aggregierten Trägern durchgeführt wird. Die Uplink-Datenrate bleibt gegenüber dem X16 gleich und unterstützt bis zu 150 Mbit/s mit  2x20 MHz Trägeragggregation und 64-QAM.

Durch die Unterstützung von 5xTrägeraggregation und Licensed Assisted Access, einer LTE Advanced Pro-Funktion, die Trägeraggregation auf lizenziertem und nicht lizenziertem Spektrum (5 GHz) ermöglicht, kann das X20 Gbit/s-Raten mit nur 10 MHz lizenziertem Spektrum erreichen. Dies ist in vielen Ländern, wo 20-MHz-Blöcke selten sind, wichtig. Derzeit können nur etwas über 60 % der Netzwerkbetreiber weltweit Gbit-LTE mit 20 MHz Trägeraggregation und Licensed Assisted Access anbieten. Diese Zahl erhöht sich auf 90 %, wenn 10 MHz Trägeraggregation und Licensed Assisted Access verwendet werden. Anders formuliert: Gegenüber dem X 16 bringt das X 20 26 % der Netzwerkbetreiber Gbit/s-Datenraten- zumindest theoretisch, wenn sich im unlizensierten Spektrum nicht Funk-Garagentoröffner u.ä. herumtreiben.

Das X20 bietet im Gegensatz um X16 Dual-SIM-Dual-VoLTE (DSDV), eine Technologie, die Netzwerkbetreibern ermöglicht, von herkömmlichen GSM-Netzwerken wegzukommen. Mit DSDV ist die zweite SIM-Karte nicht mehr auf 2G- oder 3G-Sprachübertragung beschränkt, da sie über LTE übertragen werden kann. Außerdem kann der Kunde damit für die LTE-Datenübertragung jede der SIM-Karten auswählen. Bislang wurde dies nur von MediaTek’s  Helio X30 SoC unterstützt.

GPU Adreno-630

Über die neue GPU, eine Weiterentwicklung der Adreno-540 aus dem Snapdragon-835. Nicht nur der Name verrät, dass es sich um signifikante architektonische Veränderungen handelt (kleinere Updates werden mit einem Hochzählen der Zehnerstelle gekennzeichnet z.B. von Adreno-530 zu -540, während größere einen Sprung in der Hunderter-Stelle bewirken wie in diesem Fall).

Eine versprochene Leistungssteigerung von 30% bei gleichzeitiger Steigerung der Energieeffizienz um 30%  bedeutet, dass bei gleicher Leistungsaufnahme 30 Prozent höhere Frameraten erzielt werden können. Was technische Details angeht, verriet Qualcomm wie üblich nichts. Auf Frage der DESIGN&ELEKTRONIK wurde uns jedoch immerhin mitgeteilt, dass die Taktfrequenz der Adreno-540 von 710 MHz auf welchen Wert auch immer angehoben wurde.

Der Snapdragon 845 ist laut Qualcomm die erste Mobilplattform, die Six-Degree-of-Freedom (6DoF) bei gleichzeitiger Lokalisierung und Kartenerstellung (Simultaneous Localization and Mapping, SLAM) bietet, das ermöglicht in VR-Anwendungen beispielsweise das Umgehen von Hindernissen.

DSP Hexagon 685

Der DSP stellt im Gegensatz zur GPU ein vermeintlich evolutionäres Upgrade dar, wie die Bezeichnung 685 statt 682 verrät. Nichtsdestotrotz legte Qualcomm bei seiner Präsentation sehr viel Wert auf künstliche Intelligenz (KI), was mit neuronalen Netzwerken einhergeht. Normalerweise kann man hier von DSPs keine großen Fortschritte erkennen, da sie architektonisch nicht zu den Anforderungen von neuronalen Netzen passen. Vielmehr müssen sie sowohl die Bildanalyse als auch die Bilderkennung/Bildklassifikation über neuronale Netze ausführen, zwei vollkommen unterschiedliche Aufgaben. Beim Snapdragon-845 sollen daher die Aufgaben auf CPU, GPU und DSP verteilt werden. Ob dies so effizient ist wie bei Apples A11 und Huaweis Kirin 970, darf jedoch bezweifelt werden: Beide beinhalten spezielle Neuronale-Netzwerke-Prozessing-Einheiten (NPU), Bei Huawei stammt die IP vom chinesischen Startup Cambricon. Die NPU schafft via 3x3 Matrizen-Multplikation 1,92 Teraflops bei halber Genauigkeit von Gleitkommazahlen (FP16). Sie kann auf Basis eines trainierten neuronalen Netzes verschiedene Aufgaben übernehmen, etwa das Analysieren von Fotos. Bei Apple gibt es keine Angaben, allerdings ist der Platzbedarf der NPU auffällig. Sie ist  kaum kleiner als die zwei leistungsstarken Monsoon-Kerne und weitaus größer als die vier Mistral-CPUs. Sie benötigt überdies mehr Die-Fläche als ein Zweikern-Cluster der Grafikeinheit. Alles dies zeigt, welche Bedeutung eine Hardware-NPU offensichtlich hat.

Von der Softwareseite hat sich auch bei Qualcomm zum Thema KI einiges getan: Zusätzlich zu der bestehenden Unterstützung für Google TensorFlow und Facebooks Caffe / Caffe2 Frameworks unterstützt das Snapdragon Neural Processing Engine SDK nun Tensorflow Lite und Open Neural Network Exchange (ONNX), so dass Entwickler jetzt einschließlich Caffe2, CNTK und MxNet auswählen können. Snapdragon 845 unterstützt auch Googles Android NN API.

Bildprozessor Spectra 280

Mit 64-fach gesteigerter Dynamik kann der neue Spectra 280 Image Signal Processor (ISP) in Verbindung mit der GPU Videos aufnehmen und wiedergeben. Es gibt UHD-Rec.2020 und 10 bit-Farb-Unterstützung für die HDR-Wiedergabe. Damit einher geht bessere elektronische Stabilisierung (EIS) und Rauschunterdrückung bei lichtschwachen Umgebungen.

Der Snapdragon 845 kann 16 MP statt mit 30 Frames/s wie beim Vorgänger jetzt mit 60 Frames/s aufnehmen, auch bei Zeitlupen-Aufnahmen sind Verbesserungen zu erwarten, der neue Chip unterstützt 720p bei 480 Frames/s. 1080p bei 240 Frames/s dürften damit ebenfalls möglich sein.

Das herausragende Merkmal des neuen Spectra 280 ISP scheint die Multi Frame Rauschunterdrückung (MFNR) zu sein. Dabei werden mehrere Bilder in schneller Folge erfasst und über einen Algorithmus eine Rauschunterdrückung in höherer Qualität angewendet, im Gegensatz zur herkömmlichen Einzelbild-Rauschunterdrückung, die Unschärfen verursachen kann.

Der Benchmark DXOMark Mobile, der die Bildqualität misst, erzielt auf dem Snapdragon-845 ein Ergebnis von über 100 Punkten. Natürlich war es Qualcomm wichtig, darauf hinzuweisen, dass Apples aktuelles iPhone “nur” auf 94 Punkte kommt.

Sicherheit

Der Snapdragon-845 enthält einen zusätzlichen Block mit der Bezeichnung Secure Processing Unit (SPU). Ähnlich wie bei ARMs Cryptoisland-300 genannter IP handelt es sich um einen vollkommen isolierten Bereich mit eigener CPU, sicherem Speicher, Zufallszahlengenerator und Verschlüsselungsblock. In diesem können z.B. Daten wie Fingerabdrücke oder Gesichtsmerkmale, aber auch Schlüssel abgelegt und verarbeitet werden, ohne dass er von außen gehackt werden kann. Der Datentransfer zu dem SoC-Bereich außerhalb der SPU erfolgt über geteilten Speicher. Auch eine Multi-Faktor-Authentifizierung soll von der SPU unterstützt werden.

Fazit

Zahlreiche Demos konnten einen guten Eindruck von den Fähigkeiten des Snapdragon-845 vermitteln. Abgesehen von den CPU-Eigenentwicklern Apple (Apple A), Huawei (Kirin) und Samsung (Exynos) wird kaum ein OEM an dem SoC vorbeikommen, das technisch vollkommen überzeugen kann. Highlights sind sicher der Spectra ISP, der, eine geeignete Hardware der Smartphone-Hersteller vorausgesetzt, hervorragende Fotos und Videos verspricht, das marktführende X 20-Modem und die neuartige Secure-Processing-Einheit, die, natürlich auch eine geeigente Implementierung vorausgesetzt, ein neues Level an Sicherheit für sensitive Daten ermöglicht.

Das Problem aus Qualcomms Sicht ist jedoch mehrschichtig: Erstens sind die drei oben genannten Firmen die Top-3-Smartphone-Hersteller, welche die meisten Geräte verkaufen. Zweitens hat sich das Wachstum des weltweiten Samrtphone-Marktes abgeschwächt, auch in China. Und drittens gibt es immer wieder das mehr oder weniger unsinnige Benchmarking und Ranglisten von Smartphones auf Basis der CPU-Rechenleistungen.

Auf Basis der genannten Zahlen ist es nicht zu erwarten, dass Apples A11 mit seinen Monster-CPUs geschlagen werden kann. Im Geekbench SingleThread schlug der A11 den Snapdragon 835 mit 4243 zu 1937 Punkten (siehe hierzu unser Artikel). Die Lücke wird mit dem Snapdragon 845 kleiner, aber nicht geschlossen werden können. Auch wenn diese Benchmark-Angaben in der Praxis nichts bedeuten, da die heutige CPU-Performance in realen Workloads gar nicht mehr ausgenutzt werden kann, lebt eine ganze Smartphone-Reviewer-Industrie davon,  Benchmarks zu messen und Bestenlisten zu generieren.

Für reale Smartphone-Nutzer wie mich verspricht der Snapdragon-845 jedoch herausragende Erlebnisse, wenn die OEMs Geräte bauen, sie seine inneren Werte auch ausnutzen.