Platzsparendes SOC CPU, Grafik und I/O auf einem Chip

Seit 2011 bieten sogenannte »APUs« bereits eine Kombination von CPU und GPU auf einem Chip. Jetzt treibt der Hersteller diesen Integrationsprozess noch weiter und nimmt den bisher separaten I/O-Controller-Hub ebenfalls mit auf den Die. Welche Vorteile können Entwickler von dieser neuen SoC-Plattform auf Basis der x86-Architektur erwarten?

Seit der Einführung der »Embedded G-Series« im Jahr 2011 hat AMD sogenannte »Accelerated Processing Units« (APUs) im Programm, die eine CPU und eine programmierbare GPU (Grafikprozessoreinheit) auf einem Die kombinieren.

Ergänzt mit einem I/O-Controller-Hub entstand so eine platzsparende Zwei-Chip-Plattform, die im Low-Power-Segment hohe Multimedia-Leistung und Parallelverarbeitung bietet.

Nun stellt das Halbleiter-unternehmen unter der Bezeichnung »Embedded G-Series System-on-Chip« (SoC) eine neue Plattform vor, die auf den Features der G-Series-Prozessorarchitektur aufbaut und die Zwei-Chip-Architektur der G-Series- APUs auf nur noch einen Chip reduziert (Bild 2). Darüber hinaus bietet die neue Plattform mehr Multimedialeistung, eine höhere (heterogene) Rechenleistung und unterstützt ECC-Speicher (Error Correction Code).

Zwei oder vier Kerne

Als Dualcore- und Quadcore-Versionen erhältlich, basieren die Chips auf dem neuen CPU-Core »Jaguar« in 28-nm-Fertigungstechnologie und der »Radeon«-GPU der »8000er«-Serie. Diese können gegenüber den bisherigen Architekturen bei höheren Taktraten mehr Befehle pro Taktzyklus verarbeiten, was sich auch bei der Ausführung verschiedener rechenintensiver Standard-Benchmarks widerspiegelt: In Vergleichstests mit einer Kombination aus den Benchmarks »Sandra Engineering 2011 Dhrystone«, »Sandra Engineering 2011 Whetstone« und »EEMBC CoreMark« erreichten die G-Series-SoCs einen Wert von 209, im Vergleich zum Wert 98 für den bisherigen Embedded-G-Series-APUs also eine um bis zu 113% bessere CPU-Leistung. Dieselben Messungen an einem Intel-Baustein vom Typ »Atom D525« ergaben laut Angaben von AMD einen Wert von 93, daher nennt AMD hier sogar eine im Vergleich um 125% höhere CPU-Performance für die neuen G-Series-SoCs.

Auch die Multimedia-Beschleuniger auf Hardwarebasis wurde überarbeitet: So bietet der verbesserte »Universal Video Decoder« neue Möglichkeiten für die Video-kodierung per Hardware. Zudem hat AMD das Clock-Gating (bedarfsgesteuertes Ein- bzw. Ausschalten von Taktleitungen bestimmter Schaltungsteile) verbessert und auf die Multimedia-Engine erweitert, um so die Leistungsaufnahme weiter zu verringern. Zudem ist der »Deep Power down«-Modus C6 nun auch auf der Multimedia-Engine verfügbar. Darüber hinaus unterstützen die neuen Bausteine jetzt eine drahtlose Displayanbindung über WiFi oder Ethernet bei geringer Latenz. Ebenfalls neu ist der Support von ECC-Speicher, der bis dato nur auf energiehungrigeren Prozessorplattformen zu finden war. Damit ist laut AMD erstmals eine Plattform im Low-Power-Segment verfügbar, die Anforderungen sicherheitskritischer IT-Infrastrukturen und Steuerungssysteme erfüllt.

Mehr Grafikleistung

Grafikseitig unterstützen die neuen Embedded-G-Series-SoCs zwei unabhängige, hochauflösende Displays und eignen sich dadurch besonders gut für grafikintensive Applikationen wie beispielsweise Digital-Signage, Spiele, Thin-Clients oder Mensch-Maschine-Schnittstellen (HMIs). Die integrierte GPU vom Typ »Radeon 8000« unterstützt »DirectX11.1«, »OpenGL 4.2« und »OpenCL 1.2«. Dadurch wird Parallelverarbeitung in hoher Geschwindigkeit möglich, und die Grafikverarbeitung ist ebenfalls deutlich besser: Auch hier hat AMD Vergleichsmessungen duchgeführt und gibt an, dass gegenüber den bisherigen G-Series-APUs bis zu 20% mehr Leistung bereitstehe, im Vergleich mit dem Intel Atom sei die Grafikleistung sogar fünffach besser.

Nutzen Entwickler diese standardisierten Computing-Frameworks, steht ihnen nicht nur eine große Werkzeugvielfalt offen, sondern der Lebenszyklus ihrer Applikationen wird länger, da sie auf einem standardisierten und kompatiblen Framework aufbauen. Dadurch lassen sich die Softwareentwicklungskosten senken und der mit der Applikation erzielbare Gewinn steigern.

Parallelverarbeitung mit OpenCL auf der CPU/GPU ist vor allem für Applikationen interessant, in denen es auf höchste Genauigkeit ankommt. Dazu zählen beispielsweise industrielle Steuerungen und Automatisierungsanwendungen sowie Projekte in den Bereichen Sicherheit und Überwachung, Medizintechnik sowie Kommunikation. Solchen Applikationen stellt die integrierte GPU über OpenCL-APIs eine Rechenleistung von bis zu 256 GFLOPs zur Verfügung.

Einfacheres Boardlayout

Auf der mechanischen Seite weisen die hochintegrierten SoCs in 28-nm-Technik einen um 33% kleineren Footprint auf als die bisherigen G-Series-APUs. So misst das BGA-Gehäuse der neuen APU 24,5 mm x 24,5 mm und beansprucht so mit einer Fläche von 600,25 mm² auf der Leiterplatte rund 290 mm² weniger als die bisherige Zwei-Chip-Lösung. Bei dieser schlägt die APU mit 19 mm x 19 mm zu Buche (361 mm²), der dazugehörige Controller-Hub beansprucht 23 mm x 23 mm auf der Platine, was 529 mm² Flächenbedarf entspricht. Doch der reine Flächengewinn ist nicht alles, denn die Entwickler müssen statt zwei nur noch einen Baustein auf der Platine integrieren, was die Entwicklungszyklen beschleunigt und darüber hinaus die Stücklisten reduziert.

Da zahlreiche Signalleitungen wie beispielsweise die zwischen Prozessor und Controller-Hub entfallen, können Entwickler auch die Anzahl der Platinenlagen reduzieren und die Stromversorgung vereinfachen. Das eröffnet zusätzliche Einsparpotenziale. Der geringe Leistungsbedarf der neuen SoCs ermöglicht zudem lüfterlose Designs. Damit werden Systeme nicht nur leiser, sondern auch zuverlässiger, da fehleranfällige mechanische Bauteile wie Lüfter entfallen können.

Platz sparen

Dank ihrer geringen Baugröße und der Single-Chip-Architektur eignen sich die neuen G-Series-SoCs besonders gut für kleine SBC- (Single Board Computer) und COM-Formfaktoren (Computer on Module). Weil für das Gesamtsystem weniger Leiterplattenlagen nötig sind, können Entwickler die Plattform laut Hersteller einfacher und kostengünstiger auf Small-Form-Factor-Designs (SFF) wie zum Beispiel »Pico-ITX«, »Qseven«, »PCIe/104«, »ETX« und »COM Express compact« und »-mini« implementieren. Zudem bietet der integrierte I/O-Controller alle Standardschnittstellen wie beispielsweise PCIe, SATA und USB - sogar inklusive des superschnellen Standards USB 3.0.

Ihre Vielseitigkeit unterstreichen die neuen SoCs durch den großen Leistungsbereich, den sie abdecken. Sie sind aktuell in vier Versionen erhältlich, von der 9-W-Dualcore-Version bis zum leistungsstärksten Quadcore-SoC mit 25 W TDP (Total Design Power). Alle SoCs verfügen über ein einheitliches, kompatibles BGA-Layout (Bild 1). Damit können Entwickler vom Einstiegsmodell ihrer Anwendung bis hin zum Hochleistungsprodukt ein einziges Leiterplattendesign einsetzen. Dieser »Common Platform«-Entwicklungsansatz kann die Produktentwicklung für OEMs sowohl auf der Supply-Ebene wie auch der Produktionsebene vereinfachen und zu signifikanten Kosteneinsparungen führen.

Mit den neuen Embedded-G-Series-SoCs steht Entwicklern also eine skalierbare Single-Chip-Lösung für SFF-Applikationen auf Basis der x86er-Architektur zur Verfügung. Sie profitieren dabei von dem bestehenden großen Ökosystem an standardisierter und optimierter Software, Betriebssystemen und Entwicklungsumgebungen. So können sie Applikationen mit einer Langzeitverfügbarkeit über mehrere Generationen und hoher Investitionssicherheit effizient und zu geringen Gesamtkosten umsetzen.

Über den Autor:

Kelly Gillian ist Product Marketing Manager der AMD Embedded Solution Division