Embedded-R-Serie Turbo für Small-Formfactor-Applikationen

AMD
AMD

Die neue Prozessorfamilie »Embedded R-Series« von AMD vereint - wie schon die G-Serie - Grafikprozessor und CPU auf einem Chip. Allerdings ist die Rechenleistung zwei- bis sechsmal so groß, und das bei nur wenig erhöhter Leistungsaufnahme. Damit eignet sich diese »Accelerated Processing Unit« für kompakte Geräte z.B. in Industrie, Fahrzeugen, Medizin und für digitale Anzeigen.

Mit der ständigen Weiterentwicklung von Embedded-Systemen und den immer kleineren Bauformen tut sich zunehmend eine Lücke auf zwischen der benötigten Leistungsfähigkeit für neue und visuell ansprechende Applikationen und einem geringen Strombedarf, um diese Applikationen mit kleinen, mobilen Systemen umzusetzen. AMD hat mit mit der Embedded R-Series eine neue Prozessorfamilie eingeführt, die versucht, den Spagat zwischen Grafikleistung auf diskretem Niveau, guter Rechenleistung und niedriger Stromaufnahme zu schaffen.

Die Leistungen der x86-CPUs sind ständig gestiegen: Erst war es die Erhöhung der Taktrate, dann Größe und Anzahl der On-Chip-Caches und zuletzt das Hinzufügen weiterer Prozessorkerne. Das hat zu einem Leistungs-Zuwachs geführt, sodass PCs beim Multitasking viel effizienter wurden. Aber so schnell die modernen PC-Prozessoren auch sind - diskrete Grafikkarten sind für medienorientierte Anwendungen nicht überflüssig geworden, und auch für digitale Signalverarbeitung liefern x86-Prozessoren nicht das Leistung-pro-Watt-Verhältnis, das Small-Form-Faktoren erfordern.

Heterogener Ansatz nötig

Im Gegensatz zu herkömmlichen PC-Programmen, die in erster Linie mit skalaren Datenstrukturen und seriellen Algorithmen arbeiten, brauchen die aufkommenden neuen Embedded-Anwendungen - wie die medizinische Bildgebung oder intelligente Kameras - Prozessoren, die riesige Datenmengen bewältigen können, die aus Hunderten, wenn nicht Tausenden von einzelnen Threads bestehen, die parallel manipuliert und bearbeitet werden müssen. Im Gegensatz zu den konventionellen, sequenziell verarbeitenden CPUs sind moderne GPUs (Graphics Processing Unit) für massiv-paralleles Computing optimiert - egal ob für Grafik oder andere Aufgaben: Sie haben sich zu leistungsfähigen, programmierbaren Vektor-Prozessoren entwickelt, die hochgradig skalierbar sind und eine hervorragende Plattform für GPGPU-Berechnungen (General-Purpose GPU) von hochgradig parallelen Workloads darstellen, um datenintensive Algorithmen und Anwendungen zu beschleunigen.

Kleinere Die-Geometrien und Innovationen im Bereich des Silizium-Designs ermöglichten es AMD, die erste Familie zu erschaffen, die CPU+GPU-Lösungen auf einem Siliziumchip integriert. Mit Hunderten von Rechenkernen können diese heterogenen Multi-Core-Prozessoren oder APUs dazu beitragen, Größe und Leistungsaufnahme von eingebetteten Systemen signifikant zu reduzieren und gleichzeitig die Leistung zu steigern. APU steht für Accelerated Processing Unit. APUs vereinen sowohl x86-Prozessor-Cores als auch diskrete Graphics Processing Units (GPUs) auf einem einzigen Die. Sie verdienten den Namen APU, weil die GPU voll programmierbar ist und die Verarbeitungsprozesse des Prozessors bei rechenintensiven Aufgaben beschleunigen kann. Nutzt man bewährte x86-Core-Technologie für skalare Workloads und die GPU-Technologie für Vektor-Workloads, kann die Systemleistung also insgesamt verbessert werden.

Die neue Embedded-R-Serie

AMDs erste APU, die AMD G-Series, kam 2011 auf den Markt. Sie enthält 80 GPU-Kerne und ist in der Lage, 90 GFLOPS Single Precision Performance (Berechnungen mit einfacher Genauigkeit) zu erreichen. Die neue AMD R-Series APU erhöht die Anzahl der parallelen Recheneinheiten auf bis zu 384, was mit 576 GFLOPS Single Precision Performance mehr als eine sechsfache Verbesserung bedeutet. Und das bei einer nur wenige Watt höheren durchschnittlichen Leistungsaufnahme. Das macht sie zu einer idealen Plattform für anspruchsvolle embedded Applikationen wie Gaming, Digital Signage, medizinischer Bildverarbeitung sowie Sicherheit und Überwachung, die alle hohe Leistung benötigen.

Leistungsfähiger ist aber nicht nur die programmierbare Grafikeinheit geworden, auch die x86-Prozessorkerne wurden für mehr Leistung und Energieeffizienz überarbeitet. So setzt die neue Core-Architektur vermehrt auf gemeinsame Komponenten (Bild). Gegenüber der vorherigen Prozessorarchitektur greifen zwei x86-Cores nun auf bis zu 2 MB gemeinsamen Second Level Cache zu. Jeder Core besteht aus einem Integer-Core und einer 128-bit-Floating-Point-Unit. Auf einem CPU-Modul sind immer zwei Integer-Cores und zwei FPUs integriert. Diese zwei Floatingpoint Units können nun aber bei Bedarf zu einer 256-bit-FPU zusammengefasst werden, was die Gleitkomma-Rechenleistung deutlich erhöht.

Zusätzlich sorgen dedizierte Recheneinheiten für hohe Energieeffizienz bei spezifischen Tasks: So reduziert der neue Unified Video Decoder die Leistungsaufnahme der APU bei der Videowiedergabe. In der AMD R-Series APU kann er jetzt zwei unabhängige 1080p-Videostreams zeitgleich verarbeiten und unterstützt eine Blu-ray-Wiedergabe in 3D. Gänzlich neu ist die Video Compression Engine, die HD-Videos in Echtzeit und bei minimaler CPU-Last in das H.264-Format konvertiert. Das ist beispielsweise für Videokonferenz-Systeme oder Video-Überwachungs-Applikationen relevant. Ebenfalls neu ist die Secure Asset Management Unit. Sie sorgt für eine GPU-gestützte Ver- und Entschlüsselung sicherheitsrelevanter Daten. Applikationsfelder liegen hier beispielsweise im Bereich der Medizintechnik, bei Gaming und Cloud-Installationen.