Mehr Power »Core-i« der Vierten Generation im Embedded-Einsatz

Bei der Produktvorstellung der vierten Generation der »i-Series«-Prozessoren Anfang Juni in Taipeh hat Intel im Konsumelektronik-Bereich ein breites Spektrum an neuen Modellen vorgestellt, der Markt der Embedded-Module muss sich hingegen bisher mit einer einzigen Quadcore-Variante begnügen. Die aber hat es in sich: »Core-i7 4700EQ« bietet deutlich mehr Leistung als Intels bisherige Chips für diesen Markt.

Auf Intel ist Verlass: Seit vielen Jahren bringt das Unternehmen mit seiner »Tick-Tock«-Strategie in einem Jahr eine neue Fertigungstechnologie (Tick) und im Jahr darauf eine neu erweiterte Microcode-Architektur auf den Markt.

 Bei der jetzt eingeführten, bisher unter dem Codenamen »Haswell« bekannten vierten Generation der Core-i-Prozessoren handelt es sich um einen »Tock«, also um eine Optimierung und Weiterentwicklung der Architektur, insbesondere des Microcodes (Bild 1). Die Änderungen beinhalten neuen Microcode und erweiterte Register, einen Ausbau der Vektorrechnereinheit, größere und leistungsfähigere Grafikeinheiten, standardmäßige Hardwareunterstützung für AES-Verschlüsselung bei allen Modellen, überarbeitetes Power-Management, erweiterte, einzeln konfigurierbare Turbo-Modi und ein umfangreiches TDP-Management zur Anpassung an die jeweiligen Kühlmöglichkeiten. Der Technologiewechsel beim »Processor Controller Hub« (PCH) auf eine aktuelle 32-nm-Struktur ermöglicht erstmals Single-Chip-Lösungen, wie sie bei den Chips für die mobile Konsumelektronik bereits vorgestellt wurden.

Kontrollierte Leistungssteigerung

Die Effizienzgewinne gegenüber dem Vorgänger (im Normalbetrieb etwa im Bereich zwischen 10% und 15%) werden derzeit ausschließlich zur Leistungserhöhung genutzt. Durch die neu integrierten Spannnungsregler-Einheiten sinken zwar Flächenbedarf und Gesamtstromaufnahme des Systems, die TDP (Thermal Design Power) des einzelnen Chips steigt aber geringfügig um etwa 2 W an.

Neu ist, dass eine TDP-Konfigurationsfunktion die maximale TDP deutlich abregelt. Dies geschieht primär über eine Senkung des Prozessor-Grundtakts, was natürlich zu Lasten der Rechenleistung geht. Das neue TDP-Management kann aber noch viel mehr: In Verbindung mit dem konfigurierbaren Turbo-Boost und einer unabhängig von der Prozessorleistung konfigurierbaren Grafikleistung lassen sich für jede Anwendung ganz spezifische thermische Leistungsprofile definieren. So kann der Entwickler die TDP jetzt für jeden Kühlkörper und jeden Einsatz individuell begrenzen.

Intel spricht daher neuerdings von einer »Scenario Design Power« (SDP), die sich zwischen einer (sinnvollen) minimalen und einer absoluten maximalen TDP konfigurieren lässt. Für Embedded-Anwender wichtig ist das verbesserte Power-Management, das den Stromverbrauch im »Idle«-Zustand stark senkt. Dadurch sind bei batteriegestützten Geräten trotz gestiegener Systemleistung längere 
Standzeiten möglich, und das System kann bei nur sporadisch aktiven 
Anwendungen in den Pausen schneller abkühlen und dadurch höhere thermische Reserven aufbauen.

Fordert die Anwendung dann Rechenleistung an, können Prozessor und Grafikeinheit länger im Turbomodus arbeiten, bevor das System wegen Erwärmung des Chips Takt und Leistung zurückregelt.

Den größten Leistungszuwachs erfährt die vierte Generation der Core-i-Prozessoren mit der neuen Vektoreinheit »AVX2«, einer Weiterentwicklung der aus »SSX« entstandenen »AVX« (Advanced Vector Extensions). Mit AVX hatte Intel bereits bei der letzten Generation die Leistungsfähigkeit der bisherigen SSE-Einheit bei Gleitkomma-operationen durch Erweiterung der Befehlssätze von 128-Bit- auf 256-Bit-Vektoren und leistungsfähigere Puffer, insbesondere einen größeren Reorder-Puffer, deutlich erhöht. Mit den Prozessoren der vierten Generation wurden die Puffer jetzt nochmals vergrößert und die Ausführungseinheit um eine weitere Integer-ALU und eine zweite Sprungeinheit erweitert. Ferner kamen »FMA« (Fused Multiple Add) und »TSX« (Transactional Synchronisation Extension) zum Befehlssatz hinzu. In der Praxis bedeutet dies laut Intel bei großen Fest- und Gleitkommaoperationen eine Verdopplung der Rechenleistung der Vektoreinheit gegenüber dem Vorgängermodell.

Grafik mit mehr Leistung

Bei der im i7-4700EQ verwendeten neuen Standardgrafik »HD 4600« auf GT2-Basis erhöht sich die Anzahl der integrierten Recheneinheiten (Execution Units) gegenüber dem Vorgängermodell mit HD-4000-Grafik von 16 auf 20. Theoretisch würde dies erst einmal nicht nur zu entsprechend höherer Leistung (etwa +25%), sondern auch zu einem entsprechend höheren Stromverbrauch führen. Praktisch sparten die Intel-Ingenieure jedoch Strom, indem sie den Grundtakt der Grafikeinheit von 650 MHz auf 400 MHz absenkten. Und ein neuer Multiformat-Codec, der jetzt auch »SVC« (Scalable Video Coding/Decoding) unterstützt, führt zu weiterer Entlastung. So nimmt die Stromaufnahme trotz höherer Spitzenleistung bei vielen Anwendungen, die nicht ständig höchste Grafikleistung fordern, in der Gesamtbilanz sogar ab.

Mit »DirectX 11.1«, »OpenGL 4.0« und »OpenCL1.2« unterstützt die integrierte Grafik jeweils die aktuellsten Versionen dieser Standards. Neu hinzugekommen ist die Unterstützung nativer »4K2K«-Auflösung (bis zu 3840 x 2160 Pixel bei DisplayPort und 4096 x 2304 Pixel bei HDMI). Die teilweise mehr als doppelt so leistungsfähigen Grafiken der HD-5000- und Iris-Familien mit bis zu 40 Recheneinheiten und optio-nalem eDRAM auf GT3/GT3e-Basis, über die die kürzlich vorgestellten Ultrabook-Prozessoren verfügen, bietet Intel derzeit für die Embedded-Prozessoren der ISG (Intelligent Systems Group) aber nicht an. 
War die Hardware-Unterstützung von AES-Verschlüsselung bisher den Top-Modellen vorbehalten, so sind die »Intel Advanced Encryption Standard New Instructions« (Intel AES-NI) künftig auch bei den Budget- und Mainstream-Modellen verfügbar. Damit können besonders rechenaufwendige Pack- und Verschlüsselungsroutinen des bekannten Kryptografie-Algorithmus »AES« (Advanced Encryption Standard) schnell und sicher in Hardware implementiert werden. Dadurch ist leistungsfähige Verschlüsselung möglich, ohne die CPU-Cores und darauf laufende Anwendungen nennenswert zu belasten.

Integrierte Sicherheit

Aktuell legt Intel den Schwerpunkt bei der vierten Generation der Core-i-Familie für Embedded Systeme eindeutig auf hohe Leistung 
bei Grafik und komplexen Berech-nungen. Davon profitieren hauptsächlich die Anwender leistungshungriger Applikationen wie Bildverarbeitung, Tomografie, Radar, numerische Berechnungen und Simulation - und wegen der höheren Grafikleistung auch die Hersteller von Multimedia- und Gaming-Systemen. Die Leistung vieler Anwendungen kann laut Intel durch Nutzung der Befehlssatzerweiterungen AVX2, FMA und TSX um bis zu Faktor 2 steigen, dabei muss der Code aber - wenn überhaupt - nur geringfügig angepasst werden. Das meiste fangen die Betriebssystemhersteller und Compilerbauer in ihren Anpassungen auf.

Alternativ oder auch zusätzlich lassen sich für parallelisierbare Algorithmen die Verarbeitungseinheiten der integrierten Grafik über OpenCL nutzen. Mit dem neuen, variablen Coder können Entwickler auch anspruchsvolle Multimedia- und Gaming-Anwendungen realisieren. Und die Fähigkeit, drei voneinander unabhängige Displays ansteuern zu können, eröffnet mit der jetzt möglichen 4K2K-Auflösung neue Möglichkeiten für hochauflösende, zusammengesetzte Monitor-Panels in Digital-Signage-, Kontrollraum- und Simulatoranwendungen. Noch interessanter kann es für viele klassische Embedded-Anwendungen dann werden, wenn Intel in einer zweiten Welle auf Energieeffizienz optimierte Quadcore- und Dualcore-Modelle vorstellt.

Neue Technologie sofort verfügbar

Einer der größten Vorteile der modularen COM-Express-Technik ist, dass sich neue und bessere Prozessoren und Chipsätzen immer schnell und einfach integrieren lassen.

Wie Congatec mit dem »Computer on Module« (COM) »conga-TS87« zeigt, können COM-Module bereits mit der Produktvorstellung eines neuen Prozessors verfügbar sein (Bild 2). Zusammen mit ausgereifter Firmware und Treibersupport können Entwickler dadurch sofort in frühe, aber dennoch risikoarme Designprojekte mit dem neuen Prozessor einsteigen.

Auf dem »conga-TS87« im COM-Express-Formfaktor »Basic« setzt Congatec den neuen Embedded-Quadcore-Prozessor »Core i7-4700EQ« von Intel ein. Durch das Pinout vom Typ 6 lassen sich die integrierte Grafik mit ihren erweiterten digitalen Display-Schnittstellen und die hohen Bandbreiten von USB 3.0 und PCI 3.0 mit weiteren PCI-Express-Lanes uneingeschränkt nutzen. Das derzeit mit 6 MByte Level-2-Cache ausgelieferte Modul erlaubt den Betrieb mit 4x 2,4 GHz und einer TDP (Thermal Design Power) von 47 W. Im neuen, konfigurierbaren »Turbo Boost«-Modus kann die Taktfrequenz für einzelne Kerne auf bis zu 3,3 GHz klettern. Erst wenn die Temperatur des Prozessors dadurch stark ansteigt, verlässt die CPU diesen Modus wieder. Effiziente Wärmeabfuhr kann die Gesamtperformance also deutlich steigern (siehe Kasten »Wohin mit der Wärme?«). Mit der Funktion »configurable TDP« lässt sich die Verlustleistung auf 37 W TDP begrenzen; die Prozessorkerne arbeiten dann mit einer Grundfrequenz von 1,7 GHz und reduzierter Leistung.

Auf dem COM kommt das in stromsparender 32-nm-Technologie gefertigte »Mobile Intel QM87 Express Chipset« zum Einsatz (Bild 3). Unmittelbar nach deren Verfügbarkeit ist das Board auch mit zukünftigen, kompatiblen Dual- und Quadcore-Prozessoren vom Typ i3, i5 und i7 bestückbar. Mit maximal 16 GByte bis zu 1600 MT/s schnellem Dual-Channel-DDR3-Speicher lässt sich das Modul ausrüsten, auch mit den besonders stromsparenden L-Versionen mit 1,35 V. Die integrierte HD4600-Grafik unterstützt Intels »Flexible Display Interface« (FDI), DirectX 11.1, OpenGL 4, OpenCL 1.2 sowie eine leistungsfähige, flexible Hardwaredekodierung, um hochauflösende Full-HD-Videos auch mehrfach parallel und mit verschiedenen Raten kodieren/dekodieren zu können. Nativ ist eine »4K2K«-Auflösung mit bis zu 3840 x 2160 Pixeln bei DisplayPort und 4096 x 2304 Pixeln bei HDMI möglich, darüber hinaus lassen sich die bis zu drei unabhängigen Display-Schnittstellen über DVI, LVDS und VGA anbinden.

USB 3.0 sorgt für eine schnelle Datenübertragung bei geringem Energieverbrauch - von den insgesamt acht USB-Ports bieten vier USB 3.0 Superspeed. Für Systemerweiterungen stehen sieben PCI-Express-2.0-Lanes, PCI-Express-Graphik-3.0-x16-Lanes für hochleistungsfähige externe Grafikkarten, vier SATA-Schnittstellen mit bis zu 6 GBit/s und RAID-Unterstützung sowie eine Gigabit-Ethernet-Schnittstelle bereit. Weitere Funktionen des Moduls sind Lüftersteuerung, LPC-Bus für die einfache Anbindung von Legacy-I/O-Schnittstellen und Intel High-Definition Audio.

Über den Autor:

Zeljko Loncaric ist Marketing Engineer bei Congatec.

Wohin mit der Wärme?  
Die maximale TDP (Thermal Design Power) des Core i7-4700EQ liegt bei 47 W und damit für ein kompaktes Embedded System schon recht hoch. Mit einfachen Mitteln lässt sich die Abwärme hier nicht mehr schnell genug abführen, um zu verhindern, dass ein System wegen Überhitzung vorzeitig abregelt. Für solche Fälle hat Congatec eine modulare Hochleistungs-Kühllösung für COM-Systeme entwickelt, welche die Wärme mit jeweils eigenen Heatpipes vom zweiteiligen Chipsatz abführt und auf eine spezielle Verteilerplatte leitet. Bei geringeren Leistungen bis etwa 37 W und im normalen Kühlbereich führt ein integrierter Passiv-Kühlkörper die Abwärme direkt an die Umgebungsluft ab. Bei größeren TDP-Leistungen und im erweiterten Temperaturbereich muss der Heatspreader zur Wärmeableitung direkt auf ein größeres Metallgehäuse oder eine geeignete Gerätewand aufgeschraubt werden, oder es kommt eine aktive Kühlung mit integriertem Lüfter zum Einsatz.