GE setzt auf Nvidia Grafikchips auch als GPGPU genutzt

Das Potenzial der Chips von Nvidia nutzt GE Intelligent Plattforms nicht nur für Grafikkarten, sondern auch für Anwendungen die nach einem »Number Cruncher« verlangen. Mit bislang fünf Produktlinien unterstreicht das Unternehmen sein GPGPU-Engagement.

Es hat schon eine gewisse Ironie: Verlangten früher Computerspiele wie Flugsimulatoren ständig nach leistungsstärkeren Grafikchips, kommen heute diese Bausteine in kommerziellen und militärischen Avionik-Anwendungen zum Einsatz. Dabei beschränkt sich ihre Nutzung nicht nur auf die Visualisierung, sondern erstreckt sich auch auf die Datenaufbereitung als GPGPU (General Purpose Graphics Processing Unit).

GE Intelligent Plattforms setzt dabei auf die Bausteine von Nvidia für sehr unterschiedliche Produkte. So kann man GEs »XMCGA6« als klassische Grafikkarte im Embedded-Format bezeichnen: Das XMC-Board ist ausgestattet mit der Nvidia-G72- oder G73-GPU, die auch in PC-Grafikkarten, wie der GeForce 7300GS und GeForce 7600GT zum Einsatz kommt. Zur Kommunikation mit einer Host-Plattform unterstützt XMCGA6 acht PCI-Express-Kanäle - sie kann sich jedoch automatisch an PCI-Express-Umgebungen mit vier Kanälen anpassen. Bis zu 256 MByte an GDDR3-Speicher (G73) können dabei zum Einsatz kommen.

Bilder: 5

GE setzt auf Nvidia

Das Potenzial der Chips von Nvidia nutzt GE Intelligent Plattforms nicht nur für Grafikkarten, sondern auch für Anwendungen die nach einem »Number Cruncher« verlangen. Mit bislang fünf Produktlinien unterstreicht das Unternehmen sein GPGPU-Engagement

Mit ihren umfangreichen I/O-Funktionen eignet sich XMCGA6 für die meisten der gängigsten Videoanwendungen. Durch zwei unabhängige Kanäle kann die Karte RGB Analog Component Video und Digital-DVI-1.0 mit der maximalen Auflösung von 1600 x 1200 Bildpunkten betreiben und die Standards RS170, NTSC und PAL unterstützen. Darüber hinaus können über den Videoeingang der XMCGA6 externe Daten mithilfe der Videoformate RS170, NTSC oder PAL integriert werden. Unterstützt wird der Einsatz der Karte unter den Betriebssystemen Windows, Linux und VxWorks.

Deutlich unkonventioneller ist die Grafikplattform »SE2« im 6HE-VME-Format: Die Baugruppe kombiniert nämlich einen Intel-Core-2-Duo-Prozessor (»Penryn«), der mit bis zu 2,26 GHz arbeitet, mit einem Nvidia-Grafikprozessor (G72 oder G73) und einer 10-Gigabit-Ethernet-Netzwerkkarte. »Die Grafikverarbeitung bekommt einen immer größeren Stellenwert, stand jedoch in der Vergangenheit häufig im Kontrast zur Notwendigkeit, die Platinenzahl auf ein Minimum zu begrenzen«, erklärt Peter Cavill, Geschäftsführer der Sparte Military & Aerospace Products bei GE Intelligent Platforms. »Durch die Einführung der SE2 ermöglichen wir es Systementwicklern, eine robuste Grafikverarbeitung in ein System zu integrieren, ohne dabei Abstriche bei anderen Systemkomponenten zu machen.«

Zu den Standardmerkmalen der SE2 gehören 8 GByte DDR2-SDRAM, vier serielle Schnittstellen, sechs USB-2.0-Schnittstellen sowie PS/2-Anschlüsse für Maus und Tastatur. SE2 ist optional mit einer x4-PCI-Express-Schnittstelle (anstelle der 10-Gigabit-Ethernet-Schnittstelle), einem integrierten SATA-Festplattenlaufwerk sowie einer redundanten MIL-STD-1553-Einkanalschnittstelle erhältlich. Es kann zwischen fünf Belastbarkeitsstufen gewählt werden – von wenig anspruchsvoll bis leitungsgekühlt. Die Softwareunterstützung umfasst Wind River VxWorks 6.6, Windows XP und Windows Vista sowie Linux. Die Verfügbarkeit von OpenGL-Treibern unter VxWorks ermöglicht die Zertifizierung nach DO-178B.

Zu den typischen Anwendungen der Baugruppe gehören die digitale Kartierung (Digital Mapping), bei der große Mengen an Grafikdaten praktisch in Echtzeit dargestellt werden müssen und dezentrale Apertur-Sensoren (DAS), die beträchtliche Mengen visueller Informationen erfassen und verarbeiten müssen.

Die ungewöhnlichsten Einsätze von Grafikprozessoren ermöglichen jedoch die 3HE-VPX-Grafikplattform »GRA111« sowie die 6HE-Karten »IPN250« und »NPN250: Supercomputing-Anwendungen unter harten Umgebungsbedingungen. Die OpenVPX-kompatiblen Baugruppen sind mit GT-240-GPUs ausgestattet und für den Einsatz als GPGPU mittels »CUDA« (Compute Unified Device Architecture) konzipiert.

Die CUDA-Technologie von Nvidia ist eine universelle Architektur für paralleles Computing, die mithilfe der parallelen Computing-Engine in den Nvidia-GPUs zahlreiche Rechenprobleme in einem Bruchteil der Zeit löst, die dafür auf einer herkömmlichen CPU benötigt wird. Sie umfasst die CUDA Instruction Set Architecture sowie die parallele Computing-Engine des Grafikprozessors und bietet so eine bis zu 100-fache Geschwindigkeitssteigerung für ein breites Spektrum von Anwendungen, die sich für paralleles Computing eignen.

Das voll Leistungsspektrum können natürlich nur Programme nutzen, die von Anfang an für eine hohe Parallelität konzipiert wurden. Erste Tests haben aber gezeigt, dass auch reale Anwendungen von solchen Geschwindigkeitssteigerungen profitieren. Nach Angaben von GE hat ein bedeutender Kunde die CUDA-Architektur in einem Radarsystem getestet und kam zu dem Ergebnis, dass die Leistung mit nur geringer Umprogrammierung um das 15-fache gesteigert werden kann. Andere namhafte Auftraggeber haben ebenfalls großes Interesse an dieser Technologie bekundet. »Schon lange bestand Interesse daran, die Leistung hochmoderner GPUs, vor allem ihre enorme parallele Rechenleistung, für Anwendungen einzusetzen, die traditionell mit DSP- und FPGA-Prozessorarchitekturen arbeiten«, erklärt Cavill. »Durch die CUDA-Architektur können wir unseren Kunden eine Rechenleistung auf höchstem Niveau anbieten, die alle bisherigen Technologien auf dem Markt bei weitem übertrifft. Mit den GPUs von NVIDIA können Anwendungen, die Größen-, Gewichts- und Leistungseinschränkungen unterliegen, die Leistung von Supercomputing und paralleler Verarbeitung erbringen.«

Zusätzlich zu den Einsatzmöglichkeiten bei Radar, Signalaufklärung, Videoüberwachung und -auswertung bieten die CUDA-GPUs ein hohes Potenzial für weitere Anwendungen, z.B. Bildstabilisierung, SAR-Simulation (Synthetic Aperture Radar), Mustererkennung, Videokodierung/-dekodierung, Grafikdarstellung, Objekterkennung, Massenüberwachung und Verhaltensanalyse, Kryptographie, Sensorverarbeitung und SDR (Software-Defined-Radio).

Die GRA111 im 3HE-Format erzielt ihre erstaunliche Leistung zum großen Teil aus den 96 Prozessorkernen, der 128-Bit-Speicherschnittstelle, dem 1-GByte-DDR3-Grafikspeicher, der PCI-Express-2.0-Schnittstelle mit 16 Lanes, dem 540-MHz-Grafiktakt und dem 1302-MHz-Prozessortakt der GT 240 GPU. Die Baugruppe ist wahlweise als LRM-Lösung (Line Replaceable Module) gemäß dem Standard VPX-REDI (VITA 48) erhältlich und mit einem umfangreichen Satz von E/A-Treibern ausgestattet. Außerdem ist die GRA111 mit vielen der gängigsten Grafik- und Videoanwendungen kombinierbar - durch zwei unabhängige Kanäle werden die Standards RGB Analog Component Video, digitales DVI 1.0 und HDMI unterstützt. Darüber hinaus sind über den Videoeingang der GRA111 externe Daten mithilfe der Videoformate RS170, NTSC oder PAL integrierbar.

Der IPN250 verbindet die 96-Core-GPU GT240 mit einem Intel-Core-2-Duo-Prozessor, der mit bis zu 2,26 GHz und 8 GByte DDR3 SDRAM arbeitet, um je nach Anwendung bis zu 390 GFLOPS pro Kartensteckplatz zu erreichen. Das Funktionsspektrum des IPN250 umfasst zwei 10-Gigabit-Ethernet-Ports mit zwei Hauptdatenebenen, die Switched-Fabric-OpenVPX-Mehrplatinen-Architekturen unterstützen. Eine 16-Kanal–PCI-Express-2.0-Schnittstelle auf der Erweiterungsplatine P2 bietet Hochgeschwindigkeitskommunikation für Mehrplatinen-GPGPU-Cluster sowie System-I/0 für PCI-Express-fähige Sensormodule, wie die GE-Serie der Mezzanine-Karten Xilinx Virtex5 und Virtex6. Zwei 1000Base-T- und zwei 1000Base-Bx-Ports auf Steuerebene sind verfügbar, sowie zusätzlich PCI Express, USB 2.0, SATA, COM-Ports, GPIO, Audio- und TV-Eingang. Video und Multimedia werden unterstützt über die Dual-Link-DVI-, HDMI- und VGA-Direktanschlüsse.

Die Leistungsspitze in seiner CUDA-Palette markiert GE Intelligent Platforms mit der NPN240: Die 6HE-OpenVPX- und VITA48/REDI-kompatible Karte enthält zwei GT240-GPUs und kann (abhängig von der Anwendung) damit eine Spitzenleistung von bis zu 750 GFLOPS pro Kartensteckplatz erreichen. Mehrere NPN240 können mit einem oder mehreren Rechnern verbunden werden, um CUDA-GPU-Cluster mit mehreren Knoten zu bilden, die eine Leistung von Tausenden von GFLOPS erbringen können. »Die GPGPU-Technologie bietet eine flexiblere und kostengünstigere Alternative zu den FPGA-zentrischen Lösungen, die traditionell zur Bewältigung der größten Herausforderungen in der Branche eingesetzt werden«, resümiert Cavill.