PCI/104-Express Fortschritte bei kleinen Formfaktoren

Der Anstieg von CPU-Leistung, Speicherkapazität und Datenbandbreite in Einklang mit dem Mooreschen Gesetz und die Implementierung als PCI/104-Express wird die Rechenleistung innerhalb des PC/104-Formfaktors vervielfachen. Darüber hinaus bietet PC/104 noch genügend Platz für weiteres Wachstum.

Das PC/104-Format wird weiterhin vom Mooreschen Gesetz profitieren, denn die CPU-Leistung hat ein neues Leistungshoch von 20 GIPS erreicht. Dieses begann mit Intels Notebook-Prozessor T7400 und wurde mit dem Intel-Core-2-Duo-Prozessor SP9300 fortgeführt. Ein derartiges Kraftwerk benötigt schnellen Arbeitsspeicher, der mit DDR3 zur Verfügung steht und eine Speicherbandbreite über 5,7 Gbyte/s mitbringt. Somit können gleichzeitig rechenintensive Fest- und Gleitkomma-Aufgaben ausgeführt werden. Parallel dazu lassen sich bis zu 180 Mbyte/s über den Video-Port ausgeben.

Trotz solcher Hochleistungskomponenten, die ideal für die Parallelverarbeitung großer Zahlenbestände, 3D-Rendering, Animation und Spiele geeignet sind, gehört keine dieser Aufgaben zu den Kernanwendungen von Embedded-Applikationen. Embedded-PCs sind überwiegend in den Bereichen Datenverarbeitung und Datenerfassung erfolgreich, z.B. sind Sensornetzwerke oder Bild- und Videoverarbeitung von hochauflösenden Digitalkameras zwei Breitband- Anwendungen, die von der Einführung des PCI-Express-Busses profitieren. Diese im physikalischen Umfang beschränkten Systeme können nun neue Herausforderungen bewältigen.

PCI/104-Express enthält die PCI-Express-Verbindung zur Anbindung der Peripheriegeräte mit hoher Bandbreite an Mehrkern-CPU-Systeme. Der Bus erhöht im PC/104-Embedded-Bereich sowohl die I/O-Bandbreite als auch den Datendurchsatz und erweitert dadurch das Anwendungsspektrum von modularen PC/104-Systemen. Modularität sorgt dafür, dass die Systeme ihrer Aufgabe angepasst werden können und aus einem maßgeschneiderten Mix an Peripherie bestehen. Da immer mehr Rechenleistung zur Verfügung gestellt wird, wächst die Datenflut über PCI-Express ständig: neue Embedded-Anwendungen wie High-Defintion-Video, Signalverarbeitung, Datenkommunikation und Verschlüsselung.

Gleichzeitig senden und empfangen

Die Serialisierung des PCI-Busses mit PCI-Express ändert die grundlegende Topologie von einem Mehrpunkt-Simplex-Bus zu einem Stern, der an jedem Endpunkt die simultane Vollduplex-Kommunikation mit bis zu sechs Peripheriegeräten erlaubt. PCIe/104 besteht aus vier ×1-Lanes mit 250 Mbyte/s und einem Multi-Lane-Teil, der üblicherweise einen ×16-Endpunkt mit 4 Gbyte/s, zwei ×8-Endpunkte mit 2 Gbyte/s oder zwei ×4-Endpunkte mit 1 Gbyte/s ansteuert.

Durch dedizierter Sende- und Empfangs-Signalpfade macht PCI-Express als Kommunikationsbus einen großen Schritt nach vorne. Die hohe Bandbreite erlaubt es, eine einzelne PCI/104-Express-CPU eine OC-192-Datenverbindung gezielt mit Sicherheitsfunktionen auszustatten. Ebenso können entsprechend schnelle CPUs und Speicher acht Gigabit-Ethernet-Verbindungen in eine OC-192-Datenverbindung multiplexen und demultiplexen.

Ursprünglich war die von PCI/104-Express angebotene ×16-Express-Schnittstelle als Verbindung mit hoher Bandbreite für einen externen Grafikprozessor entwickelt worden (PCI Express Graphics, PEG). Durch das Auftauchen von NVIDIAs Compute Unified Device Architecture (CUDA) übernehmen Grafikprozessoren inzwischen auch Aufgaben der Verschlüsselung, als Vektorprozessoren und als Physik-Engines.

Neue Marktanforderungen führen zur Anpassung bestehender -×4-, ×8- und ×16-PCI-Express-Designs. Ultra High Definition (UHD) und Hochgeschwindigkeits-Bilderfassung sind zwei Anwendungen, welche die ×16-Schnittstellen mit 4 Gbyte/s nutzen können. Diese kommen im System eher als Eingangs- statt als Ausgangssignale zum Einsatz. Durch die höhere Signalverarbeitungsleistung von Intels SSE4-Befehlssatz lassen sich die Kompressions- und Signalverarbeitungsaufgaben leichter im „Inneren“ des Prozessorkerns bewältigen als mit speziell für diese Aufgaben entwickelter Hardware.