Frame-synchrone Dekodierung für Infotainment-Systeme Verteiltes Video-Erlebnis

Während in der letzten Generation von Infotainment-Systemen die Dekodierung verschiedener digitaler Audio-Formate im Vordergrund stand, ging es in der aktuell im Markt verfügbaren Generation um die lokale Dekodierung ausgewählter Video-Formate wie MPEG2 und H.264. Für die Entwicklung der nächsten Generation steht nun die Verteilung der Video-Ströme an die verschiedenen Video-Senken innerhalb des Fahrzeugs im Vordergrund, wie beispielsweise in die zentrale Front Unit (FU) und die Rear Unit(s) (RU). Die Trennung von Video-Quelle und -Senke(n) wird getrieben von OEM-Forderungen nach Flexibilität, Netzwerk-Transparenz und Standardisierung bei gleichzeitiger Vermeidung aufwändiger und proprietärer Verkabelungen.

Die Entwicklungsherausforderungen an die beteiligten Zulieferer sind dabei beträchtlich, da es Fragen nach garantierter Bandbreite, geringen Latenzzeiten, verteilter A/V-Synchronisation, Clock-Synchronisation und Kompensation unterschiedlicher Laufzeiten sowie besonders die frame-synchrone Darstellung auf mehreren Displays zu lösen gilt. Dieser Beitrag stellt nach einer kurzen Darstellung der Anforderungen und technischen Probleme eine Lösung vor, die eine etablierte Multimedia-Plattform zu einem mehrplatzfähigen „Master/Slave-Videoplayer“ erweitert. Dies erfolgt derzeit im Rahmen von Projektentwicklungen für Hersteller im Premium-Segment.

Zunächst werden einige technische Anforderungen und Randbedingungen betrachtet, die für die Architektur von verteilten Video-Lösungen im Fahrzeug maßgeblich sind. In Bild 1 ist eine hierfür typische Systemkonfiguration dargestellt, bestehend aus den Bedienplätzen Front- und Rear-Unit, Hauptverstärker zur Ausgabe von Multichannel-Audio sowie gegebenenfalls einem Digital-/Analog-TV-Empfänger und einer Rückfahrkamera. Alle Komponenten sind über eine automotive-taugliche Hochgeschwindigkeits-Ringbus-Struktur (z.B. MOST150) miteinander verbunden.

Netzwerk-Transparenz: Das Gesamtsystem, bestehend aus verschiedenen Einzelkomponenten, soll dem Benutzer ein integriertes Infotainment-Angebot zur Verfügung stellen. Dies bedeutet, dass dem Benutzer von seiner lokalen Bedieneinheit Zugriff auf alle Medien im System ermöglicht werden soll. Eine DVD im Laufwerk der FU („Datenquelle“) muss sich dabei genauso verhalten wie eine DVD in der RU. Dies bedeutet, dass die Inhalte des Mediums, einschließlich aller Metadaten wie Titelinformation, Künstler, Genre oder Album, an jeder Bedieneinheit verfügbar sind, dass der Benutzer darauf zugreifen und die Abspielfunktion einschließlich aller Trick-Modi steuern kann. Schlussendlich müssen schließlich die dekodierten Audio- und Video-Inhalte an den Bedienplatz des Benutzers („Datensenke“) gesendet werden. Diese Eigenschaft ist bekannt als Netzwerk-Transparenz und stellt ein zentrales Kennzeichen ergonomischer Mehrplatz-Infotainment-Systeme dar.

Standardisierte Vernetzung: Alle Einheiten des Gesamtsystems sind über einen Standard-Bus miteinander verbunden. Üblicherweise kommt MOST als Medien-Bus mit einer hohen Bandbreite im Fahrzeug zum Einsatz. Die vorgestellte Lösung ist aber alternativ auch für Ethernet-basiertes TCP geeignet. Der Verzicht auf dedizierte Punkt-zu-Punkt-Video-Verbindungen einschließlich der dadurch bedingten Anschlussstellen, Abschirmungen, Treiber- und Eingangskomponenten bedeutet zum einen eine Einsparung an Kosten und Verbauraum, zum anderen einen Zugewinn an Flexibilität bezüglich der Anwendungsszenarien als auch der möglichen Verbausituationen.

Frame-sychrone Dekodierung: Selbst Bus-Systeme mit einer hohen Bandbrei-te, wie MOST150 mit 150 Mbit/s, erfordern die Übertragung von komprimierten Video-Formaten (5 bis 50 Mbit/s für High-Definition-Formate), da sie auch andere Signale wie Mehrkanal-PCM-Audio transportieren. Dies bedeutet in jedem Fall eine senkenseitige Dekodierung, beispielsweise von MPEG2- oder MPEG4-Datenströmen, während der Datenträger (DVD, USB oder SD-Card) in der Quelle angeordnet ist. Die Ring-Topologie der MOST-Architektur erlaubt nun, mehrere Senken zeitgleich mit demselben Signal zu versorgen, so dass sich eine Datenquelle parallel in n Senken darstellen lässt. Da im Fahrzeug, insbesondere auf den hinteren Plätzen, meist mehrere Bildschirme gleichzeitig sichtbar sind, ist die frame-synchrone Dekodierung und Darstellung zwingend erforderlich.

Audio/Video-Synchronisation und Latenzzeit: Für die lippensynchrone Video-Darstellung ist aufgrund unterschiedlicher Audio- und Video-Pfade und Dekoder-Laufzeiten die Synchronisation der Audio- und Video-Ströme notwendig. Während Audio dem Video-Inhalt durchaus bis zu ca. 120 ms nacheilen kann, macht sich der umgekehrte Fall – Video eilt dem Audio-Signal nach – bereits ab 5 bis 10 ms störend bemerkbar. Dieser Standard-Funktionsumfang jedes DVD-Players muss für den Master/Slave-Player erweitert werden, da hier nicht nur ein Video-Strom auf ein Audio-Signal synchronisiert ist, sondern mehrere. Dies erfordert zunächst eine Synchronisierung der Video-Ströme untereinander, damit sich eine frame-synchrone Darstellung auf mehreren Bildschirmen erreichen lässt.