An der Hochschule Pforzheim wurden die Grundlagen für einen neuen Ansatz zur 3D-Bilddarstellung entwickelt. Er soll zwei weit verbreitete Nachteile bei bestehenden Methoden umgehen. Anwendungsbereiche ergeben sich in der medizinischen Bildgebung, dem Molekulardesign und der Konstruktion.
Smartphone, Fernseher, Laptop – so gut wie alle Displays im Alltag stellen Bildinformationen zweidimensional dar. Für diese Anwendungsfälle ist das völlig ausreichend, in einigen professionellen Bereichen ist aber eine 3D-Bilddarstellung vorteilhaft. Dazu gehören Konstruktion, Fahrzeugdesign oder die Visualisierung von großen Datenmengen (Big Data). Technisch gibt es dazu verschiedene Methoden. Die geläufigsten Ansätze sind stereoskopische Displays mit Parallaxenbarriere, Lichtfelddisplays und Volumendisplays. Der technische Reifegrad und das Anwendungspotenzial sind je nach Ansatz unterschiedlich. Am weitesten fortgeschritten ist die Technik der Parallaxenbarriere. Schon vor einigen Jahren haben Automobilzulieferer damit begonnen, sie für Head-up-Displays zu adaptieren.
Nachteilig bei allen Ansätzen ist, dass sich die effektive Displayauflösung mit steigender Zahl der 3D-Perspektiven reduziert. In vielen der kommerziell verfügbaren 3D-Displays fehlt außerdem eine Multi-View-Funktion, um mehreren Betrachtern gleichzeitig eine individuelle 3D-Ansicht zu ermöglichen. »3D-Displays sind auf einen einzigen Betrachter ausgelegt und Multi-View-Displays haben heute üblicherweise keine 3D-Fähigkeit«, schreibt Michael Richter vom Displaylabor der Hochschule Pforzheim [1].
In seiner Bachelorarbeit hat er eine eigene Konstruktion für ein Multi-View-Display mit 3D-Bilddarstellung vorgestellt, mit der sich diese beiden Nachteile umgehen lassen. Der Prototyp erzeugt mehrere Millionen Perspektiven. Die Bilddarstellung wurde zunächst für maximal drei Beobachter ausgelegt, die Anzahl lässt sich aber noch weiter erhöhen. Bei Benutzung durch einen einzigen Betrachter wird eine Auflösung bis 2160 × 2160 Pixel erzielt, bei drei Betrachtern liegt sie bei 620 × 620 Pixeln.
Der Prototyp erzeugt in einer typischen Konfiguration einen Sichtbereich von 50° horizontal und 30° vertikal. Innerhalb dieses Bereichs kann ein Beobachter seine Kopfposition und damit seinen Blickwinkel verändern und ihm wird die richtige Perspektive eines Objekts dargestellt. Außerhalb des Sichtbereichs ist keine Bilddarstellung möglich. Die Begrenzung des Sichtbereichs in der Horizontalen ist durch die Ausführung im Prototyp gegeben, kann laut Richter aber auf volle 360 ° erweitert werden. Die vertikale Begrenzung auf einen gewissen Winkelbereich hängt mit dem gewählten Konstruktionsansatz zusammen: Ein Prozessor und ein GPU erzeugen eine 3D-Grafik auf kreisförmig angeordneten 4k-Displays, die vom Beobachter durch ein schnell rotierendes Periskop (60 U/s) betrachtet werden, das im Zentrum des Kreises steht (Bild 1).
Durch die hohe Rotationsgeschwindigkeit und die Trägheit des Auges entsteht für den Betrachter ein stabiles Bild. Unterschiedliche Perspektiven werden über Eye-Tracking und eine Regelschleife erzeugt. Ändert der Beobachter den Betrachtungswinkel, errechnet die Eye-Tracking-Software die neue Position und eine Rendering-Software generiert auf dem Display dazu eine Objektansicht aus der passenden Perspektive. Bild 2 zeigt ein Beispiel für die vertikale Ebene. Die Position der neuen Perspektive wird auf dem Display leicht horizontal bzw. vertikal verschoben. Für den Beobachter entsteht beim Bewegen des Kopfes der Eindruck eines ortsfesten, aber von allen Seiten und Winkeln sichtbaren Objekts.
Die Anzahl der möglichen Perspektiven hängt von der gewählten Objektgröße auf dem Monitor und der Auflösung des Monitors ab. »Bei einer Auflösung von 600 × 600 Pixeln [für das dargestellt Objekt] können die restlichen Pixel des 4k-Monitors zur Perspektivenerzeugung genutzt werden. Daraus ergeben sich für die horizontalen Perspektiven 3840 – 600 = 3240 und für die vertikalen Perspektiven 2160 – 600 = 1560 unterschiedliche Ansichten des abgebildeten Objektes«, schreibt Richter. Das Produkt beider Werte ergibt die Gesamtzahl der darstellbaren Perspektiven (>5 Millionen). Durch die große Anzahl sind ruckelfreie und nahtlose Perspektivwechsel möglich. Der darstellbare Farbraum entspricht dem des gewählten Monitors. Nicht alle der zurzeit erforschten Ansätze für 3D-Multi-View-Displays konnten eine Farbdarstellung demonstrieren.
Die horizontale Breite des erzeugten Sichtbereichs hängt von der Anzahl der kreisförmig angeordneten Displays und der Breite der beiden Periskopspiegel ab, die Vertikale des Sichtbereichs von der Höhe der verwendeten Displays und der Höhe der Periskopspiegel. Für den Prototyp wurde ein einziges 4k-UHD-Display mit 28 " verwendet (Asus PB287Q), was den horizontalen Betrachtungswinkel auf 50 ° begrenzt. Eine Erweiterung auf 360 ° in der horizontalen Ebene ist möglich, sodass mehrere Beobachter vollständig um das Objekt herumgehen und es gleichzeitig aus der für sie passenden Perspektive betrachten können. »Das ist ein wichtiger Vorteil des Periskopansatzes, sodass das Multiview-System auf einem runden Tisch mit nur dem Periskop montiert werden kann.«
Die Bildgröße hängt vom Abstand zwischen Betrachter und Periskop ab. Als typische Anordnung für einen einzelnen Beobachter nennt Richter eine Bildgröße von 20 cm × 20 cm bei 25 cm Abstand zwischen Periskop und Beobachter und 50 cm Abstand zwischen Periskop und Display.
Die Arbeit wurde in einem Paper auf der electronic displays Conference 2021 vorgestellt [2]. Dort wird ein Verhältnis von zwei Beobachtern pro installiertem 4k-Display als praxistauglich genannt, bei dem 760 × 760 Pixel Auflösung und 12 × 12 cm Bildgröße erzielt werden. Die Beobachter können sich in einem Kopf-zu-Kopf-Abstand von 1 m aufhalten. Der limitierende Faktor für die Anzahl an Beobachtern ist aber nicht die Zahl der installierten Displays, sondern die Ausführgeschwindigkeit der Softwareschleife mit Rendering. Für jeden weiteren Beobachter muss gleichzeitig auch ein zusätzliches Objekt berechnet werden, sodass die Bildwiederholrate sinkt. Die implementierte Software des Prototyps führt eine Schleife in 16,6 Millisekunden aus, was den 60 Hz Umdrehungsgeschwindigkeit entspricht. Die Rechenleistung dafür wird über einen Achtkern-Prozessor (AMD FX 8120, 3,1 GHz mit vier Kernen und acht logischen Prozessoren) und einen Grafikprozessor (AMD Radeon HD 7800) bereitgestellt. Für die Berechnung der 3D-Objekte wurde »Processing 3D« verwendet, das zur Java-basierten, quelloffenen Programmiersprache für 3D-Effekte »Processing« gehört. Die Augenverfolgung wurde über die ebenfalls quelloffene Bibliothek »OpenCV« und eine USB-Webkamera umgesetzt.
Das Bauvolumen des Gesamtsystems (Bild 3) beträgt etwa einen dreiviertel Kubikmeter und kommt damit natürlich nicht für Fernseher oder Laptops in Frage, sondern für Sonderformate in professionellen Anwendungen.
Mögliche Einsatzgebiete sind Konstruktionsabteilungen oder Darstellungssysteme in Technikmuseen. Nachteilig am Ansatz mit rotierendem Periskop ist die kurze Belichtungszeit. Die Persikopöffnung ist nur kurz auf einen Bildausschnitt gerichtet, was zu Helligkeitsabfällen führt. Zusätzlich muss zur Unterdrückung von Bewegungsunschärfe eine schmale Blende mit vertikalem Schlitz verwendet werden, was zu weiteren Helligkeitsverlusten führt. Sie können zu einem gewissen Grad kompensiert werden, beispielsweise durch einen helleren Monitor. Das im Prototyp verwendete Modell erreicht eine Helligkeit von 330 cd/m². Für diesen Fall empfiehlt Richter die Nutzung in einer dunklen Umgebung mit weniger als 100 lx Beleuchtungsstärke, was in etwa einer typischen Flurbeleuchtung entspricht.
Der gesamte Prototyp basiert zum Großteil auf kommerziell verfügbaren Komponenten und quelloffener Software, damit der Ansatz von der Wissenschaftsgemeinde weiterentwickelt werden kann. Damit erhöht sich laut Prof. Karlheinz Blankenbach, der die Arbeit betreute, auch die Chance auf weitere Anwendungsfelder: »Potenzielle Anwendungen sehe ich im Bereich Gruppenerlebnis in Wissenschaftsmuseen, aber auch in der Weiterentwicklung durch den Open-Source-Ansatz.« Die Arbeit seines Studenten bewertet Blankenbach als ausgesprochen hochwertig und stellt heraus, dass die Idee des neuen Konstruktionsansatzes »in herausragender Weise umgesetzt« wurde. Richter selbst bringt als weiteres Anwendungsgebiet Videokonferenzsysteme ins Spiel. »Dreidimensionale Inhalte werden in unserer Welt immer wichtiger. Bei der Kommunikation von Mensch zu Mensch, die zunehmend virtuell gestaltet wird, können 3D-Technologien ihren Beitrag dazu leisten, um ein mehrdimensionales Feedback des Gesprächspartners, etwa Mimik, Gestik, Nicken und Kopfschütteln, realistisch zu vermitteln.«
[1] Richter, M.: Entwicklung unterschiedlicher Ansätze für ein rotierendes Multi-View-Display. Abschlussarbeit, Fakultät für Technik der Hochschule Pforzheim, 2021.
[2] Richter, M.; Blankenbach, K.: 3D Multi-View Display Using a Rotating Periscope. Konferenzbeitrag, electronic displays Conference 2021, Nürnberg.