Robot Vision by Fraunhofer IPMS Roboter bekommen noch bessere Augen

Optischer Scankopf einer 3D-ToF-Kamera mit integriertem MEMS-Scannerspiegelarray
Optischer Scankopf einer 3D-ToF-Kamera mit integriertem MEMS-Scannerspiegelarray

Ein 3D-Kamerasystem mit neuartiger MEMS-Scantechnik und entsprechender Bildanalyse-Software soll es Robotern künftig ermöglichen, als relevant erkannte Objekte in ihrer Umgebung mit höherer Auflösung zu erfassen, ohne dadurch die Datenmenge vergrößern zu müssen. Ein funktionsfähiger Prototyp liegt bereits vor.

Dreieinhalb Jahre lang haben fünf Forschungseinrichtungen und zwei Industrieunternehmen im Rahmen des europäischen Verbundforschungsprojekts »TACO« (Three-dimensional Adaptive Camera with Object Detection and Foveation) an der Entwicklung eines neuartigen 3D-Kamerasystems gearbeitet, das Roboter befähigen soll, anspruchsvollere Aufgaben als bisher zu übernehmen. Das Fraunhofer-Institut für Photonische Mikrosysteme (IPMS) in Dresden steuerte eine neuartige MEMS-Scantechnik als Hardware-Schlüsselkomponente bei. Auf der Fachmesse »Photonics West« in San Francisco vom 4. bis 6. Februar stellte das Fraunhofer IPMS das komplette Kamerasystem erstmals als funktionsfähigen Prototyp vor.

Farben und Helligkeiten zu unterscheiden, Entfernungen einzuschätzen, Gegenstände und Bewegungen in der Umgebung rasch dreidimensional zu erkennen - was für die Menschen dank ihrer Augen und ihres Gehirns ein Leichtes ist, bedeutet für Maschinen eine große Herausforderung. Nicht von ungefähr ist es bislang nur in Ansätzen gelungen, Roboter zu entwickeln, die Service-Aufgaben wie etwa Reinigung, Bau, Wartung, Sicherheit oder persönliche Betreuung übernehmen können. So mangelt es Robotern beim künstlichen dreidimensionalen Sehen entweder an räumlichen Echtzeit-Informationen oder an der nötigen Schärfe, oder die Fülle der erfassten Bildinformationen ist zu groß, um schnell genug verarbeitet und in Handlungen umgesetzt werden zu können.

Wenn es nach den Forschern des Fraunhofer IPMS geht, könnte sich dies jedoch bald ändern. Die Wissenschaftler haben eine auf Fertigungsmethoden der Mikrosystemtechnik fußende, extrem kompakte Scantechnik (»LinScan«) für ToF-Entfernungsmesssysteme (Time of Flight) entwickelt, die eine dreidimensionale Bildaufnahme mit flexibler Abtastgeschwindigkeit und somit ein Scannen mit angepasster Auflösung ermöglicht. Mit »LinScan« ausgestattete 3D-Kamerasysteme könnten Roboter künftiger Generationen dazu befähigen, ihr Umfeld nach im Sichtfeld auftauchenden Objekten grob abzusuchen und lediglich die gesuchten Objekte mit größerer Genauigkeit aufzulösen. Die Roboter hätten es mit vergleichsweise geringen Datenmengen zu tun und wären dennoch in der Lage, ein besseres Verständnis ihrer Umgebung zu gewinnen, um mit alltäglichen Objekten und unserer Umwelt interagieren zu können.

Voraussetzung für eine Umsetzung dieses »Foveation« genannten Prinzips ist allerdings, dass der Roboter weiß, wonach er suchen soll, und dass er die gesuchten Objekte auch rasch erkennen und interpretieren kann. Neben der Hardware (»Auge«) benötigt er dazu entsprechende Bildanalyse-Software-Algorithmen (»Gehirn«). Außerdem sollte der Roboter mit Bildsensoren und Software für dreidimensionales Sehen ausgestattet sein, um ein räumliches Verständnis seiner Umwelt gewinnen und so Objekte präzise ansteuern zu können.

Um all diesen Anforderungen gerecht zu werden, arbeitete das Fraunhofer IPMS im Rahmen des »TACO«-Projekts an der Entwicklung eines neuartigen adaptiven 3D-Kamerasystems. Herzstück des Systems ist ein optischer Scankopf mit fünf synchron betriebenen »LinScan«-Spiegeln des Fraunhofer IPMS. Das MEMS-Scannerarray gewährleistet die erforderliche Empfangsapertur des ToF-Entfernungsmesssystems von effektiv 5 mm und wurde für ein adaptives 3D-Kamerasystem mit mindestens 40° x 60° optischem Scanbereich, 1 MVoxel/s Messrate des ToF-Entfernungsmesssystems und 3 mm Messunsicherheit bei 7,5 m Messentfernung ausgelegt. Der quasistatische Antrieb der Mikroscanner ermöglicht einen zeilenweisen Bildaufbau mit variabler Bildwiederholrate von <1 bis 100 Hz, wobei im relevanten Bildbereich die vertikale Messpunktdichte durch Verringerung der Scangeschwindigkeit lokal erhöht werden kann. Die horizontale Bildaufnahme mittels des kardanisch gelagerten, 1,6 kHz resonanten Mikrospiegels sorgt gegenüber einem 2D-quasistatischen Antrieb für größere Empfangsapertur und somit höhere Auflösung der ToF-Entfernungsmessung bei zugleich großem optischen Scanwinkel von bis zu 80°.