Bildverarbeitungssysteme auf Basis künstlicher Intelligenz haben in den letzten Jahren die Robotik und die Qualitätssicherung umgekrempelt. Doch welche Vorteile haben die neuen Vision-Systeme konkret, und wie manifestieren sich die Unterschiede zu traditionellen Bildverarbeitungssystemen?
Die Automatisierung mit Robotern steigert seit 70 Jahren die Qualität, Effizienz und Produktivität in zahlreichen Industrien. Sie beweist sich mit hoher Präzision in Anwendungen wie der Montage, dem Schweißen, Lackieren, Verpacken oder der Maschinenbeschickung. Seit den 1980er-Jahren ermöglicht es die Bildverarbeitung, dass Roboter automatisch auf visuelle Eingaben reagieren und komplexe Aufgaben ausführen. Kamerabasierte Systeme verleihen Robotern einen menschenähnlichen Sehsinn und sind entscheidend für Anwendungen, die zuvor von Menschen erledigt wurden, etwa die Qualitätskontrolle und Pick-and-Place-Anwendungen.
Doch bis heute haben traditionelle Bildverarbeitungssysteme ihre Grenzen. Sie verwenden Ad-hoc-Methoden zur Erkennung und Lokalisierung von Objekten in 2D-Bildern, was sie empfindlich gegenüber unvorhersehbaren und spontan auftretenden visuellen Abweichungen wie Veränderungen in den Lichtverhältnissen macht. Selbst bei der Nutzung von 3D-Kameras ergeben sich aufgrund der Komplexität der 3D-Technologien Herausforderungen, weil sie oft auf fehleranfälligen Methoden wie Radar zur Messung beruhen. Um einen zuverlässigen Betrieb mit Vision-Systemen sicherzustellen, ist umfangreiches Ingenieurwissen erforderlich, was die Automatisierung von Aufgaben mit hoher Varianz schwierig und vor allem kostenaufwendig gestaltet.
Aus diesem Grund führen in Fabriken oft Menschen Aufgaben mit hoher Varianz aus. Menschen sind etwa in der Herstellung von Kühlgeräten für die sogenannten Leckagetests verantwortlich, bei denen die Rohre auf der Rückseite eines Kühlschranks, durch die Kühlgas fließt, auf ihre Dichtheit überprüft werden. Aufgrund der vielen Varianzen, die bei jeder Testepisode auftreten, wäre es fast unmöglich, die Aufgabe mit einem traditionellen Bildverarbeitungssystem zu automatisieren.
Hier sind Beispiele für mögliche visuelle Varianzquellen bei der Leckageprüfung:
Für einen Menschen ist es recht offensichtlich, wo die Sonde zum Prüfen positioniert werden muss, auch in Szenen mit wechselnder Beleuchtung und Varianz in der Position der Lötstellen. Traditionelle Bildverarbeitungssysteme dagegen reagieren auf optische Eingaben und sind oft auf eine Art visuelles Muster angewiesen, um die Prüfung durchzuführen. In dem oben beschriebenen Fall der Leckageprüfung würde der Roboter aufgrund der vielfachen Varianzen nicht robust genug reagieren, um die Aufgabe zu bewältigen.
Doch was wäre, wenn es eine neue Bildtechnologie gäbe, die eine verallgemeinerbare Regel für die Leckageprüfung von Kühlschränken aufstellen könnte, indem sie dem Roboter alle auftretenden Varianzen ganz einfach zeigt? Sobald der Roboter verschiedene mögliche Varianzen für jedes Rohr gezeigt bekommt, weiß er, wie er jedes Werkstück in einer neuen Position visuell erkennen kann.
KI-gesteuerte Vision-Systeme läuten einen Paradigmenwechsel in der robotergestützten Automatisierung ein. Dank neuronaler Netzwerke befähigt Vision-Technologie auf KI-Basis Roboter, Aufgaben durch menschliche Demonstrationen zu erlernen. Auf Basis bildbasierten Teachings bilden KI-gesteuerte Vision-Systeme Modelle von Aufgaben und entdecken eigenständig die visuellen Merkmale, die für deren Ausführung erforderlich sind. Diese Systeme können Varianz in Form, Position, Farbe und Lichtverhältnissen sowie Transparenz oder Spiegelungen ohne komplexe Codierung oder manuelles Feature-Engineering bewältigen und überwinden damit die Einschränkungen traditioneller Systeme.
KI-gesteuerte Vision-Systeme bieten mehrere Vorteile gegenüber traditionellen Bildverarbeitungssystemen:
Traditionelle Bildverarbeitungssysteme waren in der industriellen Automatisierung von unschätzbarem Wert, hatten jedoch bei nicht kontrollierbaren Varianzen ihre Grenzen – so unter anderem im Umgang mit transparenten oder reflektierenden Werkteilen. Das Aufkommen von KI-gesteuerter Technologie bietet einen neuen Ansatz, der Robotern ermöglicht, Aufgaben in Echtzeit auszuführen. Indem sie Varianz in Form, Position, Farbe und Lichtverhältnissen bewältigen, eröffnen diese Systeme neue Möglichkeiten für die Automatisierung in verschiedenen Branchen.