Mit 3D-Kameratechnik können Industrieroboter Szenen räumlich erfassen und adaptiv auf Objekte reagieren oder sie greifen. Wenn die 3D-Bildverarbeitung zudem mit KI-basierter Inferenz kombiniert ist, wie sie spezielle KI-Kameras bieten, bewältigen sie Greifprozesse mit menschenähnlicher Intelligenz.
Industrieroboter werden heutzutage zur Automatisierung vieler verschiedener Aufgaben eingesetzt. In Verbindung mit 3D-Kameratechnik sind sie in der Lage, räumliche Szenen digital zu erfassen und adaptiv auf Objekte zu reagieren oder sie zu greifen, anstatt nur vorprogrammierte Abläufe auszuführen. Doch für bestimmte Tätigkeiten oder Situationen wie komplexe Kommissionierungsaufgaben ist immer noch ein hohes Maß an Intelligenz notwendig, sodass sie bisher nur von Menschen erledigt werden konnten.
Wenn die Aufgabe lautet, variantenreiche Produkte unterschiedlicher Größe, Form, Material oder auch Qualität aus unsortierten Kisten in Regale einzuräumen, muss nicht nur gegriffen, sondern vorher identifiziert und analysiert werden – Herausforderungen, die mit regelbasiert arbeitenden Bildverarbeitungssystemen nur schwer bis gar nicht lösbar sind. Doch in Kombination mit Inferenz auf KI-Basis lassen sich die Fähigkeiten von Industrierobotern vervielfachen.
Bei industriellen Anwendungen ist man eher daran gewöhnt, mit Objekten zu arbeiten, deren Formen bekannt und meist starr sind und zudem keine oder nur wenige Varianten aufweisen. Dabei besteht zunächst der Aufwand, das System so zu programmieren, dass Teile identifiziert werden können – etwa anhand eines CAD-Modells. Anschließend kann das System meist auch die Ausrichtung der Objekte erkennen und entscheiden, welches Teil der Roboter am einfachsten greifen kann. Und sobald dies funktioniert, lässt sich der Prozess beliebig oft wiederholen.
Auf diese Weise sind viele sich wiederholende, vorprogrammierte Aufgaben lösbar. Doch wenn die Anwendungen komplexer und die Produkte variantenreicher werden, reichen 3D-Daten für die Erkennung von Objekten und Merkmalen allein nicht aus. Immer mehr dieser Anwendungen erfordern daher zusätzlich eine Art von Bildverarbeitung.
Ein gutes Beispiel für solche Anwendungsfälle ist die Automatisierung von Logistikprozessen. Dazu zählen die Handhabung von Paketen, die Kommissionierung von Bestellungen und die Wiederauffüllung von Lagern. Bei diesen Anwendungen können Artikel beispielsweise in Form, Größe und Haptik variieren. Besonders bei der Auftragsabwicklung werden die zu verarbeitenden Artikel oft unsortiert in Körben oder Behältern an den Logistikroboter geliefert. Es ist dann äußerst schwierig, diese Teile automatisiert zu identifizieren oder gar zu klassifizieren, weil jedes anders ist.
Darüber hinaus könnte es ja auch wünschenswert sein, Produkte mit Qualitätsabweichungen auszusortieren. Für eine vollständige Automatisierung bzw. Unterstützung solcher Prozesse und ein erfolgreiches Greifen und Platzieren an der richtigen Stelle sind mehr Daten einer Szene notwendig – 3D-Kameras allein können diese oft nicht liefern.
Greifen mit menschenähnlicher Intelligenz
Der Einsatz von Industriekameras sorgt für eine hohe Flexibilität bei der Automatisierung von Handhabungsprozessen. Kameras und Bildverarbeitung ermöglichen eine verschiedenartige Auswertung unterschiedlicher (optischer) Merkmale. Keine andere Systemkomponente sammelt und interpretiert so viele Daten wie die Bildverarbeitung. Sie erlaubt es, die Qualität von Produkten zu überprüfen, zu verarbeiten und die Ergebnisse bereitzustellen, auf deren Basis der Roboter eine bestimmte Handlung ausführt, etwa ein automatisiertes Aussortieren fehlerhafter Teile.
Bei Embedded-Vision-Systemen erfolgt die Verarbeitung der »gesehenen« Daten sowie die daraus resultierende Steuerung »On Device«, also in der Kamera. Die abgeleiteten Befehle werden unmittelbar an den verknüpften Roboter weitergegeben. Die Übertragung von Daten und Ergebnissen an einen externen PC zur Auswertung wird dadurch überflüssig. Entsprechende Systeme lassen sich platzsparend in die Fertigungslinie integrieren.
In Kombination mit Inferenz auf KI-Basis lässt sich Industrierobotern heutzutage sogar das Produktwissen eines Facharbeiters antrainieren. Dazu analysieren künstliche neuronale Netze Bilder von unterschiedlichen Produktklassen und erkennen selbstständig Muster und Merkmale, die auf bestimmte Fehler hinweisen. Auf Basis dieser Erkenntnisse können intelligente Kameras automatisch Entscheidungen treffen, etwa indem sie fehlerhafte Bauteile erkennen und melden. KI löst damit Aufgaben, an denen die klassische Bildverarbeitung scheitert oder an Grenzen stößt – speziell, wenn organische und andere variantenreiche Objekte detektiert und klassifiziert werden sollen.
So verändern beispielsweise Textilien bei der Handhabung ständig ihre Form und sind dadurch nur schwer durch ein Regelwerk zu beschreiben. Ähnlich verhalten sich auch viele Lebensmittel mit flexiblen Folienverpackungen. Um solche Situationen zu meistern, muss ein Roboter möglicherweise den Greifer wechseln oder wissen, wie er mit bestimmten Gegenständen umzugehen hat. Mithilfe von Kameras auf Deep-Learning-Basis sind Roboter sogar in der Lage, unbekannte Objekte für E-Commerce, Lagerhäuser, Logistik und mehr gezielt aus der Masse zu greifen.
Mit ihrer Fähigkeit, sowohl bekannte als auch unbekannte Abweichungen von einem trainierten Gut-Zustand zu erkennen, bietet KI-Vision großes Potenzial etwa bei Qualitätskontrollen. Manuelle Sichtprüfungen oder Qualitätsbeurteilungen durch Facharbeiter werden dadurch reduziert und fehlerhafte Teile zuverlässig maschinell erkannt bzw. klassifiziert, bevor sie von einem Roboter gegriffen und folgerichtig gehandhabt werden.