Erkennen von Text und Barcodes Bildverarbeitungs-Systeme lehren Robotern das Lesen

Eva Weber, ABBYY: »Maschinen, die selbst lesen und reagieren können, sind für eine reibungslos funktionierende Industrieproduktion 4.0 unentbehrlich.«
Eva Weber, ABBYY: »Maschinen, die selbst lesen und reagieren können, sind für eine reibungslos funktionierende Industrieproduktion 4.0 unentbehrlich.«

Mittels moderner Texterkennungsverfahren können Bildverarbeitungssysteme Robotern und anderen Maschinen das Lesen beibringen. Für eine reibungslos funktionierende Industrieproduktion 4.0 sind solche Fähigkeiten entscheidend.

Auf dem Weg zur Industrie 4.0 wird es immer wichtiger, die innovativen Techniken, die die Industrieautomatisierung und -produktion stützen, nicht nur zu verstehen, sondern auch herauszufinden, wie sie Menschen dabei helfen können, diese Systeme optimal zu nutzen. Die heutigen großen Produktionsstätten verlangen nach hochgradig skalierbaren Montageprozessen und detaillierten Qualitätsprüfungen. Dabei setzen vollautomatische Robotiksysteme Teile zusammen, leiten sie durch das Werk und sorgen dafür, dass Qualitätsstandards eingehalten werden.

Algorithmen zur Verarbeitung visueller Informationen nutzen moderne Machine-Vision- und Computer-Vision-Systeme, bei denen eine Kombination aus Industriekamera und Recheneinheit die Funktionsweise der menschlichen Sichtprüfung simuliert. Machine-Vision-gestützte Robotiksysteme können »sehen« und auf Basis der erfassten visuellen Informationen eigene Entscheidungen treffen, die weit über die automatische Durchführung vorab festgelegter Schritte hinausgehen, wie sie etwa ein Schweißroboter auf einer Fertigungsstraße erledigt.

Durch die Integration hochentwickelter Techniken zur Texterkennung (Optical Character Recognition, OCR) können Machine-Vision-Systeme »Lesefähigkeiten« erwerben. Informationen in Textform, die auf Etiketten gedruckt sind oder auf Control-Panels oder Computerbildschirmen angezeigt werden, lassen sich erfassen, interpretieren und verarbeiten. Während Papierdokumente wie Service-Berichte oder Produktdokumentationen als Teil des Scan-Prozesses digitalisiert werden können, erfassen Automatisierungssysteme Informationen mit Kameras, die direkt in der Fertigungslinie oder Prüfeinrichtung implementiert sind. In beiden Szenarien stehen die Daten jedoch zunächst als reine »Bild-Informationen« zur Verfügung. OCR-Technik ist erforderlich, um sie so zu konvertieren, dass Maschinen sie lesen, durchsuchen und nutzen können.

Was genau können Maschinen lesen?

Wie ein Mensch können auch Systeme mit geeigneten Techniken Informationen in der Produktionslinie oder bei der Produkt-Qualitätskontrolle »lesen« und darauf reagieren. Diese Informationen können Text und Barcodes auf Verpackungen wie auch Bilder von Texten auf elektronischen Displays oder Bedien-Panels sein. Mit integrierten Datenerfassungstechniken können Robotik-, Computer-Vision- und Qualitätskontroll-Systeme die ausgelesenen Daten verarbeiten und mit Einträgen in Datenbanken vergleichen und dann das System zu entsprechenden Handlungen veranlassen. Die konvertierten Informationen lassen sich in Anwendungen und Systeme in Form von XML-Daten oder Klartext importieren. Dank dieser integrierten Fähigkeiten können Robotiksysteme zahlreiche völlig neue Aufgaben ausführen.

Indem Software- und Hardware-Anbieter hochentwickelte Techniken für Texterkennung - etwa OCR, Handschrifterkennung (ICR), Barcode-Erkennung (OBR) und optische Erkennung von Auswahlfeldern (OMR) - implementieren, können sie für die Fertigungsindustrie den Funktionsumfang von Machine-Vision-Systemen erheblich erweitern. Zu diesen Funktionen gehören:

•    OCR: Erkennung von Text auf Screenshots, in fotografierten Texten oder in gescannten Dokumenten. Der Text wird in elektronisch lesbare Daten konvertiert, die von Automatisierungssystemen verwendet werden können.
•    Hochentwickelte Techniken zur Bildvorverarbeitung: Automatische Optimierung fotografierter Bilder, etwa Zuschneiden von Bildflächen, sowie Verbesserung der Bildqualität, was für Aufnahmen in sehr dunkler Umgebung oder in sehr hellem Licht notwendig sein kann, um gute Erkennungsergebnisse zu erreichen.
•    ICR: Erkennung handgeschriebener Buchstaben in Formularen wie Wartungs-Checklisten oder Fragebögen
•    OMR: Erkennung von Auswahlfeldern oder Ankreuzkästchen in Formularen, Wartungs-Checklisten und Fragebögen
•    Barcode-Erkennung: Erkennung von 1D- und 2D-Barcode-Formaten, die für das automatische Routing von Teilen in der Fertigungslinie verwendet werden
•    Datenextraktion aus vordefinierten Bereichen: Erfassung von Informationen in bestimmten Bereichen einer Dokumentenseite