Mit der Maschine sprechen #####

6. September 2007, 12:26 Uhr |
Diesen Artikel anhören

Fortsetzung des Artikels von Teil 4

Mit der Maschine sprechen

Druckversion

Die Anforderungen in der Industrie

Im industriellen Produktionsumfeld hingegen sind derartige Techniken – von wenigen Ausnahmen abgesehen – kaum zu finden. Woran liegt das? Zum einen sind die Anforderungen der Industrie an diese Systeme höher. Gefordert sind hier Erkennungsquoten von 100 %, die Möglichkeit multilingualer Nutzereingaben, sowie extrem robuste und dynamisch-flexible Dialoge, die in der Lage sind, Fehleingaben intelligent zu analysieren und sich dementsprechend zu verhalten. Zum anderen herrschen im industriellen Umfeld andere Umgebungsparameter und -situationen – man denke nur an stark lärmbelastete Produktionsstätten oder Branchen mit hohen Verschmutzungsgraden. Diese Einflussfaktoren sind in der Industrie maßgebliche K.o.-Kriterien. Dabei schließen die Weiterentwicklung der Systeme heute schon diese Lücken. Umgebungsgeräusche, wie sie beispielsweise durch Stanzen in Presswerken oder Förderbänder für Skids verursacht werden, lassen sich aufzeichnen und im Tonstudio herausfiltern. Anschließend werden diese Hintergrundgeräusche, die jede noch so gute Spracherkennung in die Knie zwingen, in die ASR-Engines integriert. Das heißt: Diese Frequenzen werden im Prozess der Spracherkennung gefiltert und fließen nicht in die Erkennung mit ein. Ein reales Beispiel hierfür ist eine Anwendung auf dem Güterbahnhof der BASF, wo extreme Umgebungsgeräusche wie Wind oder rangierende Wagons für die Spracherkennung kein Problem mehr darstellen.

Weitaus geringere Anforderungen gegenüber dem Einsatz im privatwirtschaftlichen Bereich stellen industrielle Anwendungen hingegen an die Quantität der zu erkennenden Kommandos, die sich in der Regel auf wenige Worte beschränken. Doch auch hier ist der Einsatz eines Sprachdialogs genau zu betrachten und zu analysieren. Gerade in diesem Umfeld ist es noch wichtiger, die Dialoge bis ins letzte Detail durchzudenken und insbesondere mit Blick auf den Kostenaspekt zeitlich zu messen. Mit anderen Worten: Auch ein kleines Vokabular, das prinzipiell handhabbarer und übersichtlicher ist, muss in Tests „auf Herz und Nieren“ geprüft und angepasst werden.

Soll ein Dialogsysteme zur Dokumentation Verwendung finden, so ist dafür in der Regel ein umfangreiches Vokabular nötig, bei dem bisherige Systeme schnell an die Grenzen der Verarbeitung stoßen und eine Echtzeit-Verarbeitung auch bei performanten Rechnersystemen nicht zuließen. Heutzutage kommen in solchen Fällen objektorientierte Konzepte aus der Programmierung zum Tragen. Dieses so genannte objektorientierte Vokabular beruht auf Klassenstrukturen, lässt sich intelligent verketten und macht damit solch ein „Mammutvokabular“ handhabbar. Im Pflegebereich beispielsweise kommen derartig aufgebaute Dialogsysteme, die eine Vielzahl an Fachbegrifflichkeiten abdecken müssen, zur Pflegedokumentation zum Einsatz. Ganz generell lässt sich in diesem Zusammenhang eine einfache Formel aufstellen: Je geringer der zu verwendete Sprachwortschatz, desto schneller die Erkennung und umso höher die Erkennungsquote.

CA706-07-Bild1_05.jpg
BASF-Güterbahnhof: Starke Umgebungsgeräusche wie Wind oder rangierende Wagons – für die Spracherkennungssysteme stellt dies heute kein Problem mehr dar.

  1. Mit der Maschine sprechen #####
  2. Mit der Maschine sprechen
  3. Mit der Maschine sprechen
  4. Mit der Maschine sprechen
  5. Mit der Maschine sprechen

Jetzt kostenfreie Newsletter bestellen!