Elektroniknet Logo

Diamant Software

Menschliche und künstliche Intelligenz vereinen

Rückert_Martin
Martin Rückert, Diamant Software: »Hybride KI hat das Ziel, den Menschen und die Maschine in der jeweils optimalen Form einzubinden.«
© Diamant Software

Künstliche Intelligenz dringt in immer mehr Lebensbereiche und Industriezweige vor. Noch relativ neu sind jedoch Hybrid- oder Human-in-the-Loop-Ansätze, die menschliche und künstliche Intelligenz direkt in der Anwendung kombinieren. Der KI-Experte Martin Rückert erläutert die Hintergründe.

Markt&Technik: Wie funktioniert die Zusammenarbeit von Mensch und KI im Sinne von hybrider KI oder Human-in-the-Loop-KI in der Praxis?

Martin Rückert, Chief Artificial Intelligence Officer (CAIO) von Diamant Software und Leiter des KI-Forschungszentrums Darmstadt: Der Begriff ist in der Fachwelt leider nicht präzise definiert. Es lassen sich allerdings zwei Sichtweisen unterscheiden: Die erste geht davon aus, dass die Maschine einen Arbeitsablauf erledigt und der Mensch „in die Loop genommen“, also mit einbezogen wird, indem er der Maschine im Sinne von Machine Learning mitteilt, wie sie etwas betrachten und bewerten soll. Im Machine-Learning-Prozess nennt man dies auch Annotation: Der Mensch macht der Maschine eine Vorgabe, und dadurch weiß die Maschine, dass sie deren Inhalte in ihr Modell integrieren und somit eine bessere Vorhersage machen oder den Prozess besser durchführen kann. Die zweite Sichtweise besagt, dass der Mensch eine Tätigkeit ausführt und die Maschine hinzufügt, wenn sie etwas schneller, besser oder kostengünstiger erledigen kann als der Mensch. Dies ist der überwiegende Fall, wie KI heutzutage zum Einsatz kommt.

Stark vereinfachend könnte man behaupten: Immer dann, wenn Menschen für eine konkrete Tätigkeit ein KI-Modell nutzen, handelt es sich um Human-in-the-Loop, aber das wäre wirklich sehr verallgemeinernd. Bei hybrider KI oder Human-in-the-Loop-KI geht es meist ganz konkret um das Tandem Mensch und Maschine, und zwar mit dem Ziel, die Kerneigenschaften der beiden optimal zu nutzen.

Abgesehen davon ist die Diskussion um KI auch eine politische – KI hat ja vielerorts den Ruf, sie nehme den Menschen wichtige Arbeit weg, sodass viele von ihnen arbeitslos werden. Hybride KI macht aber die Menschen eben nicht überflüssig im Sinne einer Komplett-Automatisierung, sondern gehorcht dem Prinzip, all das zu automatisieren, was sich sinnvoll automatisieren lässt. Sobald etwas nicht sinnvoll zu automatisieren ist, weil die Tasks einfach viel zu komplex sind, kommt hybride KI ins Spiel, um den Menschen und die Maschine in der jeweils optimalen Form einzubinden.

Relevante Anbieter

Diamant Software
Ein Beispiel des Dashboards von Diamant/4 zum Monatsabschluss
© Diamant Software

Inwieweit ist hybride KI schon Realität in konkreten Anwendungen?

Hybride KI und Human-in-the-Loop-KI unterscheiden sich nicht wesentlich voneinander, aber beides ist tatsächlich schon Realität. Ein Beispiel findet sich in Rechnungswesen und Controlling – Diamant bietet dafür eine Software an. Eine der Kernaufgaben in Rechnungswesen und Controlling ist es, Papierrechnungen einzulesen, zu interpretieren und in eine dafür vorgesehene Software wie etwa die von Diamant einzugeben, um sie dann zu verbuchen. Dieses Einlesen ist wichtig – es muss korrekt sein, weil man sonst hinterher auf falsche Zahlen kommt, es ist aber auch ein für den Menschen furchtbar langweiliger Prozess. Viele Anbieter von Software für Rechnungswesen und Controlling behaupten, ihre Lösung könne Rechnungen einlesen und in die Software übertragen. Leider sind aber die OCR-Prozesse und die Extraktionsprozesse, die jeweils mit KI-Modellen befeuert werden, sehr fehleranfällig. Im Rechnungswesen und Controlling will man idealerweise gar keine Fehler haben, und wenn Fehler auftauchen, dann will man natürlich wissen, welche Rechnungen das System falsch erkannt hat. Aber wenn das System nicht sagen kann, was richtig ist, kann es auch nicht sagen, was es falsch erkannt hat.

Angesichts dessen haben wir einen Human-in-the-Loop-Prozess entwickelt, in dem die Maschine den Menschen immer dann, wenn sie sich nicht sicher ist, fragt: Ist diese Rechnung so wirklich richtig? Man muss sich das so vorstellen: Die Rechnung wird eingelesen, und dann fragt die Maschine ganz konkret: Sehe ich hier auf dieser Rechnung vier Rechnungspositionen oder nur drei? Das ist für den Menschen eine triviale Frage, aber für die Maschine ist es schwierig, das auseinanderzuhalten. Wenn die Maschine nachfragt, muss ihr der Mensch also nur mitteilen: drei oder vier. Und danach verarbeitet die Maschine die Rechnung oder den Beleg fehlerfrei weiter, sodass es zu extrem niedrigen False Positive Rates kommt. Das ist der Idealfall, denn dadurch macht die Maschine das Ganze „langweilig“, also das, was automatisch verarbeitet werden kann, verarbeitet die Maschine, und der Mensch kann bei komplizierten Rechnungen auf einen Blick erkennen, was wirklich richtig ist. Das ist für die KI erstaunlicherweise immer wieder eine Herausforderung – was für das menschliche Gehirn nur eine sehr kurze Verarbeitungszeit erfordert, ist für eine KI oft ein fast unlösbares Problem. Deshalb kombinieren wir die Fähigkeiten von Mensch und KI in unserem Beispiel Rechnungswesen und Controlling so gut wie möglich.

Außer Rechnungswesen und Controlling gibt es auch industrielle Anwendungen hybrider KI. Welche Applikationen sehen Sie in der Industrie hauptsächlich?

Die Anwendungen liegen hauptsächlich in der Robotik und der industriellen Bildverarbeitung. Nicht wirklich industriell, aber trotzdem interessant ist ein Forschungsprojekt im Bereich Bielefeld/OWL, an dem wir beteiligt sind und in dessen Rahmen wir mit einem Unternehmen zusammenarbeiten, das Wäschereidienstleistungen anbietet. In diesem Prozess ist der Mensch der Hauptakteur, und die Maschine soll Wäschestücke, die so verschmutzt sind, dass sie der Mensch nicht anfassen will, vorab aussortieren. Das ist ein ziemlich komplexes Unterfangen, weil Wäschestücke nicht wie Maschinenbauteile oder mechanische und elektrische Komponenten eine klare Form haben. Sie sind mit Objekterkennungstechnik schwierig zu erkennen, aber mit neuronalen Netzen lässt sich das Problem lösen – dann sortiert die Maschine die Wäschestücke vorab aus, und der Mensch hat dann noch die verbleibenden, weniger verschmutzten Wäschestücke herauszusortieren.

In der Industrie kommt hybride KI vor allem dann zum Einsatz, wenn der Mensch den Roboter anlernt. Roboterprogrammierung ist historisch sehr kompliziert und erfordert viel Expertenwissen. Inzwischen hat sich aber als effektive Methode herauskristallisiert, dass der Roboter von einem menschlichen Lehrer lernt, indem er ihn beobachtet. Dies bringt interessante Herausforderungen bei der Kommunikation zwischen Mensch und Maschine mit sich. Wenn der Mensch dem Roboter sagen will, er habe etwas nicht richtig gemacht, dann muss der Mensch dem Roboter dies in geeigneter Weise vermitteln. Das klassische Verfahren dafür heißt „Learning from Demonstration“ (LfD); es ermöglicht, dem Roboter korrektes Handeln vorzuführen. Danach perfektioniert der Roboter das Gesehene mit Reinforcement Learning. Wenn der Roboter also Bauteile irgendwo ablegen, draufschrauben oder sortieren soll, und er macht das falsch, was ihm aber so nicht bewusst ist, dann kann man ihm mittels LfD die korrekte Arbeitsweise vorführen und dadurch das für Reinforcement Learning nötige Feedback liefern. Der Roboter verändert dann sein Handeln entsprechend. Wenn der Anwender einen Roboterarm mit der Hand führt und ihm dadurch bestimmte Bewegungen einlernt, wäre das ebenfalls Reinforcement Learning. Der Roboter lernt dann anhand erfolgreicher Beispiele.


  1. Menschliche und künstliche Intelligenz vereinen
  2. KI erfordert massive Verfügbarkeit von Rechenleistung in der Cloud
  3. Anwender müssen nicht jedes Detail verstehen

Verwandte Artikel

elektroniknet

Künstliche Intelligenz