Daten können toxisch sein

»Wer nicht aufpasst, bekommt Asbest statt Gold!«

30. Januar 2020, 15:56 Uhr | Heinz Arnold
Diesen Artikel anhören

Fortsetzung des Artikels von Teil 2

"Daten ohne Use Case haben keinen Wert"

Die Erwartungen sind viel zu hoch

Doch angetrieben durch die euphorischen und oft wenig reflektierten Berichte in den Medien erwarteten die potenziellen Anwender schlicht zu viel. Wer etwa ein Nahrungsmittelprodukt verkaufe und sich nun vorgenommen habe, zum Google dieses Nahrungsmittels aufzusteigen, dürfte eine Enttäuschung erleben. »Die Voraussetzungen für ein solches Geschäftsmodell sind schlicht nicht vorhanden.« Übrigens hatte auch Google ursprünglich als Entwickler einer Search Engine kein eigenes Geschäftsmodell, das kam erst 2003 mit der Übernahme von Applied Semantics, die sich mit Werbung und Anzeigenschaltungen beschäftigte. Dem Produkt (AdSense) war ein durchschlagender Erfolg beschert. Was einen weiteren interessanten Punkt aufzeigt: Wer mit Daten Geld verdient, verkauft sie nicht, sondern setzt ein Produkt darauf.

Die Kombination aus der „alten Welt“, der produzierenden Industrie, und der „neuen Welt“ – Big Data und KI – harmoniert dagegen bislang meist weniger gut. Denn die strukturierten und unstrukturierten Daten aus einem produzierenden Unternehmen zu sammeln, dann über ein KI-Modell zu trainieren, im Data Lake oder in einer Cloud, und das Ergebnis wieder zurück in die Prozesse des Unternehmens zu bringen, das funktioniert in der Praxis bei Weitem nicht so einfach, wie viele sich das vorstellen.

Das fängt schon bei der Erhebung der Daten in den Fabriken und Maschinen verschiedener Typen und Hersteller an. Denn die Daten kommen nicht nur in unterschiedlichen Formaten, sondern vor allem auch mit verschiedenen Datendefinitionen, Qualitäten und Erhebungstiefen. Sie müssen erst einmal so aufbereitet werden, dass sie überhaupt analysiert werden können. Und selbst wenn das gelingt, werden oft Äpfel mit Birnen verglichen. Denn die Daten können recht unterschiedlich ausfallen, je nachdem, welchen Einflussfaktoren – etwa Witterung, Zeitpunkt der Erhebung, lokale Umweltbedingungen – sie unterworfen waren.

Die Korrelationen, die dann aufgespürt werden, müssen also mit Vorsicht behandelt werden. Zumal ja auch die Sensoren über die Fertigungslinien ganz unterschiedlich verteilt sein können und mitunter sogar unterschiedliche Ergebnisse liefern. Eine einheitliche Datenqualität zu erreichen ist also schon in einer einzigen Produktlinie schwierig, geschweige denn über verschiedenen Produktionen in verschiedenen Fabriken oder gar verschiedene Hersteller hinweg. Und wenn das geschafft ist, dann müssen die KI-Ergebnisse auch noch gegebenenfalls in den Altsystemen angewandt werden (Inferenz). Bislang erwies sich das als schwierig und zeitraubend. Zum Glück gibt es hier aber neuerdings hybride Technologien, die die alte und neue Datenwelt zusammenbringen. Es wird also perspektivisch einfacher.

Solche Daten wie wertvollen Rohstoff über Firmengrenzen hinweg zu handeln, um darauf fiktive Services aufzubauen, hält Andreas Braun denn auch in den meisten Fällen für Science Fiction. Auf PowerPoint-Folien sehe das toll aus, in der Praxis habe es bis auf Weiteres keine Relevanz. Sein Schluss: »Daten ohne Use Case an sich haben gar keinen Wert!«

Selbst in recht feststehenden Umgebungen scheint es schwierig zu sein, mit Datenhandel und Sharing-Modellen Geld zu verdienen. So hat die Bosch-Tochter Coup den Versuch, E-Mopeds zu verleihen, eingestellt. Es scheint doch nicht so einfach wie gedacht zu sein, Elektromobilität als einen Service anzubieten. Eine solche Plattform ist eben keine Internetplattform, hier fallen echte Kosten an, nicht nur weil eine aufwändige IT-Infrastruktur aufgebaut werden muss, sondern weil zusätzliche Kosten zu Buche schlagen, mit denen die Internetplattformen nicht zu kämpfen haben. Zum Beispiel die Abnutzung der Fahrzeuge. Das merken die, denen die Fahrzeuge gehören. Airbnb dagegen hat das Problem nicht.

Doch in einigen Fällen geht es auch anders. Wenn in den USA der Super Bowl stattfindet, das größte Sportereignis der Welt, wollen sich das viele Werbetreibende nicht entgehen lassen. Für Werbung und Videoclips wurde bisher dazu eine spezielle IT-Infrastruktur aufgebaut, die einen dreistelligen Millionenbetrag kostet. Anschließend wurde sie wieder abgebaut, die Geräte lassen sich danach noch nicht einmal rentabel verkaufen.

»Accenture hat jetzt dafür ein System zusammen mit einer HyperCloud als serverlose Architektur eingerichtet. Die Anwender mussten also nicht mehr wie bisher ein eigenes Server-Zentrum errichten, um es nach dem Event zu entsorgen«, erklärt Braun. Der Kunde bezahlt im neuen Modell nur noch entsprechend der tatsächlich genutzten Volumina und Sekunden. In diesem Fall habe das die Kosten auf sage und schreibe einen fünfstelligen Dollar-Betrag verringert – gleichzeitig fiel auch die Energieaufnahme erheblich.

Fazit: Es gibt viele sinnvolle Anwendungen für KI, eben dort, wo sie sehr fokussiert innerhalb eines fest definierten Gebiets Einsatz finden kann. Innerhalb dieses Gebiets lässt sich eine einheitliche und ausreichend hohe Datenqualität herstellen, um sinnvolle Analysen durchführen und KI-Algorithmen anwenden zu können. Bildanalysen wären ein Beispiel, genauso akustische Analysen, etwa um Sprachbefehle zu erkennen oder den Zustand von Maschinen zu ermitteln. Aus einem unstrukturierten Wust von Daten sinnvolle Informationen zu destillieren ist dagegen auch der KI nicht möglich. Und wer neue Geschäftsmodelle für sein Unternehmen sucht, sollte sich überlegen, wie er die zugrunde liegenden Daten strukturiert erheben kann, wie sich daraus Informationen ableiten lassen und wie damit schlicht Mehrwert generiert werden soll. Im Gesundheitsbereich, in der Pharmazie, in der Materialwissenschaft und in der Forschung allgemein funktioniert das oft schon recht gut. In der industriellen Produktion fehlen dazu häufig noch die Voraussetzungen.

Kein Ärgernis, sondern Voraussetzung
Häufig ist zu hören, der Datenschutz sei hierzulande bei Weitem übertrieben und vereitle, dass Firmen mit Daten Geld verdienen könnten. Dr. Andreas Braun, Head of Data+AI bei Accenture Europa, sieht dies etwas anders. Vor allem persönliche Daten müssen seiner Ansicht nach effektiv geschützt werden: »Denn keiner kann heute wissen, wofür sie morgen genutzt werden – und von wem.« Um Big Data und KI künftig sinnvoll einsetzen zu können, sei der Datenschutz mehr Voraussetzung als Hindernis. Es handele sich bei KI und Big Data eben um sehr gute Werkzeuge, die aber leider – wie alle Werkzeuge – auch in unerfreulicher Weise gebraucht werden könnten. Deshalb sei es aber erforderlich, zu verstehen, was KI könne und was nicht: »Datenschutz, speziell Privacy, ist immer nur anwendungsfallbezogen realisierbar.« Vor allem wisse er dann auch, dass trotz eines umfassenden Datenschutzes KI nicht nur möglich sei, sondern dass sich sehr viel damit machen lasse.

Aus Daten lernen – oder reinfallen
Daten haben es in sich. KI-Systeme sind darauf angewiesen, aus vielen Daten lernen zu müssen. Aber auch die richtige Fragestellung ist ebenso wichtig wie die passenden Daten. Dr. Katrin Botzen, Analytics Manager von Accenture, gibt dazu ein Beispiel: Im zweiten Weltkrieg haben die Alliierten die Einschusslöcher der Flugzeuge genau untersucht, die von Feindflügen zurückgekehrt waren. Daraus wurde ermittelt, wo die Flugzeuge verstärkt werden sollten. Aber eigentlich hätte nur eine Analyse der Einschusslöcher der nicht zurückgekehrten Flugzeuge eine Prognose auf fatale Treffer gegeben.

Ein Beispiel dafür, wie ungewollt Vorurteile in die Daten gelangen können, hat sie ebenfalls parat: Eine KI sollte darauf trainiert werden, aus Lebensläufen die Kandidaten zu ermitteln, die für eine Position in einem Unternehmen geeignet wären. Ergebnis: Die KI hätte überwiegend Männer eingestellt. Und zwar deshalb, weil die Daten auf langjährigen Erfahrungen beruhten und früher Männer erfolgreicher waren, ganz einfach, weil es viel weniger Frauen auf diesen Positionen gab. Das war in den Daten faktisch richtig drin. Die Ursache aber lag außerhalb der Daten. »Die KI kann nur erkennen, was in den Daten steckt, und daraus Vorhersagen treffen«, so Dr. Botzen. »Auch hier zeigt sich wieder: KI ist nur ein Werkzeug, mit dem der Mensch lernen muss umzugehen. Ohne ihn und seine Fähigkeit, die Daten kontextabhängig beurteilen und interpretieren zu können, geht es nicht.« 


  1. »Wer nicht aufpasst, bekommt Asbest statt Gold!«
  2. Big Data und KI in der Werbung
  3. "Daten ohne Use Case haben keinen Wert"

Lesen Sie mehr zum Thema


Das könnte Sie auch interessieren

Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Accenture Services GmbH

Weitere Artikel zu Künstliche Intelligenz (KI)

Weitere Artikel zu IoT / IIoT / Industrie 4.0