KI und Ethik

Mehr Transparenz für KI-Modelle und Datensätze

6. Oktober 2022, 13:00 Uhr | von Ade Adewunmi, Cloudera
künstliche Intelligenz
© AdobeStock

KI-Modelle und -Anwendungen zu entwickeln ist nicht einfach. Gerade wenn Entwickler zusätzlich ethische Gesichtspunkte berücksichtigen wollen. Data Sheets und Model Cards können dabei helfen.

Wie viele von uns machen sich im Alltag wohl Gedanken über die Sicherheit und Zuverlässigkeit von Kernkomponenten physischer Infrastruktur von Gebäuden oder Brücken? Sicherlich tun das die wenigsten von uns. Das liegt nicht daran, dass wir leichtfertig mit unserer Sicherheit umgehen. Vielmehr sind wir uns bestehender Vorschriften und Gesetzte bewusst, die dafür sorgen, dass die Gebäude, in denen wir leben, arbeiten und spielen, nicht einstürzen, während wir unseren Alltag bestreiten. Wir wissen, dass es diese Regelungen gibt, obwohl die meisten von uns keine Experten für Bauvorschriften oder die Prozesse in städtischen Planungsbehörden sind. Wir vertrauen auf diese Institutionen, da sie ihre Kompetenz im Laufe der Zeit bewiesen haben, denn der Einsturz von Gebäuden ist relativ selten. Außerdem sind diese Institutionen und ihre Funktionen relativ leicht verständlich, gut beschrieben und ihre Verfahren relativ transparent. Dies gilt nicht nur für Gebäudeeigentümer, die beispielsweise bauliche Veränderungen an ihren Gebäuden vornehmen wollen, sondern auch für Fachleute wie Klempner, Elektriker und Architekten, die diese Veränderungen durchführen. Die Institutionen verfügen über festgelegte Prozesse für die Interaktionen mit diesen unterschiedlichen Nutzergruppen.

Verbraucher brauchen proaktiven Schutz

Warum also scheint dies im Bereich der Einzelhandelstechnologie nicht der Fall zu sein? Hier obliegt es oft dem Endnutzer, zu verstehen und herauszufinden, was bei Problemen mit datenzentrierten Technologien zu tun ist. Die gängige Praxis zur Schadensminderung in der Branche besteht eher in der Berichterstattung durch Nutzer als in einer proaktiven Moderation und Durchsetzung geeigneter Maßnahmen. Es gibt Beispiele für staatlich verordnete Verhaltenskodizes wie den Age Appropriate Design Code, die die Vorgehensweise einiger Tech-Giganten im Einzelhandel verändert haben. Im Großen und Ganzen waren die Bemühungen der politischen Entscheidungsträger und Behörden jedoch eher reaktiv: Sie haben auf Beschwerden gewartet, anstatt proaktiv ihre Befugnisse zu nutzen, um bekannte Probleme anzugehen. Selbst die Umsetzung der bahnbrechenden EU-Datenschutzgrundverordnung (DSGVO) ist in die Kritik geraten. Verbraucher, Betroffene und zivilgesellschaftliche Gruppen haben sich über die relativ langsame und unzureichende Durchsetzung der Verordnung beschwert. Sie kritisieren vor allem den anhaltenden Missbrauch durch viele Datenmakler bei der Erhebung und Nutzung personenbezogener Daten und die Untätigkeit der Aufsichtsbehörden, vor allem wenn die Datenbroker ihren Handel über Staatsgrenzen hinweg betreiben. So wartet beispielsweise die europaweit tätige, gemeinnützige Datenrechtsorganisation NOYB, die von dem Aktivisten und Anwalt Max Schrems gegründet wurde, immer noch auf Durchsetzungsbeschlüsse für Fälle, die sie bei Inkrafttreten der DSGVO vor über vier Jahren vorgebracht hat.

Skalierung einer guten betrieblichen Infrastruktur ist nicht einfach

Die Kritik bezieht sich meist eher auf verfahrenstechnische Fragen als der Inhalt der Rechtsvorschriften. Doch nicht nur die negativ Betroffenen beklagen sich. Auch viele Beschäftigte in der Technologiebranche äußern sich besorgt. 2019 ergaben Umfragen unter Tech-Mitarbeitern einen vergleichsweise großen Zuspruch für mehr Regulierungen. Wenn also die Beschäftigten in der IT die Notwendigkeit einer stärkeren Aufsicht sehen und Verbraucher sowie zivilgesellschaftliche Organisationen lautstark fordern, dass Unternehmen diesbezüglich zur Rechenschaft gezogen werden, warum sind die Fortschritte dann so langsam? Bei der Beantwortung dieser Frage muss man bestehende Regulierungspraktiken und Betriebsabläufe der zuvor erwähnten Branchen ansehen. Zum einen gibt es zahlreiche kodifizierte Best Practices, zum anderen verfügen sie über eine umfangreiche Betriebsinfrastruktur – beides hat sich über einen langen Zeitraum entwickelt. Daraus ergeben sich zweierlei Konsequenzen: Es macht es den Endnutzern leichter, sich in diesen Systemen zurechtzufinden, und die Fachleute können ihre Aufgaben leichter verstehen und korrekt ausführen. Die Herausforderungen der Technologie, mit der die Verbraucher im Einzelhandel konfrontiert sind, ist oft Teil der Medienberichterstattung. Über die Hürden der IT-Fachleute im Einzelhandel wird jedoch viel weniger berichtet. Trotzdem sind sie genauso wichtig, denn ihre Fähigkeit, Aufgaben zu erfüllen, beeinflusst die Qualität der Produkte, die sie herstellen. Eine solche Hürde ist das Fehlen einer operativen Infrastruktur. Dieser Begriff bezieht sich auf wiederverwendbare Ressourcen und Werkzeuge, die den Fachleuten zur Verfügung stehen, um datenzentrierte Anwendungen für den Einzelhandel zu entwerfen und zu erstellen. Solche Hilfsmittel bieten eine gute Möglichkeit, bewährte Praktiken zu verankern und helfen den Fachleuten, sich einen großen Teil des Rätselratens bei der Einhaltung von Vorschriften zu ersparen. Ein Teil dieser operativen Infrastruktur kann von ihnen selbst aufgebaut und verbreitet werden. Dieser Prozess kann jedoch langwierig sein.

Mehr Transparenz für KI-Modelle und Datensätze

So sind beispielsweise vor einiger Zeit »Model Cards« und »Data Sheets« in der Forschungsgemeinschaft für maschinelles Lernen entstanden. Das sind in erster Linie praxisorientierte Tools für das bessere Verständnis der Entwicklung von Modellen und Kuratierung von Trainingsdaten. Mit beiden Instrumenten wurde ein gewisses Maß an Standardisierung eingeführt, was wichtige Aktivitäten wie Zusammenarbeit, Wiederverwendung und Prüfung erleichtert. Um Unternehmen für die von ihnen erstellten eingebetteten KI-Anwendungen verantwortlich zu machen, muss sich ihr Output effektiv überprüfen lassen. Dies kann schwierig sein, da potenziellen Prüfern die notwendigen Informationen über die Zusammensetzung der Trainingsdaten, den Erfassungsprozess und die Ursachen für Verzerrungen oft nicht zur Verfügung stehen. Diese Daten sind auch wichtig für Data Scientists, die bei der Modellentwicklung zusammenarbeiten und Datensätze nach ethischen Kriterien wiederverwenden wollen. Tatsächlich bietet der einfache Akt der Erstellung von »Model Cards« und »Data Sheets« eine gute Gelegenheit für KI-Entwicklungsteams, die ethischen Aspekte der von ihnen erstellten Anwendungen zu diskutieren.

Anbieter zum Thema

zu Matchmaker+
Ade Adewunmi
Ade Adewunmi, Strategy and Advising Manager bei Cloudera.
© Cloudera

So gut sie auch sein mögen, weder Model Cards noch Data Sheets konnten sich als grundlegende Werkzeuge für die KI-Entwicklung etablieren. Dennoch ist es ein vielversprechendes Zeichen, dass eine gern genutzte Data-Science-Plattform, HuggingFace, eine einfache Vorlage für Model Cards in das Toolkit für Datenwissenschaftler aufgenommen hat. Als frei verfügbare, Community-basierte Data-Science-Plattform ist HuggingFace oft ein Ausgangspunkt für Entwickler in den frühen Phasen von Projekten. Das bedeutet, dass die Bereitstellung der gebrauchsfertigen Vorlage auf ihrer Community-Seite das Potenzial hat, einige der Reibungsverluste zu verringern, die ihre Nutzung sonst einschränken könnten. Durch das Bereitstellen fertiger Modellkarten zusammen mit den Modellen auf der Website, kann jeder dazu beitragen, die Verwendung zu normalisieren. Diese Art von Normierungsarbeit spielt eine wichtige Rolle bei der Etablierung von Best Practices. Eine stärkere Nutzung dieser beiden Instrumente ist ein gutes Vorzeichen für die Einführung konzeptionell fortschrittlicherer Methoden wie Ethic Sheets. Diese regen KI-Entwickler dazu an, sich vor Beginn eines Projekts Gedanken über Auswirkungen der KI zu machen, die sie programmieren – sowohl auf Produkt- als auch auf Gesellschaftsebene.

Dies ist sowohl für KI-Fachleute als auch für Regulierungsbehörden und Organisationen der Zivilgesellschaft von Vorteil. Je dichter das Netz an regulatorischen Durchsetzungsmöglichkeiten und betrieblichen Infrastrukturen ist, das die Entwicklung und Einsatz von datenzentrierten Technologien im Einzelhandel umgibt, desto besser stehen die Chancen, diese für alle sicherer zu machen.


Das könnte Sie auch interessieren

Verwandte Artikel

elektroniknet

Themenwoche Embedded-Systeme Okt.22