Künstliche Intelligenz 11 Mythen der Gesichtserkennung werden aufgedeckt

Die Fortschritte im Bereich der künstlichen Intelligenz in den vergangenen zehn Jahren haben es ermöglicht, Embedded-Systeme mit modernen Funktionen wie einer Gesichtserkennung auszustatten. Trotz der Vorteile ist sie aber auch umstritten. Doch wie sieht die Realität aus?

 

 

Gesichtserkennung ist teuer

Weit verbreitet ist die Annahme, dass Computer zur Erkennung von Gesichtern unbedingt High-End-Hardware benötigen. Schließlich haben die Deep Learning Pipelines, mit deren Hilfe seit Mitte der 2000er-Jahre ein Durchbruch bei der Bildklassifizierung verzeichnet werden konnte, auf die Rechenleistung von Grafikprozessoren (GPUs) gesetzt und diese häufig in eng gekoppelten Clustern verwendet. Entwickler:innen von Embedded-Systemen mit integrierter Gesichtserkennung, wie Produkten für Haussicherheit und Zugangskontrolle, können aber weniger komplexe Hardware verwenden. Wenn man Pipelines auf Effizienz trimmt und den Schwerpunkt auf die Merkmale richtet, die für die Erkennung und den Abgleich von Gesichtern mit den hinterlegten Bildern am wichtigsten sind, ist die erforderliche Rechenleistung weit geringer als bei Anwendungen für Forschungszwecke.

Gesichtserkennung ist aufwendig

Eines der Hauptprobleme beim maschinellen Lernen besteht darin, die Struktur der Pipeline so an die Anwendung anzupassen, dass sie beim Training zu einem nützlichen Ergebnis führt. Es ist jedoch nicht erforderlich, solche Strukturen in Anwendungen wie dem Einlernen von Gesichtern komplett neu zu erstellen. Es stehen Plattformen zur Verfügung, die auf bewährten Pipelines für maschinelles Lernen basieren und sehr rasch hohe Rechenleistungen liefern, gleichzeitig aber den Grad an Anpassbarkeit
bieten, der für verschiedene Zielmärkte erforderlich ist.

Gesichtserkennung erfordert eine leistungsstarke Datenverarbeitung

Einige Leute richten ihren Blick nur auf die Hochleistungshardware, die in Cloud-Computing-Umgebungen für maschinelles Lernen verwendet wird, und gehen davon aus, dass es sich hier immer um äußerst komplexe Prozesse handelt. Diese Systeme müssen sich jedoch an viele verschiedene Anwendungen anpassen können und nutzen Open-Source-Tools, die das gesamte Spektrum von Deep-Learning-Architekturen unterstützen. Daher weisen die Modelle selbst bei Inferenzanwendungen – wenn das Netzwerk zur Analyse realer Daten herangezogen wird – ein hohes Maß an Daten- und Rechenredundanz auf. Eine Embedded-Lösung kann diesen Mehraufwand erheblich reduzieren und es ist möglich, anspruchsvolle Gesichtserkennungs-Pipelines auf einer 32-Bit-MCU auszuführen.

Gesichtserkennung ist nicht sicher

Die Zugangskontrolle ist eine Schlüsselanwendung für die Gesichtserkennung in Embedded-Systemen und es muss beispielsweise sichergestellt werden, dass die Tür nicht entriegelt oder das Alarmsystem außer Kraft gesetzt werden kann, indem jemand ein Foto vor die Kamera hält. Daher ist eine integrierte Bilderkennung mit maschinellen Lerntechniken wichtig. Diese können das Bild überprüfen, um zu garantieren, dass in die Pipeline für maschinelles Lernen nur gültige Daten eingespeist werden. Ein solch flexibler Ansatz gewährleistet auch, dass die Pipeline nicht nur auf sichtbarem Licht beruhende Daten berücksichtigt. Durch den Einsatz von (Bild-)Sensoren, die im Infrarotbereich arbeiten, lässt sich sicherstellen, dass das System Fälschungen von der Realität unterscheiden kann.

Gesichtserkennung greift in die Privatsphäre ein

Bei vielen Anwendungen, mit denen die breite Öffentlichkeit vertraut ist, werden die
Rohdaten auf einen Cloud-Server hochgeladen und in der Cloud verarbeitet. Dies ist ein Problem für viele Verbraucher:innen, die nicht möchten, dass ihre privaten Aktivitäten ins Internet übertragen und nach einem böswilligen Angriff auf die Server möglicherweise sogar offengelegt werden. Eine Plattform wie die MCU-basierte Edge-Ready-Lösung von NXP für die Gesichtserkennung führt daher alle Bildverarbeitungs- und Gesichtserkennungsfunktionen lokal aus. Die Daten verlassen niemals das Gerät. Das ermöglicht es, Endprodukte zu entwickeln, die einen maximalen Schutz der Privatsphäre gewährleisten.

Gesichtserkennung funktioniert im Dunkeln nicht

Ein Sicherheitssystem oder eine elektronische Zugangskontrolle mit integrierter Gesichtserkennung muss häufig unter schwierigen Lichtbedingungen arbeiten. Für eine Technologie, die auf den ersten Blick stark vom sichtbaren Licht abhängig zu sein scheint, könnte der Betrieb bei Nacht oder bei Ausfall von Lichtquellen in der Tat ein Problem darstellen. Aber dieses Problem lässt sich leicht beheben, indem man den Bildsensor für sichtbares Licht durch sekundäre Module ergänzt, die im Infrarotspektrum arbeiten oder mithilfe von Laufzeitdaten eine 3D-Karte eines in Reichweite befindlichen Objekts erstellen. So ist Dunkelheit kein Problem mehr, die Nutzerfreundlichkeit wird verbessert und der Stromverbrauch gesenkt, da keine künstliche Beleuchtung mehr notwendig ist.

Gesichtserkennung erfordert Fachkenntnisse in KI

Künstliche Intelligenz (KI) ist ein sehr umfangreiches und komplexes Themengebiet. Allein im Bereich Deep Learning erscheinen viele neue wissenschaftliche Arbeiten, die verschiedene Facetten der Technologie und neuartige Pipeline-Strukturen untersuchen. Verwendet man jedoch eine für die Gesichtserkennung entwickelte Plattform, wie zum Beispiel die MCU-basierte Lösung von NXP, die nicht nur von maschinellem Lernen profitiert, sondern auch ein vollständiges, speziell für diese Aufgabe konzipiertes Bildverarbeitungs-Toolkit beinhaltet, ist es einfacher, qualitativ hochwertige Ergebnisse zu erzielen.

Gesichtserkennung erfordert viel Rechenleistung

Optimierte KI und Bildverarbeitung ermöglichen es, Gesichtserkennungsanwendungen auf MCU-Basis anstelle der auf Serverplattformen verwendeten Hochleistungs-GPUs zu betreiben. Dies bringt noch weitere Vorteile, beispielsweise den Zugriff auf zahlreiche Energiesparmodi, die aktuelle MCUs unterstützen. Eine MCU-Lösung muss auch keine komplexen Betriebssysteme wie Linux booten, was bedeutet, dass der Hauptprozessor abgeschaltet werden kann, wenn er nicht benötigt wird. Gleichzeitig kann der Prozessor innerhalb einer Zehntelsekunde reaktiviert werden, sodass die volle Funktionalität für die Gesichtserkennung bereitsteht, sobald ein Bewegungssensor feststellt, dass im Sichtfeld erfasste Aktivitäten Aufmerksamkeit erfordern.

Das Training ist umständlich und mühsam für Endnutzer:innen

Frühe Implementierungen der Gesichtserkennung in Embedded-Systemen wie Tablets und Smartphones erforderten eine Reihe verschiedener Posen, um das neuronale Netzwerk effektiv auf das Gesicht eines neuen Benutzers zu trainieren. Durch Fortschritte bei Techniken wie dem Transfer-Learning reicht es aber inzwischen aus, dass jemand sein Gesicht nur einmal der Kamera präsentiert, damit diese die Gesichtszüge erlernt und der Datenbank für zugelassene Benutzer hinzufügt.

Es gibt nur begrenzte Anwendungsmöglichkeiten für die Gesichtserkennung

Bei jeder Technologie ist es schwierig, sich ihre Einsatzmöglichkeiten vorzustellen, bis innovative Unternehmen sie in die Tat umsetzen. Gesichtserkennung scheint auf Anwendungen im Sicherheitsbereich und in der Zugangskontrolle beschränkt zu sein, da sie dort heute oft eingesetzt wird. Intelligente Geräte und Werkzeuge könnten sie jedoch auch für andere Zwecke nutzen: Zum Beispiel zur Deaktivierung von Funktionen, um Kinder zu schützen. Zudem werden immer mehr Produkte so konzipiert, dass sie nicht nur Gesichter, sondern auch Gesichtsausdrücke lesen können. Geräte, die emotionale Regungen wie Frustration, Verwirrung oder Freude erkennen, können angemessen reagieren und die Benutzerfreundlichkeit erhöhen.

Gesichtserkennung erfordert ein leistungsfähiges Betriebssystem

Da im Forschungsbereich so viele Tools für Deep-Learning als Open-Source-Software-Toolkits bereitgestellt werden, die für Linux geschrieben wurden, könnte man leicht glauben, dass Anwendungen wie Gesichtserkennung Linux benötigen. Aber Embedded-Systeme, die die Kerntechnologie unterstützen, kommen ohne die hohen Speicherkosten und die langen Startzeiten einer Linux-Installation aus. MCU-basierte Lösungen laufen mit sehr viel schlankeren Echtzeitbetriebssystemen, die viel weniger Speicher benötigen, schnell starten und moderne Energiesparoptionen bieten.

Der Autor

Rick Bye
leitet das Produktmarketing für die ML/KI-Edge-Computing-IoT-Lösungen von NXP für
Sprachsteuerung (Alexa, lokale Befehle usw.) und Gesichtserkennung. Der  Schwerpunkt seiner Arbeit liegt darauf, diese Funktionen als schlüsselfertige Lösungen bereitzustellen, um Hürden bei der Entwicklung zu beseitigen und die Markteinführungszeit erheblich zu verkürzen.