Sprachassistenten Geräte werden künftig Sprache lokal verarbeiten

Die Nachfrage von Sprachschnittstellen zu Steuerung von Geräten wird stark steigen. Die neue Sprachverarbeitung findet im Gerät stattf.

Der Einsatz von Sprachschnittstellen zur Steuerung von Geräten per Sprachbefehle soll rapide zunehmen, ist sich Chris Shore von Arm sicher. Dies wird aber nur dann möglich sein, wenn die Sprachverarbeitung im Gerät selbst und nicht in der Cloud erfolgt.

Bis 2022, so wird geschätzt, wird die Nachfrage nach sprachgesteuerten Geräten allein in den USA auf 1,6 Mrd. Einheiten steigen. Um diese Zahl in dieser Zeitspanne zu erreichen, wird die Mehrheit dieser Geräte im Jahr 2020 entwickelt und kurz darauf eingesetzt. Wir bei Arm sehen einige Hindernisse für dieses Wachstum, aber die notwendigen Lösungen existieren und befinden sich derzeit in der aktiven Entwicklung.

Derzeit findet die KI-gestützte Sprachverarbeitung der sprachgesteuerten Geräte in Cloud-Rechenzentren statt, die möglicherweise Tausende von Kilometern vom Gerät entfernt sind, was Auswirkungen auf Energieeinsatz, Kosten, Datenschutz und Bandbreite haben kann.

Es besteht die Möglichkeit, dass smarte Geräte leistungsfähiger werden, da sich die Fähigkeiten weiterentwickeln, um mehr Rechenleistung am Edge zu ermöglichen. Nur dann lassen sich diese Systeme auf den vorhergesagten Einsatzbereich skalieren.Im Jahr 2020 prognostiziert Arm einige wichtige Veränderungen in diesen Systemen – und unsere Partner ebenfalls. Drei wesentliche Veränderungen betreffen die Art und Weise, wie sprachgesteuerte Geräte funktionieren.

Die nächste Generation Sprachschnittstellen verarbeitet Daten lokal

Die Entwicklungen in der künstlichen Intelligenz haben die Art und Weise, wie wir mit unserer Umgebung durch Sprache umgehen, grundlegend verändert. Bestehende Sprachassistenten müssen sich jedoch weiterentwickeln, da sie stark in der Cloud zentralisiert sind.

Eine Erhöhung der verfügbaren Verarbeitungsleistung auf dem Gerät wird einen Wechsel zur lokalen Verarbeitung ermöglichen, wodurch die Bandbreitenanforderung, die Cloud-Rechenleistung und der Energiebedarf reduziert und gleichzeitig der Datenschutz und die Sicherheit erhöht werden. Die Verlagerung der Sprachverarbeitung auf das Gerät ermöglicht, eine vertrauenswürdige und transparente Beziehung zwischen Menschen und ihren Geräten aufzubauen.

Mikrocontroller werden kleiner und leistungsfähiger

Derzeit wird viel daran gearbeitet, die Grenzen dessen, was mit einem Standard-Mikrocontroller erreicht werden kann, zu erweitern. Aktuelle Algorithmen und Bibliotheken erweitern die Möglichkeiten mit begrenzten Verarbeitungsressourcen erheblich. Um jedoch die Sprachverarbeitung auf dem Gerät zu ermöglichen, ist eine grundlegende Änderung erforderlich. In der Tat muss die Leistungsfähigkeit auf Cloud-Niveau mit eingeschränkten Plattformen erreichbar sein.

Drei Entwicklungen werden dies ermöglichen:

  • Erstens wird die nächste Generation von Mikrocontrollern einen Quantensprung in der KI-Verarbeitungsfähigkeit, wie z.B. die Verwendung der Arm Helium-Technik, ermöglichen.
  • Zweitens wird die Entwicklung optimierter Algorithmen die KI auf Plattformen auch für große und komplexe Vokabeln wesentlich effizienter machen.
  • Drittens wird die Softwareentwicklung für leichter zugängliche, schnellere Innovationen, z.B. mit Open-Source-Softwarebibliotheken, Dokumentation, Training und verbesserten Single Architecture Solutions erleichtert – mit digitaler Signalverarbeitung und maschinellem Lernen kombiniert.

Sprachschnittstellen werden persönlich sein

Nur wenn der Kontext, die Identität und die vergangenen Aktivitäten eines Benutzers bekannt sind, können Interaktionen flüssig und natürlich werden. Dieser persönliche Aspekt muss auch allgegenwärtig sein, damit sich unsere Umgebung nahtlos an uns anpasst, egal wohin wir gehen. Durch datengestützte Forschung lassen sich Formulierungsbeispiele in genügender Anzahl generieren, wie Endnutzer mit ihrem Sprachassistenten sprechen würden.

 

 

Der Autor

 

Chris Shore

Direktor für Embedded-Lösungen, Automotive und IoT Line of Business, leitet ein Team, das bei Arm für das CPU- und System-Sortiment für IoT- und Embedded-Anwendungen verantwortlich ist sowie Partner unterstützt.

In den bisher über 18 Jahren bei Arm war Shore unter anderem für den technischen Inhalt von Konferenzen verantwortlich, leitete die Kundenschulungen – pro Jahr über 200 auf der ganzen Welt – und das Partnerprogramm Arm Approved Design House.

Shore ist Referent auf Industrieveranstaltungen, hat einen Master in Informatik von der Cambridge University, ist Chartered Engineer und Mitglied des Institute of Engineering and Technology (MIET).