In der realen Welt haben einzelne Sensoren physikalische Beschränkungen, und ihr Output weicht über die Zeit ab, etwa auf Grund von Verschiebungen und der durch Löten und Temperaturauswirkungen verursachten nichtlinearen Skalierung. Zum Ausgleich solcher Unregelmäßigkeiten wird eine Sensorfusion, also die Zusammenführung von Daten unterschiedlicher Sensoren, erforderlich und die Kalibrierung muss schnell, inline und automatisch erfolgen.
Außerdem kann die gewählte Datenerfassungsrate maßgeblich die erforderliche Berechnungs- und Übertragungsmenge beeinflussen. Normalerweise ist eine Sample-Rate von 50 Hz für gängige menschliche Aktivitäten ausreichend. Bei Aktivitäten mit schnellen Bewegungen oder beim Sport, reicht das nicht mehr. Eine Sample-Rate von 200 Hz kann für das Analysieren der Leistung nötig werden. Oder man installiert einen separaten, mit 2 kHz betriebenen Beschleunigungssensor für schnellere Reaktionszeiten, um die Absichten des Nutzers zu erfassen.
Smarte Sensor-Hubs entlasten
Um all diese Herausforderungen zu bewältigen, bietet sich ein Smart-Hub mit geringer Leistungsaufnahme oder ein anwendungsspezifischer Sensorknoten an. Beide verringern die durch die Klassifizierungs-Engine benötigten CPU-Zyklen beträchtlich. Zu den Beispielen für solche Smart Hubs und Sensorknoten gehören der BHI160 und der BNO055 von Bosch Sensortec. Die damit einhergehende Software erzeugt abgesicherte Sensorergebnisse direkt in verschiedenen Sensor-Datenraten und unterstützt das Verarbeiten der Eigenschaften.
Die Wahl der zu verarbeitenden Eigenschaften hat anschließend beträchtliche Auswirkungen auf die Größe des trainierten Modells, das Datenvolumen und die sowohl für das Training und die Ausführung der Inline-Vorhersage benötigten Rechenleistung. Folgende Frage birgt daher eine wesentliche Entscheidung: Welche Eigenschaften sind ausreichend für die Klassifizierung und Differenzierung einer bestimmten Aktivität? Eine Entscheidung, die wahrscheinlich zugleich ein wichtiges kommerzielles Unterscheidungsmerkmal ist.
Um noch einmal auf das…
...oben angeführte UCI-Beispiel eines vollen Datensatzes an Aktivitäten mit 561 Eigenschaften zurückzukommen, sei vermerkt, dass ein mit einem default LibSVM kernel trainiertes Modell bei der Klassifizierung der Aktivitäten eine Testgenauigkeit von 91,84 % erreicht hat. Dennoch erwies sich die Auswahl der 19 wichtigsten Eigenschaften nach Abschluss des Trainings und Rankings der Eigenschaften als ausreichend für das Erreichen einer Testgenauigkeit von 85,38 % bei der Klassifizierung von Aktivitäten. Bei genauerem Hinsehen auf die Rankings ließ sich auch feststellen, dass die relevantesten Eigenschaften die Frequenzdomänentransformationen sowie die Mittelwert-, Maximum- und Minimum-Rohdaten der Beschleunigung im Gleitfenster sind. Interessant ist dabei, dass es nicht möglich gewesen wäre, diese Eigenschaften nur mit Vorverarbeitung zu erfassen, das heißt die Sensorfusion war notwendig, damit sich diese Daten als ausreichend zuverlässig erwiesen und damit als nützlich für die Klassifizierung.