Datenerfassung und -vorverarbeitung
Beim Beispiel Aktivitätsverfolgung messen axiale Bewegungsmelder wie Beschleunigungs- und Drehratensensoren, die in Smartphones und andere tragbare Geräte eingebaut sind, die erforderlichen Rohdaten. Unauffällig und nutzerfreundlich zeichnen sie kontinuierlich die Bewegungsdaten entlang der drei Achsen (x, y, z) auf und werten sie aus.
Das Modell trainieren
Um eine Anwendung basierend auf Künstlicher Intelligenz zu entwickeln, nutzt man die Methode des überwachten Lernens: Man trainiert ein Modell anhand klar definierter Daten, damit die Klassifizierungs-Engine dieses Modell anschließend zur Auswertung des tatsächlichen Nutzerverhaltens verwenden kann. Man kann zum Beispiel Bewegungsdaten von Testnutzern erfassen, von denen man weiß, dass sie rennen oder laufen. Diese Informationen stellt man dem Modell zur Verfügung, um ihm beim Lernen zu helfen. Weil das grundsätzlich eine Einmalmethode ist, kann diese Nutzer-„Kennzeichnungs“-Aufgabe mit ganz einfachen Apps und Kamerasystemen ausgeführt werden. Erfahrungsgemäß wird die Fehlerrate durch menschliches Versagen beim Kennzeichnen geringer, wenn die Zahl der erfassten Proben steigt. Daher ist es sinnvoller, eine größere Zahl an Proben von einer beschränkten Anzahl Nutzern zu erfassen, als kleinere Mustersätze von mehr Nutzern.
Das Erfassen der Rohdaten von Sensoren allein…
...reicht jedoch nicht aus. Es hat sich gezeigt, dass bestimmte Eigenschaften sorgfältig definiert werden müssen, um eine hochgenaue Klassifizierung zu erreichen. Das heißt, dem System muss gesagt werden, welche Eigenschaften oder Aktivitäten für die Unterscheidung einzelner Sequenzen wichtig sind. Der künstliche Lernprozess ist iterativ, durch Wiederholung wird das Wichtige herausgefiltert. Es ist also im Vorverarbeitungsstadium noch nicht klar, welche Eigenschaften am relevantesten sind. Das Gerät muss daher auf Grundlage des Wissens über die Art der Informationen ein paar Schätzungen “über den Daumen” vornehmen, die die Genauigkeit der Klassifizierung beeinträchtigen können.
Um einzelne Aktivitäten zu erkennen,…
...könnte etwa eine Eigenschaft des Geräts „Signale“ beinhalten: So genannte „gefilterte Signale“, wie die Körperbeschleunigung (Rohdaten der Beschleunigung von einem Sensor) oder „abgeleitete Signale“, wie schnelle Fourier-Transformationswerte (FFT-Werte) bzw. Berechnungen der Standardabweichung. Ein vom UC Irvine Machine Learning Repository (UCI) erstellter Datensatz definiert zum Beispiel 561 Eigenschaften auf Grundlage einer Gruppe von 30 Freiwilligen, die sechs Grundaktivitäten ausgeführt haben: Stehen, Sitzen, Liegen, Gehen sowie Stufen auf- und absteigen.