Machine learning-based metabolic rate estimation from wearable sensors
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Adaptive devices such as exoskeletons and prostheses can enhance human physical capabilities or replace the functionality of missing body parts. However, adjusting these devices for the specific needs of an individual remains a time-consuming and costly procedure. A key objective in optimizing these devices is minimizing the user’s energy expenditure (EE), a metric closely related to metabolic cost. Traditional methods for estimating metabolic cost, such as indirect calorimetry, are performed in controlled environments, limiting real-world applicability. This study aims to bridge this gap by exploring the use of traditional machine learning (ML) methods to estimate metabolic cost in real-time environments, utilizing wearable sensors integrated into adaptive devices. Using the dataset from Ingraham et al. (2019), which includes data from ten healthy subjects performing various exercises, the study investigates how different sensor combinations impact prediction accuracy. This thesis evaluated multiple ML models, including Random Forest (RF), Support Vector Machines (SVM), Linear Regression (LR), Decision Trees (DT), and Multilayer Perceptrons (MLP), within two cross-validation methods: Leave-One-Subject-Out (LOSO) and Leave-One-Time-Out (LOTO). Key findings from this evaluation include: In the LOSO setting, RF outperformed other models, achieving the lowest RMSE in several sensor regions, including Hexoskin, EMG Pants, and Best Combination, with the ’Best Combination’ region showing the best results. In contrast, MLP performed well in the LOTO setting, with its strongest performance observed in the ’Best Combination’ region. SVM demonstrated robust performance when all sensor data was combined, emphasizing the potential of multimodal sensor fusion. Hyperparameter tuning and sensor feature selection were crucial factors in optimizing model performance, particularly for more complex models like RF and MLP. The results suggest that while traditional ML methods can estimate EE effectively, challenges remain in refining preprocessing techniques, tuning hyperparameters, and optimizing sensor combinations. This thesis outlines the importance of model selection, sensor fusion, and parameter optimization in developing more accurate and real-time energy expenditure prediction systems for wearable technologies.
Adaptive Geräte wie Exoskelette und Prothesen können die körperlichen Fähigkeiten des Menschen verbessern oder die Funktionalität fehlender Körperteile ersetzen. Die Anpassung dieser Geräte an die Bedürfnisse einer Person, ist jedoch nach wie vor ein zeit- und kostenaufwändiges Verfahren. Ein wichtiges Ziel bei der Optimierung dieser Geräte ist die Minimierung des Energieaufwands des Benutzers, der eng mit den mit den Stoffwechselkosten zusammenhängt. Herkömmliche Methoden zur Schätzung der Stoffwechselkosten, wie die indirekte Kalorimetrie, werden in kontrollierten Umgebungen durchgeführt, was die Anwendbarkeit in der realen Welt einschränkt. Diese Thesis zielt darauf ab diese Lücke zu schließen, indem sie die Anwendung traditioneller Machine Learning Methoden zur Schätzung der Stoffwechselkosten in Echtzeitumgebungen unter Verwendung von tragbaren Sensoren, die in adaptive Geräte integriert sind, untersucht. Unter Verwendung des Datensatzes von Ingraham et al. (2019), der Daten von zehn gesunden Probanden enthält, die verschiedene Übungen durchführten, untersucht die Thesis, wie sich verschiedene Sensorkombinationen auf die Vorhersagegenauigkeit auswirken. In dieser Arbeit wurden mehrere ML-Modelle bewertet, darunter Random Forests (RF), Support Vector Machines (SVM), Linear Regression (LR), Decision Trees (DT), Multi-layer Perceptrons (MLP), und AdaBoost (ADA) mit zwei Cross-Validation-Verfahren: Leave-One-Subject-Out (LOSO) und Leave-One-Task-Out (LOTO). Die wichtigsten Ergebnisse dieser Thesis sind: Mit LOSO Cross Validation schnitt Random Forests (RF) besser ab als andere Modelle, mit dem niedrigsten root mean square error (RMSE) in mehreren Sensorregionen, einschließlich Hexoskin, EMG Pants und Best Combination, wobei die Region Best Combination die besten Ergebnisse zeigte. Im Gegensatz dazu schnitt Multi-layer Perceptrons (MLP) in der LOTO-Validierung gut ab, wobei die stärkste Leistung in der Region Beste Kombination beobachtet wurde. SVM erreichte eine gute Leistung, wenn alle Sensordaten kombiniert wurden, was das Potenzial der Kombination verschiedener Sensortypen unterstreicht. Das Tuning der Hyperparameter und die Auswahl der Sensoren waren entscheidende Faktoren für die Optimierung der Modellleistung, insbesondere bei komplexeren Modelle wie RF und MLP. Die Ergebnisse deuten darauf hin, dass traditionelle ML-Methoden zwar energy expenditure (EE) effektiv schätzen können, es bleiben aber Herausforderungen in der Verfeinerung der Preprossesing-Techniken, des Tunings von Hyperparametern und der Optimierung der Sensorauswahl. Diese Herausforderungen zu bewältigen ist ein wichtiger Teil der Entwicklung genauerer Systeme zu Berechnung von Energieverbrauch in Echtzeit für tragbare Technologien.