陳慶果 劉耀天 譚雅兮 楊強 楊珊珊 彭莉
摘? ? 要:構建不同類型的腕部加速度計能耗預測模型,并橫向比較其準確性,為腕部加速度計(智能手環)的算法優化提供實證支持。方法:42名受試者(實驗組28人和驗證組14人),測試時每名受試者佩戴氣體代謝分析儀Cosmed K4b2和2個佩戴加速度計Actigraph-GT3X于手腕和髖部處,分2個階段完成20項體力活動。以間接測熱法為能耗預測校標,采用實驗組數據分別建立一般線性回歸模型、兩階段模型、神經網絡模型和支持向量機模型,并利用驗證組數據對其測量準確性進行橫向比較。結果:建立了線性模型(METs=0.000228×VM+2.019)、兩階段模型、10-21-1三層神經網絡模型(初始學習率為0.05,動量常量設為0.5,誤差率為0.000 1)和支持向量機模型(10個輸入指標、RBF為核函數、gamma為1.5、C為10、損失系數為0.01)。在RMSE上,神經網絡模型<支持向量機模型<兩階段模型<線性回歸模型。神經網絡模型和支持向量機模型的預測值90%CI均落在校標(K4b2)的等效區間內,在B-A圖上的各指標均優于兩階段模型和線性回歸模型。結論:在腕部能耗預測中,建立的神經網絡模型和支持向量機模型能有效監測日常體力活動,具有應用價值;應謹慎運用兩階段模型,不宜使用一般線性模型。
關鍵詞:腕部加速度計;運動手環;體力活動;能耗預測模型
中圖分類號:G 804.49? ? ? ? ? 學科代碼:040302? ? ? ? ? ?文獻標識碼:A
Abstract:Through developing different energy expenditure prediction models of wrist accelerometers and comparing their accuracy, this research aims to provide empirical support for algorithm optimization of wrist accelerometers (Smart Bracelets). Methods: 42 subjects (28 in the experimental group and 14 in the control group) who wear the gas analyzer (Cosmed K4b2) and 2 accelerometers (Actigraph-GT3X) positioned in waist and wrist performs 20 items physical activities in two stages. Indirect calorimetry was used to calibrate energy consumption. The data from experimental group were used to establish general linear regression model, two-stage model, neural network model and supportive vector machine model, respectively. The data from validation group were used for horizontal comparison. Results: A linear model (METs = 0.000228 × VM + 2.019), a two-stage model and a 10-21-1 three-layer neural network model (initial learning rate of 0.05 and momentum constant of 0.5 and error rate of 0.0001) and support vector machine model (10 inputs indexes, kernel function of RBF, gamma of 1.5, C of 10, and loss coefficient of 0.01) are developed. At RMSE, the neural network model < support vector machine model < two-stage model < linear regression model. The 90% CIs of neural network model and support vector machine model fall within the equivalent range of K4b2, and all the indexes in B-A chart are better than the two-stage model and linear regression model. Conclusion: In the wrist accelerometer, neural network model and support vector machine model can effectively monitor daily physical activity. The two-stage model should be used with caution. The general linear model is not suitable for application.
Keywords:wrist accelerometer; sports bracelet; physical activity; predictive model of energy expenditure
目前,常見的幾種運動手環都屬于腕部加速度計范疇,測量的準確性并不理想。溫煦等[1]的研究顯示,常見的4種運動手環在監測走跑能耗時,與實測值之間的相關系數為0.02~0.67不等,對38種手環的調查中僅有5種手環具備體力活動自動識別功能,并認為算法問題可能是目前運動手環測量效度偏低的重要原因之一。
早在20年前就有研究提出腕部加速度計的能耗測量問題,其回歸模型僅能解釋實際能耗3.3%的變異,后來Trost等[2]和Yang等[3]認為髖部因靠近身體質心,更能準確反映體力活動整體情況,是加速度計佩戴的理想部位,加之算法上無新的突破,腕部加速度計能耗預測研究進入停滯狀態,此領域的研究基本上圍繞髖部加速度計展開。最早的算法是一元線性回歸模型,用髖部加速度計的count值預測運動能耗,該種方法簡便易行,在早期被廣泛使用,最為知名的是Freedson研究的模型[4],該模型是基于走跑項目而建立的,預測生活中體力活動存在較大誤差,后期不斷有學者通過獲取更多體力活動的特征數據來優化回歸模型,例如Hendelman研究的模型[5]、Swartz研究的模型[6]等,但該類模型預測的準確性較大依賴于運動項目,Freedson研究的模型適于預測走跑類體力活動的能耗,預測生活方式類體力活動時則有較大誤差;Swartz研究的模型則相反。總體上來看,該類模型由于其自身的算法局限,不能有效地解決該問題。鑒于此,Crouter等[7]設計了兩階段模型,該算法首先通過count值將體力活動分為靜息類和非靜息類,靜息類體力活動賦值為1 METs;然后在非靜息類體力活動中依據變異系數分為周期類和非周期類,并分別建立回歸方程,該方程測量的準確性受運動項目影響較小,精度較高。無論是一元回歸模型還是Crouter的兩階段模型,均需將原始數據轉變為count值后代入模型,這勢必會損失原始數據中所蘊含的其他信息,進而影響測量的準確性;而回歸模型的共線性問題又限制其納入更多反映原始數據信息的指標。隨著機器學習算法的興起,其算法的自我學習特征可使其整合和利用更多的原始信息,越來越多的學者逐漸嘗試納入更多的指標。Rothney等[8]將峰度系數、四分位差等15個指標納入到神經網絡模型中計算能耗,Staudenmayer等[9]則將6個基于count值的百分數作為指標建構神經網絡模型;有學者則對隨機森林回歸算法預測能耗的準確性進行了評估[10],其他的機器學習算法也被相繼引入到該領域研究,機器學習算法逐漸成為新的研究熱點和趨勢,而這也為腕部加速度計的能耗預測提供了新的思路,并且在實踐中,腕部佩戴更為方便,更受健身人群的歡迎[11]。目前,已有少量的研究將機器學習算法引入腕部加速度計的能耗預測中,Montoye等[12]研究了神經網絡模型的應用,還有研究引入了時間序列模型[13]。
但總體上來看,此領域的研究成果還相對較少,研究均是建構某種機器學習模型并進行評估,但缺乏對不同類型模型進行系統性分析的研究。因此,本研究旨在以髖部加速度計能耗算法演變歷程中的3類典型模型為藍本,借鑒其思路用以構建基于腕部加速度計的一般線性模型、兩階段模型、支持向量機模型和神經網絡模型,并對各模型的測量準確性進行比較,為腕部加速度計算法的優化、軟件的完善提供理論支持。
1? ?研究對象與方法
1.1? 研究對象
受試者為42名在校非體育專業大學生,測試前隨機將其分為建模組(28人)和驗證組(14人),建模組中男生、女生各14人,驗證組中男生8人、女生6人。2組受試者的形態學指標無顯著性差異(P>0.05)。所有受試者測試前均接受質詢并簽署知情同意書,確保其身體健康、無運動禁忌癥。受試者測試前24 h無大強度體力活動,測試均在餐后1 h進行。受試者基本信息見表1。
1.2? 測量儀器
采用恒康佳業HK-6000身高體重儀測量受試者身高和體重,使用VIVENTE-GOLD體成分儀測量體脂率。加速度數據的采集采用Actigraph-GT3X(以下簡稱GT3X),將其統一佩戴在受試者優勢側手腕處(腕橫紋處)和右側髖部(髂嵴處)。測試前,該設備時間校準及受試者信息的錄入工作在配套的Actilife 6.11軟件中進行,采樣頻率設為30 Hz,測試完成后將其數據以“*.gt3x”的格式保存,以便轉制為各種所需數據庫。
以間接測熱法實時記錄受試者的體力活動能耗并作為參考標準,使用的儀器設備為Cosmed K4b2(簡稱K4b2)。為保障測量精度,每天測試前均對儀器進行預熱和校標。測試中,測試人員在每1 min第1 s按壓儀器主機上的Enter鍵開始正式記錄數據,確保GT3X和K4b2在每分鐘內預測的數據同步。
使用K4b2系統配備的心率帶同步監控受試者心率,便于測試者根據心率確定間隔時間。
1.3? 測試方案
測試分為2個階段進行。第1階段首先對測試者介紹測試流程和注意事項,簽署知情同意書后進行身高、體質量和身體成分測量,然后進行靜息類體力活動(5項)和周期類體力活動的測量(6項),每項活動時間為5 min,因靜息類體力活動坐姿項目測量時,受試者自身選擇舒適、身體放松的坐姿分別進行打字、讀書、看手機。打字要求受試者按照日常打字速度將紙質文檔上的內容轉換為電子文檔,讀書與看手機時要求受試者雙手持書或手機。走跑類體力活動在Pular跑臺上進行。
第2階段測試為非周期性的體力活動,共計9個項目(見表2),除跳繩為2 min外,其余項目均為5 min,休息間隔的安排與第1階段相同。掃地與拖地時要求受試者模擬日常狀態打掃地面。整理書桌或疊衣服時,受試者按照編號順序將打亂的書或衣物重新歸置好。乒乓球和羽毛球采用多球練習的方式,受試者不撿球。籃球運球的速度由受試者本人控制,不能手持球。
依據陳立基研究中對周期性運動項目的界定“動作結構單一固定,且需重復運動的項目”[14]和Mansoubi等[15]對靜息類體力活動的界定,將體力活動項目分為靜息類體力活動和非靜息類體力活動。其中非靜類體力活動分為周期性體力活動和非周期性體力活動2類。因跳繩項目受運動技術等的影響較大,受試者隨時可能中斷,并且在跳繩的過程中,學生有時雙腳跳,有時單腳跳,故將其界定為非周期性體力活動。
各項體力活動之間的間隔時間依據心率恢復情況而定(1~5 min),除跳繩外每項體力活動取其中第2~4 min的數據進行分析,因跳繩只采樣2 min,故將其全部數據納入統計分析;因此,每名受試者有58 min的數據被統計分析,建模組共有1 624個統計單元(28名受試者×58 min),驗證組為812個統計單元(14名受試者×58 min)。
所有測試均在實驗室內進行,2個階段測試共需120~140 min,測試時間為08:30—11:30,14:30—17:30和18:30—21:30。室內溫度控制在18 ℃~25 ℃,相對濕度在50%~60%。
1.4? 數據處理與統計
數據處理時,首先將前期從腕部加速度計中導出的“*.gt3x”文件分別轉為以下3類數據:1)每秒30 Hz的原始加速度數據;2)每分鐘的count值數據;3)每10 s的count值數據。以以上3種數據分別建構和驗證各腕部加速度計能耗模型;髖部加速度計的原始數據只轉為每分鐘的count值數據。將從K4b2導出的“*.spo”文件分別轉換獲取METs/10 s的數據和METs/min的數據,由于K4b2采用每口氣呼吸測量法,METs/10 s數據中存在少量缺失值,本研究采用相鄰數據的均值來替代。
采用matlab7.0工具箱對腕部加速度計原始數據進行處理,合成每分鐘的相關指標,然后連同count/min一起與METs/min的數據一一對應形成總數據庫,并按照前期分組名單將其分為建模數據庫和驗證數據庫。采用SPSS 22.0軟件建立線性回歸模型,采用matlab 7.0軟件建立神經網絡模型和支持向量機模型。
將count/10 s的數據與METs/10 s的數據一一對應后形成兩階段模型數據庫,采用SPSS軟件計算每分鐘內6個10 s count值的變異系數(coefficient of variation,以下簡稱CV),然后使用Medacle12.0軟件利用ROC曲線確定基于count值的靜息類體力活動切點和基于變異系數的周期性體力活動切點,將體力活動分為3類,靜息類體力活動METs 賦值1,并分別建立周期性體力活動和非周期性體力活動的能耗方程。
模型驗證時,引入常用的髖部加速度計中的Freedson模型和Hendleman模型,將建構的腕部模型從多方面與其進行測量準確性的對比。
采用SPSS軟件計算各個模型在整體和各類體力活動上的均方根誤差(root-mean-square error,以下簡稱RMSE)和平均百分誤差(以下簡稱Bias)、進行測量準確性的比較,2個指標的計算公式為:
使用Medacle 12.0軟件繪制Bland-altman圖比較各模型在整體上預測值和實測值之間的一致性;使用MiniTAP軟件進行等效性檢驗,以判斷預測METs和實測METs測量結果的等效性,標準為:預測均值90%置信區間是否落入實測均值的等效區間(?滋±10%?滋)[16],如果落入則接受備擇假設:下限<檢驗值/校標均值<上限,可認定2種測量方法等效。
2? ?研究結果
2.1? 不同類型腕部加速度計能耗模型的建構
2.1.1? 線性回歸模型的建構
從圖1可知,手腕部VM的值在4 000~6 000時,METs有較大的波動,在VM值大于20 000后,點較為分散。本研究采用簡單線性回歸的方法建立VM對METs的能耗方程METs=0.000 228×VM+2.019, R2為0.419,SEE為1.901。
2.1.2? 兩階段模型的建構
Crouter的兩階段模型首先通過count值將體力活動分為靜息類和非靜息類,靜息類體力活動賦值為1 METs;然后在非靜息類體力活動中,依據變異系數分為周期性體力活動和非周期性體育活動,然后分別建立相應的回歸方程。
2.1.2.1? ? 區分靜息類體力活動和非靜息類體力活動的VM臨界點的建立
本研究采用ROC的方法尋找Youden指數最大時所對應的VM的數值,即確定VM的體力活動臨界點,由表3和圖2可知,此臨界點為335.5,此臨界點的AUC大于0.9,且特異性與敏感性也均在0.9以上,ROC曲線接近于左上角的位置,這表明該臨界點區分2類體力活動具有高度的準確性。
2.1.2.2? ? 區分周期性體力活動和非周期性體力活動的CV臨界點的確立
研究表明,判斷周期性體力活動與否的CV的臨界點為10.8,此臨界點AUC為0.766,由表4和圖3可見,根據Fawcett [17]的標準,該臨界點具備一定的診斷價值,但其診斷的準確性,是否會影響后續建立模型的準確性需要進一步評估。
2.1.2.3? ? 周期性體力活動與非周期性體力活動回歸模型的建立
與Crouter-2010腰部兩階段模型類似,以VM/10 s的335.5為界點,將小于該值的體力活動界定為靜息類體力活動,賦值為1 MET。在VM/10 s≥335.5的體力活動中,將CV/min<10.8的視為周期性體力活動,依據散點圖和多個擬合方程的比較建立二次回歸方程,如圖4所示。CV/min≥10.8的歸為非周期性體力活動,建立一般線性回歸方程。每分鐘的METs等于該分鐘內連續6個10 s的METs的平均值具體方程,見表5。
2.1.3? 神經網絡模型的建構
神經網絡模型能夠依據計算誤差反向傳播來進行自主學習,是眾多機器算法中的一種,基本模型一般由輸入層、隱層和輸出層組成,該模型通過處理大量的輸入變量和輸出變量擬合出貼近的映射關系,得出非線性模型。與傳統算法最主要的區別是不需輸入變量權值、映射關系等就能自主完成運算,是一個“黑箱”模型,適用于預測研究,已在多個領域中廣泛應用 [18] 。
2.1.3.1? ? 神經網絡模型輸入端變量的確定
運動能耗線性模型中輸入的指標一般為count值,實際為單位時間內原始數據的積分值,該指標并不能完全反映原始數據蘊含的全部信息,實際在該領域的指標體系可分為:1)時域類指標;2)頻域類指標。參考Ellis等[10 ]、Rothney等[8]和Montoye等[19]的研究成果,選取mvm等14個指標(見表6),同時因佩戴部位在腕部,加速度計的空間位置在不斷發生變化,而空間位置可以通過各軸與重力加速度的3個夾角來表示,如圖5所示。該指標蘊含著豐富的體力活動數據信息,通過重力加速度與其在三軸加速度傳感器的X、Y、Z軸的分量關系可以對其進行計算,由三角函數關系可以得出下式:
通過進一步的數據分析,表6中的指標中mvm、sdvm、df、fpdf、sd-?琢、sd- ?茁、sd-?酌 、cv、qd和peak與METs的相關系數分別為0.720、0.742、0.542、-0.475、0.635、0.672、0.651、0.730、0.498;而m-?琢 、m-?茁、m-?酌和skewness的相關系數低于0.4,屬于中低強度相關關系,為了簡化神經網絡模型,降低模型的迭代次數,固不將以上4個指標納入到計算模型中。10個輸入指標在各個體力活動項目上的描述性統計見表7。
2.1.3.2? ? 輸入數據的歸一化運算
為滿足網絡權值調整需要,減輕網絡訓練時間,對輸入數據進行歸一化運算,經標準公式Y=(X-Xmin)/(Xmax-Xmin)運算后,所有數值為0~1。
2.1.3.3? ? 模型參數的設定
傳統網絡局部極小值和收斂速度慢的問題,本研究采用動量-學習率自動調整算法,為保障訓練的準確性,初始動量取值范圍0.5~0.9,學習率范圍0.01~0.2,訓練網絡的最大誤差設定為0.001。模擬訓練表明誤差在網絡迭代次數5 000次以上時不再增加,故將5 000次作為停止訓練的標準,以防止出現過度訓練的現象。
2.1.3.4? ? 隱層節點數的確定
隱層節點數的確定是神經網絡模型設定的關鍵問題,適宜節點數可以在提高網絡預測精度的同時預防過度擬合。本研究采用試湊法,以驗證樣本中的平均絕對值誤差作為指標,確定隱層節點數,如圖6所示,當隱層節點數為21后,MAPE保持相對的穩定,依據模型簡約性的原則,確認隱層節點數為21。
2.1.3.5? ?模型的確定
通過對輸入層指標的篩選和相關參數的調整比較,最終確認初始學習率為0.05,動量常量設為0.5,誤差率設為0.001的10-21-1的三層神經網絡模型。
2.1.4? 支持向量機模型的建構
支持向量機模型是另一種近年來廣泛應用于預測、分類和模式識別的算法,是建立在結構風險最小化原理和統計學習理論基礎上的機器學習算法,在高維數據和非線性數據處理上,能夠有效地解決“過學習”和“維數災難問題”[18]。
2.1.4.1? ? 支持向量機模型輸入端變量的確定
與神經網絡模型輸入的變量相同,在此不再贅述。
2.1.4.2? ? 支持向量機模型關鍵參數的確定
支持向量機模型建構中核函數參數(gamma)和懲罰因子(C)的設置是預測模型精度的關鍵。參數gamma代表著RBF的幅寬,設置太大容易影響泛化功能,數值太小影響預測準確性,而參數(懲罰因子)控制著模型復雜度和逼近誤差時的折中[20 ]。
本研究根據特征量、樣本數并參考已有研究,選擇徑向基函數(RBF)作為模型的核函數。通過試湊法,以MAPE為標準確定2個參數的數值。
圖7顯示的是MAPE隨核函數gamma變化的情況(C恒等為10),gamma參數在1.5時,模型的預測精度最高。在確定gamma系數后,通過試湊法,確定C系數為10。此外,將模型的損失系數設置為0.01。
2.1.4.3? ? 支持向量機模型的確認
通過多次對比和參數調整,最終選擇以RBF為核函數、gamma為1.5、C為10、損失系數為0.01的支持向量機模型。
2.2? 各模型測量準確性評估
選取在學界廣泛使用的Hendleman模型和Freedson模型與本研究構建的4種腕部加速度計模型進行預測準確性的比較,上述2個模型均是針對髖部加速度計而設計的線性回歸模型,見表8。
2.2.1? 各模型整體預測準確性的比較
從模型整體測量誤差上看(如圖8所示),無論是在Bias還是在RMSE上,腕部神經網絡模型測量誤差最小(RMSE=1.28;Bias=0.032),其次是支持向量機模型(RMSE=1.31;Bias=-0.035);在Bias指標上,髖部Hendleman模型最高,為0.310;而在RMSE指標上,腕部線性回歸模型最高,為1.78。從整體上看,腕部的神經網絡模型和支持向量機模型的預測準確性高于髖部的Freedson模型和Hendleman模型。
通過Bland-Altman法,本研究分別計算了6種方法預測結果與氣體代謝分析儀測量值的一致性限度區間(limits of agreement, mean ),線性回歸模型為(-3.3,3.6),兩階段模型為(3.3,-2.2),神經網絡模型為(-2.4,2.5)、支持向量機模型為(-2.2,2.8),Freedson模型為(3.2,-2.1)和Hendleman模型為(3.6,-3.3),從圖9可見,神經網絡模型和支持向量機模型的預測結果與實測值的一致性程度較高。
為進一步檢驗各模型預測值與實測值(K4b2測量結果)之間的一致性,本研究采用等效性檢驗中的可信區間法,該方法可以得出2組數據等效或無差異[21]。本研究采用Nolan等[16]制定的標準為檢驗等效性的依據,即預測均值90%置信區間是否落入實測均值的等效區間(?滋±10%?滋)。
從表9可知,線性回歸模型、兩階段模型、Freedson模型和Hendleman模型預測數值90%的置信區間均沒有落入校標實測值的等效區間里,神經網絡模型和支持向量機模型90%置信區間分別為4.01~4.17和3.86~4.13,落在了3.72~4.54的等效區間內,可以認定,后2種模型預測值與K4b2校標值測量之間具有等效性。
2.2.2? 模型在各體力活動項目測量的準確性
從圖10可知,神經網絡模型和支持向量機模型的散點普遍靠近參考線,支持向量機模型在20個體力活動項目中,低估所有的家務勞動類體力活動和運動類體力活動,在全部低估的14個項目中 ,6個項目低估幅度在10%以內,有6個項目低估的幅度在10%~20%, 所有高估的幅度均在10%以內;神經網絡模型高估了10項體力活動的能耗,低估了10項體力活動項目;兩階段模型有6個體力活動項目的估計誤差在±20%以上,其在上、下肢體力活動的項目中有較好的預測效度;而線性模型預測中有12項體力活動項目的預測誤差在±20%以上,預測誤差明顯高于其他3個模型。
對單個體力活動項目進行分析發現(見表10),在擦桌子時,一般線性回歸模型和兩階段模型的預測誤差較大,分別高估能耗87%和59%,而基于機器學習算法的2種模型卻有較高的精確性,類似的情況還出現在3 mph3%走、3 mph8%走和5 mph3%跑上,這3個項目的共同特征是帶有坡度的走跑類體力活動,而沒有坡度的走跑運動則各模型均有較準確的預測;此外,4個腕部模型都在跳繩項目上嚴重低估其能耗,低估的幅度為29%~40%。
3? ?分析與討論
3.1? 實驗方案的分析
在日常體力活動能耗測量的研究中,研究者普遍摒棄了早期以Freedson模型為代表的走跑運動實驗方案[5],認為走跑運動方案難以準確反映日常體力活動的特征,其建構的模型不能準確測量日常生活中的非走跑類體力活動[22],實驗方案的制定必須是走跑類體力活動方案與非走跑類體力活動方案的結合[23]。在此基礎上,部分學者在研究中將靜息類的體力活動融入到體力活動方案中,認為靜息類的體力活動雖然梅脫值低,但在日常體力活動中占據較長時間,不能因其引入方案會影響模型對走跑類體力活動和非走跑類體力活動的預測準確性就視而不見[24]。此外,還有學者認為在設計體力活動方案時應該考慮上、下肢的活動特征。綜上所述,本研究認為在進行加速度計預測日常體力活動的能耗研究中,實驗方案應是被預測人員日常生活的縮影,在構建時應考慮被試者因素、肢體活動特征因素和體力活動強度因素,選擇適宜種類和數量的體力活動,保證方案的代表性。
因此,本研究的實驗方案由5種靜息類體力活動、6種走跑類體力活動,5種家務勞動類體力活動和4種體育鍛煉類體力活動構成,基本囊括大學生日常體力活動的主要類型和項目,同時又兼顧了體力活動的肢體特征和強度特征,坐著看手機、坐著打字和坐著讀書均涉及少量上肢肢體活動,而疊衣服、整理書桌主要是站立狀態下較大幅度的上肢活動,掃地和拖地及其他體育鍛煉類體力活動均是上、下肢活動兼有的非周期性體力活動,所有的走跑類體力活動為上、下肢活動兼有的周期性體力活動。本方案有6項體力活動屬于小強度的體力活動(<3 METs),8項體力活動屬于中等強度的體力活動(3~5.9 METs),6項體力活動屬于大強度體力活動(≥6 METs),測試方案基本滿足強度特征。
雖然有研究表明,在走跑運動中,隨著坡度的增加,基于回歸模型的加速度計能耗預測誤差加大;但是鑒于坡道情況下的走跑類體力活動在日常走跑活動中占據較大比重,同時考慮到機器學習算法的普適性檢驗,遂將坡度走跑類體力活動納入實驗方案中。
3.2? 腕部加速度計各預測模型準確性的分析
3.2.1? 線性回歸模型和兩階段模型能耗預測準確性分析
加速度計能耗模型經歷了線性回歸模型、兩階段模型和機器學習模型這3個階段,3個模型主要是髖部模型,針對腕部模型的研究數量較少。早期對線性回歸模型的研究中:Swartz等[6]將CSA單軸加速度計佩戴在腕部和髖部,對其能耗準確性進行評估,回歸方程只能解釋3.3%的變異。而Chen等[25]的研究表明3軸加速度計VM值與校標值之間的決策系數為0.41,這與本研究的結果相近,造成前后不同研究結果差距較大的主要原因與加速度計的性能相關,單軸加速度計不能有效反映腕部加速度計的狀況。Rosenberger等[26]在此基礎上,將兩階段模型和線性回歸模型同時進行評估,結果顯示兩階段模型中ROC區分靜息類體力活動的AUC曲線為0.76,區分周期性體力活動的為0.56,低于本研究的AUC(0.99和0.76),而能耗預測的平均差值0.82 METs,高于本研究的0.55 METs,測量誤差高于本研究。這可能與該研究選擇的體力活動方案有關,例如,選擇自行車等項目勢必會降低預測的準確性。雖然本研究橫向上與Rosenberger等的研究結果略有不同,但研究縱向比較的結果基本一致,均是兩階段模型的測量準確性明顯優于一般線性回歸模型;但該類模型最早是針對髖部加速度計而設計的,從腕部的應用效果上來看,測量的準確性低于髖部,其實踐應用的價值有待進一步探究。
在本研究中,線性模型的截距為2.019,也就是說在靜息類的體力活動中其預測的能耗都高于2.0 METs,而實測值在1.3 METs左右,遠高于實測值,6個項目的預測誤差在59%~70%。而兩階段模型對于靜息類體力活動賦值為1 METs, 其預測的誤差遠低于線性回歸模型;鑒于此,Crouter等[27]在兩階段模型和線性回歸模型之間提出了一種折中的算法,僅把體力活動分為靜息類和非靜息類體力活動,靜息類體力活動賦值為1 METs,非靜息類體力活動建立線性回歸方程,有效地解決了靜息類體力活動測量誤差偏大的問題。在兒童中應用的結果顯示,矢量技術的預測方程的RMSE為1.38 METs,預測誤差高于本研究和Rosenberger等的研究結果,這提示進一步對體力活動進行細分,并分別建立回歸方程,有助于提高預測的準確性。
Swartz等[6]針對走跑運動建構線性回歸模型,腕部的R2為0.03,而髖部則為0.32,Mannini等[28]和Chen等[25]的研究結果也類似。而對于兩階段模型而言,也存在相同的問題,髖部的預測準確性明確高于腕部,Rosenberger的研究[26]顯示腕部的平均誤差為0.82 METs,高于髖部的0.55 METs,其分類準確性也低于髖部模型。由此可以推斷,無論是線性回歸模型預測,還是兩階段模型預測,腕部加速度計能耗預測模型的預測準確性均低于較髖部。
3.2.2? 機器學習算法預測準確性分析
本研究將機器學習算法中的神經網絡模型和支持向量機模型同時引入到腕部加速度計模型中,結果顯示:RMSE分別為1.28 METs和1.30 METs。該研究結果得到其他研究的支持,Montoye等[12]的神經網絡模型測試結果顯示r為0.84,RMSE為1.25 METs,這與本研究的結果相近,表明神經網絡模型在腕部加速度計的能耗預測中具有一定的穩定性。還有研究構建和評估隨機森林分類器算法模型,其同時融合心率信號和加速度信號,結果顯示RMSE為1.00 METs[10];Strath等[13]則探討了時間序列模型的測量準確性,其RMSE為0.81~1.04 METs。上述研究結果顯示,機器學習算法之間的誤差相差很小,這也與本研究的結果基本一致,在本研究中機器學習算法和支持向量機算法的RMSE也只僅相差0.03。
本研究的結果表明,機器學習算法在腕部加速度計能耗的預測準確性高于線性回歸模型和兩階段模型,該結果也部分得到Montoye研究[19]的印證,該研究顯示神經網絡模型和一般線性回歸模型的RMSE分別為1.26~1.32 METs和1.55~1.61 METs,神經網絡模型優于一般線性回歸模型。Staudenmayer等[9]對不同模型進行對比后也得出相似結果。機器學習算法預測精度優于傳統模型的一個最主要原因就是其充分利用原始數據,將其合成為反映原始數據信息的眾多指標,而傳統的模型則受算法限制只能將原始數據合成單一的count值,不能充分挖掘原始數據中蘊含的豐富含義。
此外,本研究的結果還顯示神經網絡模型和支持向量機模型無論在RMSE還是Bias指標上均低于髖部的Freedson模型和Hendleman模型,但應該認識到建立上述2個模型所依據的體力活動方案和實驗對象都不同。因此,并不能簡單地通過等效性檢驗和RMSE分析就得出腕部的2個模型預測準確性高于Freedson模型和Hendleman模型的結論, 這還需要更多的研究來支撐。
在測量部位對機器學習模型測量準確性影響的探討中,Ellis等[10]發現相同隨機森林算法的髖部模型和腕部模型之間測量準確性并無顯著性的差異,其RMSE分別為1.09 METs和1.00 METs。還有研究發現神經網絡算法在體力活動類型識別上,髖部與腕部的準確率之間無顯著性差異[29],Montoye等[19]的研究結果也相似。目前,對該問題的實證研究較少,但可以推斷,機器學習算法能夠比線性回歸模型更好地應用于腕部加速度計中,且測量準確性與髖部相近,其原因在于:機器學習算法具有“智能”特征,能夠自主學習,可以依據現有數據優化算法,充分利用數據中蘊含的豐富信息反映體力活動特征,而是否存在著機器學習算法受佩戴部位影響小、線性回歸模型和兩階段模型受佩戴部位影響大這種佩戴部位和算法模型之間的交互效應,還應有更多的研究進行系統的探討。
3.3? 機器學習模型輸入指標體系的分析
本研究建立了含有10個指標的機器學習輸入層指標體系,其中:7個指標是借鑒髖部加速度計的相關成果,3個指標是根據腕部的運動特征而專門設計的,以反映加速度計在空間中的位置變化速度,從與實測值的相關系數上看,這3個指標是滿足預測需要的。目前,該研究領域的指標體系分為2大類:一類是時域指標;一類是頻域指標。時域指標因其提取簡便、含義清晰而受青睞,但頻域指標能夠深層次地反映某些時域指標不能體現的信息[28]。目前,對指標的篩選和數量的確認缺乏明確的標準,少數研究采用試湊法對此進行研究,Kate等[30]認為對于體力活動類型識別的任務,更多特征指標的輸入能夠提高機器學習模型的準確性;而對于能耗預測的任務,特征指標的數量對預測準確性的影響具有邊際效應。Montoye等[12]的研究結果也支持這一結論。但上述研究對于不同指標組合的確認具有較大的主觀性,如何客觀地篩選指標是下一步研究應該解決的問題。
3.4? 本研究的局限
本研究中的受試者均為18~29歲的正常體質量大學生,所建立的模型是否具有人群的局限性還需要后續研究加以探討;在研究方案上,本研究所有的測試均在實驗室情境下以體力活動任務清單的形式執行,雖然體力活動項目眾多,基本反映日常體力活動的狀況,且各強度兼而有之,但還是與日常生活的實際情況有較大差距,下一步應在條件允許的情況下,探討實際生活情景下的預測模型,進一步提高方程預測的準確性。
4? ?結論
本研究所建構的4個腕部加速度計能耗預測模型中,神經網絡模型和支持向量機模型預測的準確性高于兩階段模型和線性回歸模型,前2種模型可以較好地預測日常體力活動中的能量消耗,具有較高的實踐應用價值;而在腕部能耗預測中,應慎重應用兩階段模型,一般線性回歸模型不適宜應用于腕部加速度計。應進一步加強對相同計算模型不同部位間的比較,系統探究計算模型、佩戴部位和體力活動類型對加速度計測量準確性的影響。
參考文獻:
[1]? 溫煦, 袁冰, 李華, 等.論智能可穿戴設備在我國體力活動大數據分析中的應用[J]. 中國體育科技, 2017, 53(2):80.
[2]? TROST S G, MCIVER K L, PATE R R. Conducting accelerometer-based activity assessments in field-based research[J]. Medicine and Science in Sports and Exercise, 2005, 37(11):531.
[3]? YANG C C, HSU Y L. A review of accelerometry-based wearable motion detectors for physical activity monitoring[J]. Sensors, 2010, 10(8):7772.
[4]? FREEDSON P S, MELANSON E, SIRARD J. Calibration of the computer science and applications, inc. accelerometer[J]. Medicine and Science in Sports and Exercise, 1998, 30(5):777.
[5] HENDELMAN D, MILLER K, BAGGETT C, et al. Validity of accelerometry for the assessment of moderate intensity physical activity in the field[J]. Medicine and Science in Sports and Exercise, 2000, 32(9 ): 442.
[6]? SWARTZ A M, STRATH S J, BASSETT D R, et al. Estimation of energy expenditure using CSA accelerometers at hip and wrist sites[J]. Medicine & Science in Sports & Exercise, 2000, 32(9):450.
[7]? CROUTER S E, CLOWERS K G, BASSETT JR D R. A novel method for using accelerometer data to predict energy expenditure[J]. Journal of Applied Physiology, 2006, 100(4):1324.
[8]? ROTHNEY M P, NEUMANN M, BéZIAT A, et al. An artificial neural network model of energy expenditure using nonintegrated acceleration signals[J]. Journal of Applied Physiology, 2007, 103(4): 1419.
[9]? STAUDENMAYER J, POBER D, CROUTER S, et al. An artificial neural network to estimate physical activity energy expenditure and identify physical activity type from an accelerometer[J]. Journal of Applied Physiology, 2009, 107(4):1300.
[10]? ELLIS K, KERR J, GODBOLE S, et al. A random forest classifier for the prediction of energy expenditure and type of physical activity from wrist and hip accelerometers[J]. Physiological Measurement, 2014, 35(11):2191.
[11]? TROIANO R P, MCCLAIN J J, BRYCHTA R J, et al. Evolution of accelerometer methods for physical activity research[J]. British Journal of Sports Medicine, 2014, 48(13): 1019.
[12]? MONTOYE A H, PIVARNIK J M, MUDD L M, et al. Wrist-independent energy expenditure prediction models from raw accelerometer data[J]. Physiological Measurement, 2016, 37(10):1770.
[13]? STRATH S J, KATE R J, KEENAN K G, et al. Ngram time series model to predict activity type and energy cost from wrist, hip and ankle accelerometers: implications of age[J]. Physiological Measurement, 2015, 36(11):2335.
[14]? 陳立基. 周期性運動項目訓練手段的發展趨勢[J]. 武漢體育學院學報, 1987(2):47.
[15]? MANSOUBI M, PEARSON N, CLEMES S A, et al. Energy expenditure during common sitting and standing tasks: examining the 1.5 MET definition of sedentary behaviour[J]. BMC Public Health, 2015, 15(1): 516.
[16]? NOLAN M, MITCHELL J R, DOYLE-BAKER P K. Validity of the apple iphone?/ipod touch? as an accelerometer-based physical activity monitor: a proof-of-concept study[J]. Journal of Physical Activity & Health, 2014, 11(4):759.
[17]? FAWCETT T. An introduction to ROC analysis[J]. Pattern Recognition Letters, 2006, 27(8):861.
[18]? 張學工. 關于統計學習理論與支持向量機[J]. 自動化學報, 2000, 26(1):32.
[19]? MONTOYE A H K, BEGUM M, HENNING Z, et al. Comparison of linear and non-linear models for predicting energy expenditure from raw accelerometer data[J]. Physiological Measurement, 2017, 38(2):343.
[20]? 丁世飛, 齊丙娟, 譚紅艷. 支持向量機理論與算法研究綜述[J]. 電子科技大學學報, 2011,40(1): 2.
[21]? 袁秉祥, 朱芳. 生物等效性檢驗的計算及計算程序[J]. 西安醫科大學學報, 2001, 22(2):164.
[22]? LEENDERS N Y, SHERMAN W M, NAGARAJA H N. Energy expenditure estimated by accelerometry and doubly labeled water: do they agree[J]. Medicine & Science in Sports & Exercise, 2006, 38(12):2165.
[23]? 朱琳, 陳佩杰. 應用ROC曲線確定活動計數在青春期少年運動強度診斷中的最佳臨界值[J]. 體育科學, 2012, 32(11):70.
[24]? CHEN K Y, BASSETT D R. The technology of accelerometry-based activity monitors: current and future[J]. Medicine & Science in Sports & Exercise, 2005, 37(11S):490.
[25]? CHEN K Y, ACRA S A, MAJCHRZAK K, et al. Predicting energy expenditure of physical activity using hip-and wrist-worn accelerometers[J].Diabetes Technology & Therapeutics, 2003, 5(6): 1023.
[26]? ROSENBERGER M E, HASKELL W L, ALBINALI F, et al. Estimating activity and sedentary behavior from an accelerometer on the hip or wrist[J]. Medicine and Science in Sports and Exercise, 2013, 45(5):964.
[27]? CROUTER S E, JENNIFER I F, DAVID R B. Estimating physical activity in youth using a wrist accelerometer[J]. Medicine and Science in Sports and Exercise ,2015,47 (5): 944.
[28]? MANNINI A, INTILLE S S, ROSENBERGER M, et al. Activity recognition using a single accelerometer placed at the wrist or ankle[J]. Medicine & Science in Sports & Exercise, 2013, 45(11):2193.
[29]? TROST S G, ZHENG Y, WONG W K. Machine learning for activity recognition: hip versus wrist data[J]. Physiological Measurement, 2014, 35(11): 2183.
[30]? KATE R J, SWARTZ A M, WELCH W A, et al. Comparative evaluation of features and techniques for identifying activity type and estimating energy cost from accelerometer data[J]. Physiological Measurement, 2016, 37(3): 360.