崔莉,周鈞鍇,2,王念,2,肖京,季宇宣,姜美馳
1. 中國科學院計算技術研究所 泛在計算系統研究中心,北京 100190;2. 中國科學院大學 計算機科學與技術學院,北京 100190;3. 中國中醫科學院西苑醫院 康復醫學科,北京 100091
慢性腰痛(Chronic Low Back Pain,CLBP)可分為特異性慢性腰痛和非特異性慢性腰痛(Chronic Non-specific Low Back Pain,nLBP),該病患者眾多[1-3]。其中nLBP是指排除已知的特異性病理變化所導致的腰、背和骸部的疼痛,該類疾病病因不明確,轉歸多元[3],在CLBP患者中最為常見,對患者的生活和工作造成極大困擾。目前,多個研究證實康復運動對nLBP的治療和康復起到關鍵作用[4],但患者對腰痛的主觀感受呈高度個體化差異,且醫生對導致疼痛的責任肌肉的定位依賴于主觀判斷[5-7],容易由于經驗偏差而影響診療效果。表面肌電檢測是非特異腰痛診斷中的常用方法,目前醫院中使用的表面肌電儀提供豐富而精確的動態肌電信息,經醫生判讀并分析歸納出特定的信號特征,進而對所檢測的肌肉與疼痛的相關性做出判斷。這些客觀數據能在一定程度上有助于對患者疾病狀態的精準判斷,然而,由人工來解讀海量數據耗時費力,且仍不能解決因為醫生經驗和診斷水平差異而帶來的偏倚。
近年來,人工智能技術越來越多地應用于醫學自動診斷領域[8-10],如輔助影像分析[11],在提高疾病識別和診斷效率的同時,極大地降低了醫生的診斷時間成本和醫療開銷。本團隊研制了一種針對nLBP的人工智能(Artificial Intelligence,AI)輔助診斷系統,該系統由肌電信號預處理、運動區間識別、基于機器學習的特征提取及模型推理、基于肌電映射規則的自動診斷等主要部分組成,可以判斷每塊肌肉的疼痛客觀狀態,并通過典型特征分析肌肉募集能力、疲勞速度和靜息速度等指標,據此輔助醫生得出診斷結論。本文重點針對nLBP疼痛肌肉的識別與診斷,通過對比醫生常規診斷方式和AI輔助診斷系統的診斷效果,研究AI輔助診斷系統對于肌電數據的分析效果與分析能力,對其在nLBP診斷中的表現進行初步驗證和評價。
目前臨床中,對于nLBP診斷大多使用基于典型肌電特征的診斷。該方法要求患者進行固定的測試動作,不同的動作可以從不同的醫學角度描述肌肉的生理狀態,通過計算正常人和患者在典型特征上的差異來識別患者[12]。
本研究組于2020年6月至2020年8月在中國中醫科學院西苑醫院采集了15名nLBP患者的肌電信號,其中男性7例,女性8例。nLBP患者的納入標準為:病程為6個月至10年;疼痛視覺模擬評分0~4分;CT或MRI檢查未見椎間盤異常或僅有間盤變性。本研究經中國醫學科學院西苑醫院倫理委員會批準同意。
為驗證AI系統軟件自動輸出診斷結果與醫生診斷結果的等效性,本研究方案采用可信區間的途徑來評估等效性。等效性試驗計量資料結局樣本量的計算公式如公式(1)所示。

其中s為均值的標準差,δ為對照組均值與試驗組均值的差值,α為出現假陽性錯誤的可能性,β為出現假陰性錯誤的可能性,z為α和β對應的U值。據本臨床試驗的目的,驗證設計采用95%CI(雙側檢驗)作為判斷等效的允許變異范圍,測量指標為結論的識別正確數量。根據以往臨床試驗估計,允許的誤差范圍為1個,即正負值均不超過1時為等效,醫生診斷的標準差為1個。該試驗的把握度為80%,則根據公式(1)計算得,每組所需樣本量為15例受試者。
1.2.1 肌電信號采集方法
本研究使用表面電極監測受試者腰部的左右兩側多裂肌、左右兩側最長肌和左右兩側腰髂肋肌在運動中的信號。肌肉位置如圖1所示。實際采集中,表面電極對粘貼在對應肌肉的肌腹處,每對電極的間距約為2 cm,并使用防過敏膠帶加固以盡量防止電極脫落。表面電極采用上海韓潔電子科技有限公司公司生產的CH3236TD一次性使用心電電極。

圖1 監測肌肉位置
本工作采用臨床醫學已總結出的針對腰痛和nLBP患者輔助診斷的肌電測試動作并形成測試流程[13-15]。一次采集流程包括執行五次屈曲放松運動、一次雙足橋式運動、一次左足橋式運動、一次右足橋式運動和一次 Biering Sorensen等長運動,運動測試的流程如圖2所示。

圖2 受試者臨床肌電測試流程
動作規范包括以下四個方面:
(1)屈曲放松運動。受試者雙足與肩同寬,用2 s向前勻速彎腰,當軀干前屈到達最大幅度后,腰部完全放松并保持4 s,之后用2 s直立軀干。
(2)雙足橋式運動。受試者仰臥于床上并屈膝,用力抬起臀部至最高點,保持此體位15 s。
(3)右足支撐的橋式運動和左足支撐的橋式運動。受試者仰臥于床上,重復橋式運動5 s,之后將單足提起與軀干平行并保持10 s。
(4)Biering Sorensen等長運動。受試者俯臥于床上,腿的末端固定于床上,之后受試者用手交叉抓住對側肩部并保持此姿勢30 s。
在一次采集中,上述運動的肌電信號會按照時間順序串行拼接在一起,構成該受試者的一條肌電信號數據。
1.2.2 采集設備與對象
肌電信號采集采用Thought Technology Ltd公司生產的FlexComp Infiniti 10肌電儀,儀器和肌電信號采集界面分別如圖3~4所示,圖5為臨床實驗場景。

圖3 FlexComp Infiniti 10肌電儀圖

圖4 肌電信號采集界面

圖5 臨床測試中的肌電采集場景
1.2.3 診斷方法
(1)常規臨床診斷。由西苑醫院康復醫學科3名資深醫生對患者的肌電信號進行臨床判斷。首先患者按照要求完成固定的肌電測試動作后,醫師對肌電測試信號中各個運動區間的開始時間點和結束時間點進行手工標記。之后醫師從原始肌電信號中提取典型特征,這些特征可以從某個醫學角度描述患者肌肉的生理狀態。醫師再通過統計學計算方法找出正常人和患者在這些典型特征上的差異,依此識別患者并對每塊肌肉存在的問題進行診斷,從而給出診斷報告。當三位醫生的診斷結果不完全一致時,對不一致的部分由三位醫生采用多數投票的方法確定診斷結論,并將此診斷結果作為本測試的金標準[16]。
(2)AI自動診斷方式。本研究提出的針對nLBP的AI輔助診斷系統由肌電信號預處理、雙閾值計算、運動區間自動識別、數據集平衡處理、疼痛肌肉定位及特征提取、基于肌電映射規則的自動診斷部分組成[12],系統流程如圖6所示。該系統首先基于線性插值法和基于小群組的去噪方法對肌電信號進行預處理,然后使用基于局部動態閾值的雙閾值法[17]確定各個運動區間的起止點。之后系統使用趨于正域化的過采樣方法平衡數據集,從而得到精確特征數據集,再使用由機器學習方法構建的隨機森林模型對疼痛肌肉進行位置確定并提取肌電典型特征,最后通過與肌電特征之間的映射規則進行nLBP的診斷,并自動出具診斷報告。

圖6 AI自動診斷軟件流程圖
(3)肌電信號預處理。實際采集中存在各種環境干擾和測試噪聲,本系統研究了一種基于小群組的噪聲去除方法[12],通過聚類和密度分析去除噪聲。此外,肌電采集設備導出的原始肌電信號中還含有缺失值,所以系統還需要對肌電信號中的缺失值進行補全,以支持后續的分析。本系統使用線性插值法[18]對原始肌電信號中的缺失值進行補全。線性插值法的具體過程為:設函數y=f(x)在點x0和x1處的值分別為y0和y1,則線性插值法的計算公式如式(2)所示。

(4)識別閾值計算及運動區間自動識別。在常規臨床診斷方式中,醫師需要對肌電信號中各個運動區間的起止時間點進行手工標記。 AI自動診斷系統則需要實現對運動區間起止點的自動識別。為此,本研究提出了一種基于局部動態雙閾值的運動區間起止點識別方法[17],見圖7。該方法使用計算出的多個低識別閾值和高識別閾值分別對多個運動區間的起止點進行識別,低識別閾值和高識別閾值的計算公式如公式(3)~(4)所示。

圖7 基于局部動態閾值的信號活動區間識別方法示意圖

其中,AEMG為肌電平均值,VAR為肌電方差,k1、k2、k3、k4為比例系數。
(5)樣本均衡。由于肌電信號數據集通常樣本量較少,而且存在數據不平衡問題,導致建立模型的訓練過程中會忽略少量但重要的疾病信息,從而影響模型精度。所以本工作設計了一種趨于正域化的過采樣方法[19]來解決數據集的不平衡問題。該方法中,算法選擇未分類數據集中的一個A類隨機樣本和一個B類隨機樣本,向少數類樣本(B類樣本)方向在二者間進行插值如圖8a所示。經過過采樣方法處理后的數據集分布更加平衡(圖8b),可產生精確數據集集合支持后續建模和分析。

圖8 趨于正域化的過采樣方法示意圖
(6)疼痛肌肉定位。疼痛肌肉定位是nLBP臨床診斷中的步驟之一,但由于患者對于疼痛的忍耐度存在差異以及醫生存在經驗上的差異,該定位結果通常具有主觀性。主觀偏差可能會導致治療上的誤差,所以需要進行客觀的疼痛肌肉定位,以更好地輔助醫生進行更準確的診斷。在系統的計算模型訓練構建階段,本系統已經采用了236例受試者的肌電數據(包括81位男性nLBP患者、95位女性nLBP患者、33位男性正常受試者和27位女性正常受試者)結合過采樣方法進行了模型訓練[12],基于機器學習方法建立了隨機森林模型,可以準確識別疼痛肌肉的位置。本文選擇15例nLBP患者作為驗證樣本,在規范的臨床測試條件下,對nLBP的疼痛肌肉定位效果進行驗證。
(7)特征提取。nLBP患者的自動診斷還依賴于臨床常用肌電特征的提取和準確的計算模型。通過觀察受試者運動時肌電信號的均方根、平均肌電值、平均功率頻率和積分肌電值的變化,可以有效地區分nLBP患者和正常人,并作為臨床診斷依據[20]。所以本工作對受試者肌電信號的均方根、平均肌電值、平均功率頻率和積分肌電值進行特征提取,用于后續的自動診斷和驗證。
(8)自動診斷。最后,系統基于肌肉存在的問題和肌電特征之間的映射規則對受試者左右兩側多裂肌、左右兩側最長肌和左右兩側腰髂肋肌的肌肉募集能力[15]、疲勞速度[21]和靜息速度[15]三個臨床指標進行診斷,并出具診斷報告。
本研究研制的AI輔助診斷系統的界面如圖9~13所示,輔助診斷報告如圖14所示。

圖9 AI輔助診斷系統界面首頁

圖10 手動調整運動時間頁面

圖11 手動調整閾值頁面

圖12 放大信號顯示頁面

圖13 分段放大顯示信號模塊

圖14 AI輔助診斷系統診斷報告
本工作以醫生診斷結果為標準,對比評價AI輔助診斷系統針對nLBP診斷的效果。本文采用IBM SPSS 19.0對兩種診斷結果進行分析。使用組內相關系數(Intraclass Correlation Coefficient,ICC)對兩種診斷結果的一致性進行檢驗,對比常規診斷方式和AI診斷方式對nLBP的診斷檢出率和準確性,同時使用配對樣本t檢驗對常規診斷方式和AI診斷方式的診斷用時進行差異性分析。
本文以15名nLBP患者的主訴為基礎,結合醫師觀察給出對疼痛肌肉的人工標記(疼痛或非疼痛),對患者的左右兩側多裂肌、左右兩側最長肌和左右兩側腰髂肋肌共6塊肌肉進行標記,另使用AI診斷系統對于患者的疼痛肌肉位置進行計算,兩種方式所得結果如表1所示。

表1 人工與AI診斷系統對疼痛肌肉的標記個數
由表1結果可得,AI診斷系統對于左多裂肌、右多裂肌、左最長肌、右最長肌、左腰髂肋肌和右腰髂肋肌的疼痛肌肉標記與人工標記的一致度分別為53.33%、73.33%、80.00%、86.67%、80.00%和86.67%,平均為76.67%,說明AI診斷方式對于這15名nLBP患者的疼痛肌肉的診斷標記能力良好,兩種方式結果的差異反映出病人主訴的主觀性,及個體之間對疼痛敏感度的差異。AI的計算結果可以客觀佐證病人主訴,對醫生做出更準確的診斷提供幫助。
本文使用ICC作為信度檢驗指標,將15名nLBP患者的常規診斷方式診斷結果作為一組,將這15名nLBP患者的AI診斷方式診斷結果作為另一組,選擇3個臨床中常用的診斷指標:肌肉募集能力[15]、疲勞速度[21]和靜息速度[15],對患者的左右兩側多裂肌、左右兩側最長肌和左右兩側腰髂肋肌共6塊肌肉進行檢測。所以針對每位受試者,常規診斷方式對于每個診斷指標檢出的問題肌肉個數為0~6個。AI診斷方式對于每個診斷指標檢出的問題肌肉個數為0至常規診斷方式檢出的問題肌肉個數。
采用IBM SPSS 19.0統計軟件并使用ICC方法對兩種診斷方式的診斷結果一致性進行分析。在一致性分析時,本文信度的界定范圍如下:ICC>0.90為極好,ICC>0.7為良好,ICC<0.7為信度欠佳[21]。
實驗結果表明,常規診斷方式與AI診斷方式對15名nLBP患者的肌肉募集能力、疲勞速度和靜息速度的ICC值分別為1.000,1.000和1.000,均大于0.9,信度結果皆具有良好的一致性。
本文以中國中醫科學院西苑醫院3名資深醫師對于15名nLBP患者給出的肌電診斷報告為標準,對AI診斷系統對于患者的肌肉募集能力、疲勞速度和靜息速度3個診斷指標檢出的問題肌肉個數進行了驗證,兩種診斷方式的檢出問題肌肉總個數對比和對于每名受試者的檢出問題肌肉個數對比的驗證結果如表2所示。

表2 AI診斷/常規診斷兩種方式對于每名受試者的檢出問題肌肉個數對比
常規診斷方式和AI診斷方式對于肌肉募集能力、疲勞速度和靜息速度的檢出個數分別為29、81和36個,且對于每名受試者的檢出問題肌肉個數一致,說明AI診斷方式對于這15名nLBP患者的肌肉募集能力、疲勞速度和靜息速度的檢出能力良好,準確率高。
本研究共對相同的15名nLBP患者分別使用常規診斷方式和AI診斷方式進行了診斷,本文使用配對樣本t檢驗對兩種診斷方式的診斷用時進行差異性分析,其中診斷用時從導出患者數據的時間點開始,直到完成患者診斷報告的時間點結束。常規診斷方式的平均診斷用時為28 min,AI診斷方式的平均診斷用時為1.7 min,兩者具有明顯統計學差異(P<0.05)。AI診斷方式的平均診斷用時平均比常規診斷方式減少26.3 min。
本研究針對nLBP的醫生常規診斷方式存在病人主訴主觀性較強、醫生讀取肌電圖所需時間長成本高、診斷結果因醫生經驗不同會產生差異性等需要解決的問題,提出了一種面向nLBP的AI輔助診斷系統,并對系統的診斷效果進行了驗證與評價。從該系統的構建技術方面,該系統針對信號的強干擾采集狀態,提出的基于小群組的噪聲去除方法及局部動態閾值的運動區間識別方法,不僅能降低人工標記方法的時間成本,也為自動診斷提供了準確的運動區間起止點識別結果。在特征提取和計算模型的訓練建立中,該系統提出了基于小群組的噪聲去除和趨向正域化的過采樣方法解決了樣本不平衡的問題,從而提升了機器學習模型用于疼痛肌肉定位的準確性。從該系統的實用效果方面,初步獲得的驗證結果表明AI自動診斷方式和醫生常規診斷方式的診斷結果的一致性良好,診斷用時平均減少26.3 min,具有統計學意義(P<0.05)。對于本研究選取的15名nLBP患者,在檢出率與準確性方面,AI輔助診療系統對于肌肉募集能力、疲勞速度和靜息速度準確率的平均診斷準確性達到100%。同時,由于該AI輔助診斷系統能夠計算出疼痛肌肉的位置,可以對肌肉的狀態給出一個相對客觀的識別和判斷,這個不依賴病人主觀感覺的結果可以提供給醫生更多的信息支持,輔助醫生更準確地判斷病人的病情。比如對疼痛肌肉的識別和定位結果會對患者個性化運動處方及治療強度的制定產生影響,具體可表現為如下幾種可能性:當患者某塊肌肉存在檢出問題且有疼痛現象時,說明患者此肌肉的病情確切,需要重點治療;當患者某塊肌肉存在檢出問題但沒有疼痛現象時,說明患者此肌肉的病情較輕,需要給予關注;當患者某塊肌肉不存在檢出問題卻有疼痛現象時,說明此疼痛可能由于其他原因導致,需結合其他臨床診斷方式加以判斷。
本文提出了一種面向nLBP的AI輔助診斷系統,同時探索該系統的應用效果。本文提出的AI輔助診斷系統由肌電信號預處理、運動區間識別、特征提取及模型推理、基于肌電映射規則的自動診斷部分組成。初步驗證結果表明,該系統能夠有效地克服病人主訴及常規診斷方式中因醫生經驗不同而呈現出的主觀診斷差異,提升診斷效率,減少醫療成本,減輕醫生的臨床工作負擔,可為臨床nLBP檢測提供可靠幫助。后續工作中將進一步擴展AI系統與醫生常規診斷相結合的深度,并開展更具廣度的臨床測試與實用驗證。