武瑞倩,吳賢發,詹何慶
(海南醫學院生物醫學信息與工程學院,海南 海口 571199)
睡眠是人類一項重要的生理活動,研究發現,腦電信號在不同睡眠的階段變化較大,可用于睡眠分期研究[1-3]。然而,相較于腦電,心電信號的檢測更為可靠和便利,且心率變異性的特征與睡眠的各個階段息息相關[4-6]。因此,利用心電信號進行睡眠分期逐漸成為當今研究的熱點。相關研究方法包括深度神經網絡模型、隱馬爾可夫模型、梯度提升樹和極限學習機(extreme learning machine,ELM)等[7-10]。本研究基于極限學習機的方法,對心電信號進行識別以實現睡眠分期。
本研究選用麻省理工學院的多導睡眠數據庫(包含17 位受試者的睡眠記錄)[11],并提取了病人信息、心電信息、RR間期信息和睡眠注釋信息。在信號預處理環節,采用巴特沃斯低通濾波器去除心電信號的工頻干擾,使用中值濾波去除肌電干擾和基線漂移。然后,通過特征提取以降低原始的冗余數據。該環節主要是對于心率變異性(heart rate variability,HRV)進行特征提取,包括時域特征提取、頻域特征提取和非線性特征提取[12-15]。其中,時域特征包括平均值、標準差、相鄰RR 之間差異的標準差等;頻域指標包括極低頻(very low frequency,VLF)、低頻(low frequency,LF)和高頻(high frequency,HF);非線性特征主要提取受試者的交感神經指數與迷走神經指數。
本研究屬于監督學習中的分類問題,在進行睡眠分期時,將睡眠分別做三分類、四分類、六分類的預測。考慮到極限學習機具有學習速度快、泛化能力強的優點,本研究選用極限學習機對睡眠實現不同類別的分期。在提取各受試者心電信號特征之后,以7:3的比例劃分訓練集與測試集,使用訓練集在ELM 的分類模型上進行訓練,得到分類模型后,再利用測試集在分類模型上進行分類,并測算準確率。
心電信號噪聲預處理結果如圖1所示。其中紅色曲線為原始心電信號,綠色曲線為去除工頻干擾后的信號,藍色曲線為去除完三種噪聲后的信號。

圖1 心電信號預處理結果圖
在醫學界對睡眠進行分析時,主要是對HRV 進行短程分析,即30 秒。因此,本設計的所有對于QRS波群的特征提取均以30 秒為單位。以66 號受試者為例,提取到的各個特征的相關信息以及特征值如表1所示。

表1 心電信號特征提取表
如前所述,本研究選用ELM 對睡眠分期進行測試,并且選用了三分類、四分類和六分類等分期標準,相關結果如表2所示。

表2 ELM分類結果
人睡眠狀態下,心電信號中的心率變異性與自主神經系統存在密切關系,且睡眠受自主神經系統的管制,而睡眠分期是剖析睡眠狀況和評估睡眠質量的重要措施之一。本文提出基于心電信號的睡眠自動分期方法,包括心電信號數據庫的處理、預處理、波群檢測、特征提取,以及分類方法選擇。
近年來,隨著人工智能的普及,利用機器學習的方法對睡眠進行分期逐漸成為主流研究趨勢。利用支持向量機、隱馬爾可夫、隨機森林等發展較成熟的機器學習算法實現睡眠分期的準確率普遍都在70%以上[16]。由于極限學習機的概念提出較晚,因此目前利用極限學習機對睡眠進行分期的研究依然較少,Utomo等采用加權極值機器學習處理非平衡學習數據集,特征選擇使用了粒子群優化的方法,建立基于心電信號的睡眠階段分類模型,準確率達到73.09%[17]。吳振華等提取了心電信號、呼吸信號以及心肺耦合信號的特征,將特征進行最優選擇后,使用粒子群優化和極限學習機結合的方法對睡眠進行二分類、三分類、四分類和六分類,準確率均超過75%[18]。從實驗結果來看,本研究的準確率并不高,但算法較為簡單,可應用范圍廣。未來的研究可以從以下幾個方面進行優化。
⑴原多導睡眠數據庫可能存在某些信號值的缺失,可以對這些缺失的信息進行填補或刪除。
⑵在對HRV 特征提取完后沒有對異常的特征進行剔除,在之后的研究中需要設定特征值的判別標準以剔除不合適的特征值。
⑶機器學習模型的參數是根據以往學者得出的經驗進行調優的,后續可以在大量實驗的基礎上進行參數的調節以獲得更高的準確率。