李倩云,夏斌
(上海海事大學 上海 201306)
基于EEG的睡眠數據的分類
李倩云,夏斌
(上海海事大學 上海201306)
睡眠研究對于人的身心健康和工作生活有著重要的意義。睡眠過程中不同狀態的標注,是睡眠研究的一個基礎工作。本文采用單通道的腦電信號數據,將數據輸入到深度置信網絡中進行特征表達和分類學習。通過利用39個晚上的睡眠數據進行測試,達到了82.26%的平均分類準確率。
睡眠;深度學習;EEG;DBN
睡眠是人類不可或缺的一項生理活動,人的睡眠時間占到了人類生命的1/3。正常人每天的平均睡眠時間是7.5小時。良好的睡眠是保證人類身心健康和工作生活的基礎。睡眠障礙會導致人產生焦慮,抑郁等精神問題,還會引起心血管、內分泌等疾病進而影響工作能力,甚至導致車禍等嚴重事件的發生[1]。目前在醫學領域、生物工程領域甚至是交通運輸、軍事安全、航空航天等領域,睡眠研究已然成為一個熱點[2-3]。本項目旨在對睡眠階段的分類進行研究,這對于臨床上疾病的預測、診斷和治療的意義最為重大。
1953年,N.kleinllan和Aserinasky把睡眠狀態劃分為兩種:非眼球快速運動睡眠狀態(non-Rapid Eye Movements,NREMS)、眼球快速運動睡眠狀態(Rapid Eye Movements,REMS)。后來,為了方便研究,進一步將NREMS細分為4個周期(淺睡眠期S1、S2,深睡眠期S3、S4),而REMS作為一個周期[4]。在睡眠過程中,這幾個周期相繼出現,周而復始。睡眠分類的研究是正確認知睡眠狀態和診斷各種睡眠相關疾病的基礎性工作。
睡眠腦電是睡眠進行分期研究的重要工具。傳統的睡眠數據分類方法基于1968年Rechtschaffen和Kales的R&K準則以及2007年美國睡眠醫學會的AASM準則,主要是由專家對連續的整夜數據進行目測分析,然后在對各個睡眠階段進行劃分。這種方法耗時、繁瑣,并且需要大量數據。相對來說后期的自動分類方法則顯現出較大的優勢。
深度學習根源于神經網絡算法,“深度”源于其含有多層網。深度學習的方法是受到大腦的分層處理機制的啟發發展而來的。典型的淺層的機器學習算法包括應馬爾科夫模型、最大熵模型、支持向量機等,均為單層結構。因為其自身存在的局限性[5],從而激發了利用深度網絡的動機。
Hinton等人在2006年提出的深度信念網絡(DBN)[6]解決了BP算法訓練多層網絡時需要大量含標簽的樣本、收斂速度慢以及容易陷入局部最優的難題。自此以后,深度學習成為學術界關注的熱點,在應用領域顯示出巨大的優勢。除了圖像和語言方面,深度學習還應用在自然語言處理,搜索廣告預測等方面。將深度學習算法用于時序信號的處理方面的成果相對較少。Kang Li等人[7]利用了DBN模型對不同情緒下的腦電數據進行分類研究,作者是將不同的通道分別建立DBN模型,得到低維的特征表達后再進行一個有監督的RBM的訓練。DrausinWulsin等人[8]使用半監督的DBN方法,對不同病人的腦電數據進行分類,利用大量的無標簽數據進行非監督預訓練,然后利用有標簽數據進行微調。
1.1原始睡眠數據
本文所使用的睡眠數據來自。這個睡眠數據庫共包括39組數據,每組都是一個整夜的睡眠數據,來自于20個受試,其中一個受試一夜數據丟書,因此有39組數據。我們選擇了Pz-Oz這個通道的信號來進行睡眠分類研究,這個信號的采樣率是100 Hz。每個樣本是30秒的數據,樣本標簽是由睡眠專家標定,本文中是對數據做6類分析,因此只保留樣本中的AWAKE,S1,S2,S3,S4和REM階段的所有樣本。此時個子類樣本比例如表1所示,由于清醒狀態樣本過多,去掉一些清醒狀態的樣本和狀態轉換樣本,處理后的睡眠數據各子類樣本比例如表2所示。表3展示的20個受試的睡眠數據的樣本數,第13個受試只有一夜的數據,因此樣本數較少。

表1 原睡眠數據各子類樣本比例Tab.1 Ratio of samples for each sleep state of original data

表2 處理后睡眠數據各子類樣本比例Tab.2 Ratio of samples for each sleep state after pre-processing

表3 每個受試睡眠數據樣本數Tab.3 The number of samples of each subject
1.2數據處理
在本文中只選用了Pz-Oz通道的信號,圖1展示了Pz-Oz通道6個睡眠階段的時域圖。圖2中展示了與圖1的6個睡眠階段對應的0.5~25 Hz的頻域圖。經過計算可得,清醒狀態能量比較高,S1狀態信號能量下降,從S1狀態一直到S4狀態,信號能量越來越高,而從S4狀態到REM狀態,信號的能量有所下降。不同狀態下,信號的能量不同。由于各個睡眠狀態的主要體現在頻域上,因此我們首先對原始時域數據進行了快速傅里葉變換(FFT),然后取0.5~35 Hz之間的頻域數據,最后進行數據歸一化,得到的數據就是即將用于訓練DBN的頻域數據。

圖1 EEG通道6個睡眠階段的時域信號圖Fig.1 Timedomain signal of EEG channel of 6 sleep stages

圖2 EEG通道6個睡眠階段的頻域信號圖Fig.2 Frequency domain signal of EEG channel of 6 sleep stages
DBN是由多層網絡組成的的概率生成模型,每層包括一個限制玻爾茲曼機(RBM),其中DBN無監督訓練的過程是通過逐層訓練RBM來實現的。RBM限制型玻爾茲曼機,是由一個顯示層(v)和一個隱層來(h)組成的,如圖3所示為一個RBM,同一層之間的單元之間沒有連接,也就是說顯層各單元之間沒有連接,隱層個各單元之間也沒有連接,但是不在同一層(也就是顯層和隱層)的單元之間通過一個權重矩陣W連接。DBN包括多個RBM,如圖4展示了一個典型的DBN模型,上一個RBM的輸出是下一個RBM輸入,逐層來訓練RBM,直到所有的RBM訓練完。所有的RBM連接在一起,頂層是標簽層。無監督的預訓練完成后,通過微調就可以完成DBN的訓練過程。總結來說,DBN訓練過程包括:無監督的預訓練,無監督的微調過程和有監督的微調過程。
3.1方法
在本文中我們每次選用19個受試的睡眠數據作為訓練集,剩下的一個受試的數據作為測試數據,這樣可以得到每個受試睡眠數據的分類情況,同時我們還可以得到歌手是之間的睡眠數據之間的差異情況。我們使用的DBN網絡共有5層,一個輸入層,3個隱層和一個輸出層,各個隱層單元數為500-200-100。首先,選擇出訓練集和測試集,然后分別隨機化樣本的順序,將訓練集分成包含50個樣本的小批量數據進行訓練,預訓練階段的參數設置:epoch=10,minibachsize= 1 000。預訓練完成后,對整個DBN網絡進行無監督的微調和有監督的微調,這個過程epoch=30。此時完成了整個訓練過程,得到了DBN模型,最后就可以得到預測結果。
3.2結果
DBN分類結果見表4和圖5,從圖中可以看出,不同受試之間的準確率還是一定的差異的,這也間接提現了人與人之間睡眠的差異性,大部分受試的平均準確率在80%—95%之間,也說明DBN具有一定的穩定性。表4顯示,所有受試的預測準確率均高于70%,最低為72.80%,最高為89.23%。DBN模型預測的平均準確率為82.26%。

圖3 RBM結構圖Fig.3 The structure of RBM

圖4 DBN結構圖Fig.4 The structure of DBN

表4 分類準確率Tab.4 Classification accuracy

圖5 分類準確率柱狀圖Fig.5 Histogram of classification accuracy

表5 DBN分類結果的混淆矩陣Tab.5 Confusion matrix for DBN
表5展示了DBN分類結果的混淆矩陣,從表中可以看出AWAKE,S2和REM狀態的分類準確率比較高,相對來說,S4的分類準確率為69.75%,但是S1和S3這兩個狀態的分類準確率卻比較低。其中AWAKE、S2和REM狀態最容易區分,大多能夠預測準確說明EEG信號中存有這3個狀態的信息,而相對來說 S1、S3、S4容易和其他睡眠狀態混淆。S1
容易錯分到REM狀態和S1狀態,S3容易錯分到S2狀態和S4狀態,S4有部分錯分到S2和S3狀態。這說明各睡眠狀態之間的分界不是很明顯,在EEG信號中有相似特征的存在這就使得一些睡眠狀態不容易區分出來。
通過前文的結果分析,說明DBN能夠很好地提取到睡眠數據的特征,這個結果和淺層網絡中經過特征提取后得到的結果是可以相比較的,但是本文中的方法不用經過手動的特征提取,直接將得到頻域數據放到網絡中,最大的優勢就是省去了手動進行特征提取的步驟,這對于剛剛開始對睡眠數據進行研究的人來說是有很大的益處的。
[1]Breslau N,Roth T,Rosenthal L,et al.Sleep disturbance and psychiatric disorders:a longitudinal epidemiological study of young adults[J].Biological psychiatry,1996,39(6):411-418.
[2]Thorpy M J.Approach to the patient with a sleep complaint [C]//Seminars in neurology.2004,24(3):225-235.
[3]Lockley S W,Barger L K,Ayas N T,et al.Effects of health care provider work hours and sleep deprivation on safety andperformance[J].Joint Commission Journal on Quality and Patient Safety,2007,33(Supplement 1):7-18.
[4]Rechtschaffen A,Kales A.A manual of standardized terminology,techniques and scoring system for sleep stages of human subjects[S].1968.
[5]Hinton G E.Learning distributed representations of concepts [C]//Proceedings of the eighth annual conference of the cognitive science society,1986(1):12.
[6]Hinton G,Osindero S,Teh Y W.A fast learning algorithm for deep belief nets[J].Neural computation,2006,18(7):1527-1554.
[7]Li K,Li X,Zhang Y,et al.Affective state recognition from EEG with deep belief networks[C]//Proceedings of the IEEE International Conference on Bioinformatics and Biomedicine. 2013.
[8]Wulsin D,Blanco J,Mani R,et al.Semi-supervised anomaly detection for EEG waveforms using deep belief nets[C]// Machine Learning and Applications(ICMLA),2010 Ninth International Conference on.IEEE,2010:436-441.
Sleep classification based on EEG
LI Qian-yun,XIA Bin
(Shanghai Maritime University,Shanghai 201306,China)
The research of sleeping is important for our people′s healthy,work and life.Labeling different stages of sleep data is the basic job in the study of sleep.In this paper,we used a single channel of EEG,and put the data into the deep brief networks to represent features and do the classification,the average accuracy is 82.86%based on 39 datasets.
sleeping;deep learning;EEG;DBN
TN0
A
1674-6236(2016)05-0026-03
2015-04-20稿件編號:201504229
上海海事大學基金支持(20120067)
李倩云(1989—),女,河北安國人,碩士。研究方向:信號與信息處理。