999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

概率校準方法的腦電信號分類算法研究

2023-05-20 08:22:23丁勝吳全玉孫健潘玲佼陶為戈
赤峰學院學報·自然科學版 2023年4期

丁勝 吳全玉 孫健 潘玲佼 陶為戈

摘 要:腦機接口技術是很多學科融合的前沿研究方向,腦電信號分類的準確率是限制腦機接口系統實現的難題之一。針對腦電信號分類準確性問題,采用兩種概率校準方法Platt Scaling和Isotonic Regression。首先對預處理后的運動想象腦電數據利用功率譜密度提取腦電頻域特征,使用主成分分析算法進行特征降維。其次選擇邏輯回歸和支持向量機構建分類預測模型,使用上述兩種概率校準方法進行模型校準。最后,選用ROC曲線下的面積AUC、Brier得分和可靠性曲線評估校準模型的性能,并且繪制交叉驗證學習曲線,觀察模型在不同數據量下的擬合效果,以及模型的泛化能力。在BCI競賽IV Datasets 2a腦電數據集上進行實驗驗證,結果表明,概率校準的方法能夠對模型預測輸出結果進行有效校準。

關鍵詞:運動想象;概率校準;功率譜密度;邏輯回歸;支持向量機

中圖分類號:TP18;TP301.6? 文獻標識碼:A? 文章編號:1673-260X(2023)04-0011-05

1 引言

腦機接口(Brain-Computer Interface,BCI)是一種不利用外周神經和肌肉,由大腦完成控制命令輸出的與外界進行通訊的新方式[1,2],已在神經康復、生物醫學及生活娛樂等領域被廣泛研究。運動想象(Motor Imagery, MI)是BCI中的一個重要實驗范式,這是一種特殊的心理表象類型[3,4],人進行運動想象,通過BCI可以實現單獨操縱設備[5]。然而腦電信號(Electroencephalogram,EEG)具有復雜,時變,非線性等特點[6],使得挖掘到有效地腦電信號存在很大的困難,因此,研究如何利用算法對腦電信號進行準確分類顯得非常重要[7]。

經典的機器學習算法發展時間長,且具有成熟的數學理論基礎,常被用于運動想象腦電信號的分類。許多研究學者對腦電信號分類算法進行一些改進。Shi等[8]采用改進的松鼠搜索算法優化支持向量機的參數,提高了模型的分類精度。Miao等[9]在樸素貝葉斯(Naive Bayesian,NB)基礎上提出加權樸素貝葉斯(Weighted NB,WNB),對多個時頻特征進行加權,得到不錯的分類結果。

然而許多分類算法的預測輸出值并不是真正的概率輸出,即具有一定的偏差[10],在實際應用場景中可能會導致一些嚴重的后果。例如支持向量機(Support Vector Machines,SVM)算法,先尋找讓邊際最大的決策邊界,然后計算測試樣本點到決策邊界的距離來判定該樣本屬于哪一類,但是大部分樣本點都徘徊在決策邊界附近,模型很容易做出錯誤的判斷,只有離決策邊界較遠的樣本才有很高的置信度,所以說SVM是一個“極度不自信”的算法。即使是NB這種真正的概率算法,也會存在有偏的預測。NB產生的分數通常太過極端[11],概率分布存在兩邊高,中間低的現象。因此NB模型無法產生準確的概率估計[12],是一個“過分自信”的算法。特別當測試樣本的特征之間并不是條件獨立時,樸素貝葉斯分類器輸出的概率估計也是存在偏差的。

概率校準的方法可以將有偏差的概率輸出結果進行校準。概率校準是指尋找一個校準函數,將初始預測映射為更加精確的后驗概率[13]。使用概率校準的方法不僅將非概率分類器的輸出轉化為概率類型,而且也對概率分類器的結果進一步提升[14]。目前比較可靠的兩個概率校準方法為Platt Scaling[15]和Isotonic Regression[16]。

本文選擇支持向量機和邏輯回歸(Logistic Regression,LR)作為預測模型,引入上述兩種概率校準的方法,將模型在第四屆BCI競賽2a數據集上進行驗證,結果顯示,概率校準后的模型比原始模型有更好的表現。

2 數據集和方法

2.1 數據集

試驗數據來源于2008年第四屆國際BCI競賽Datasets 2a數據集[17]。該數據集一共記錄了9名受試者(A01,A02,A03,A04,A05,A06,A07,A08,A09)關于左手、右手、雙腳和舌頭四種不同的運動想象任務,每名受試者在不同的日期記錄兩次實驗。本文只對左右手兩類任務進行分類,每個受試者的數據由兩個部分組成,一部分用于訓練,另一部分用于測試,每個部分都包含了144次試驗,每次試驗持續7.5秒。所有數據均是通過分布在頭部的25個Ag/AgCl電極記錄的,采樣頻率為250Hz,并對采集EEG信號進行0.5Hz-100Hz帶通濾波。具體細節參考https://www.bbci.de/competition/iv/。

2.2 預處理

為了更有效地提取腦電信號特征,先對原始腦電數據進行預處理。本文選用Python語言,在集成開發環境PyCharm中進行編程,利用MNE工具箱對腦電信號預處理,受試者A03原始的腦電信號如圖1所示。該數據集包含3個眼電偽跡的通道,刪除這三個無用通道。與MI有關的頻率主要集中在α節律(8~13Hz)和β節律(14~30Hz)[18],因此對腦電信號進行8-30Hz的帶通濾波。濾波后不僅方便選擇后續工作所需要的有效頻段,而且可以減輕高頻干擾與工頻噪聲[19]。腦電信號中摻雜著各種生理偽跡[20],調用MNE工具箱中內置的獨立成分分析(Independent Component Analysis,ICA)算法進行去噪處理。

2.3 特征提取與降維

2.3.1 特征提取

對預處理后的腦電信號使用功率譜密度(Power Spectral Density,PSD)提取反映受試者意圖的頻域信號特征,受試者A03的腦電數據經帶通濾波后的功率譜密度如圖2所示。計算對應頻率段的曲線下面積作為腦電信號在該頻段的能量值。對每名受試者的22個通道分別計算Alpha(8-13Hz),Beta1(14-20Hz),Beta2(21-28Hz)三個頻段的腦電信號功率,共提取66維腦電特征。

2.3.2 特征降維

提取到的腦電特征包含許多冗余信息,會影響分類模型的識別準確率,使用主成分分析(Principal Component Analysis,PCA)算法降維。PCA通過矩陣分解將高維特征數據壓縮到少量特征上,并且信息量不會損失太多,形成新的含有大量有效信息的低維特征矩陣。

2.4 模參型數

精細調參可以提高分類器的準確率,使用學習曲線和網格搜索的方法確定SVM和LR模型的參數。SVM的核函數設為‘linear,選擇L2正則化防止模型過擬合,懲罰項系數C設為0.8,最大迭代次數max_iter為-1。LR模型選用L2正則化,C設為0.78,設置‘lbfgds作為目標損失函數的迭代優化算法。

2.5 概率校準

2.5.1 Platt Scaling

Platt Scaling是一種參數化校準方法,模型校準的過程實際上是在確定最優參數(a,b)。將分類器的預測輸出值通過Sigmoid函數進行轉換,將分類器的原始預測輸出值映射為較為準確的概率值,其范圍為(0,1)。假設輸入樣本為xi,分類器的預測輸出值為f(xi),則分類器最終輸出概率的計算公式為:

參數(a,b)通過極大似然估計的方法可求得:

其中,pi為校準后的概率,yi為輸入樣本的真實類別,pi用式(3)表示:

在實際應用中,為了防止分類器過度擬合,經常會使用下式給樣本正類y+和負類y-賦值:

其中,N+和N-分別是正負樣本的數量。

2.5.2 Isotonic Regression

Isotonic Regression是一種非參數校準的方法,假設分類器預測輸出值為yi,輸入樣本的標簽為Yi,則模型定義為:

其中,F為分類器預測輸出值yi和樣本真實值Yi之間擬合的單調遞增的函數,?著i為誤差。若給定數據集set(yi,Yi),則F可以通過式(7)求解:

式(6)的一種求解算法是PAV(Pool Adiacent Violators)[21],通過不斷更新違反函數單調性的局部區間,找到最終滿足單調性的區間。

3 評估方法與結果分析

3.1 評估方法

模型的評估是非常重要的一步,為了評估概率校準后模型的效果,本文采用了三種指標:布里爾分數(Brier Score),可靠性曲線(Reliability Curve),ROC曲線下面積AUC來評估概率校正后模型的效果。

3.1.1 布里爾分數

布里爾分數是一項衡量概率校準表現的標準指標,其計算方法為樣本真實值與概率預測之間的均方誤差。具體表達式如下:

其中,N是樣本數量,fi是分類器預測輸出值,yi是樣本的真實標簽。式(8)的范圍從0到1,衡量概率預測值和真實值的差異,布里爾分數越小,模型的預測精度越高。

3.1.2 可靠性曲線

可靠性曲線,又稱為概率校準曲線(Probability Calibration Curve),它是一種可視化的評估方法,可以直觀地看出模型在進行二分類任務時,其概率輸出與理論最優分類器預測的偏差程度,可以幫助我們了解模型的置信度。如果模型具有很好的置信度,那么可靠性曲線應該接近45度對角線。而如果模型的置信度有問題,可靠性曲線可能會出現明顯的偏差。

3.1.3 AUC

ROC(Receiver Operating Characteristic)曲線,又稱為感受性曲線,ROC曲線是一種以真陽性率為縱坐標,以假陽性率為橫坐標的二維曲線。模型的預測效果可以通過ROC曲線下面積AUC來進行評估,AUC值越大則模型的預測效果越好。通常,AUC值被用來衡量二分類模型的分類效果,其取值范圍在0到1之間。當AUC值越接近1時,模型的分類效果越好。

3.2 結果分析

表1展示了9名受試者采集的腦電信號在原始模型和概率校正后模型下的分類準確率。為了敘述方便,下文以‘模型+Platt、‘模型+Isotonic的方式命名校準后的模型。SVM、SVM+Platt、SVM+Isotonic、LR、LR+Platt和LR+Isotonic在9名受試者腦電數據上的平均準確率分別為70.96%、73.74%、72.18%、72.28%、74.78%和73.94%。可以看出經概率校準的分類器的準確率比原始分類器的準確率有所提高,且Platt概率校準方法在該數據集上比Isotonic概率校準方法更有優勢。

由于篇幅限制,本文只展示受試者A03的概率校準模型的可靠性曲線圖。如圖3所示,明顯看到經過概率校準的模型SVM+Platt、SVM+Isotonic、LR+Platt和LR+Isotonic都比未校準的模型更靠近對角線,模型效果更好。支持向量機模型的布里爾分數為0.140,經概率校準后SVM+Platt和SVM+Isotonic的布里爾分數分別為0.124,0.126;邏輯回歸模型的布里爾分數為0.130,經概率校準后LR+Platt和LR+Isotonic的布里爾分數分別為0.119, 0.120。校準的模型布里爾分數降低,說明模型的概率預測輸出與樣本真實標簽更接近,模型變得更加穩定可靠。

圖4展示了應用本文采用的概率校準方法后,SVM+Platt的AUC比原始SVM模型的AUC提高0.03,達到0.93;SVM+Isotonic的AUC略微遜色達到0.92。對于原始LR模型,模型本身效果就比較好,AUC為0.92;概率校準后,LR+Platt的AUC有所上升,達到0.93,而LR+Isotonic的AUC則與LR的AUC持平。

4 討論

本文對第四屆BCI競賽2a腦電數據集進行解碼,利用概率校準方法對模型的預測輸出進行再學習,模型準確率上升,達到實驗預期。概率校準并不是對所有的數據集都起作用,如表1中,受試者A07的腦電數據,經過兩種概率校準方法校準后,模型的準確率反而下降;對于受試者A09,經Platt方法校準,模型的準確率升高,經Isotonic方法校準,模型的準確率下降或持平。SVM+Platt、SVM+Isotonic、LR+Platt和LR+Isotonic四種校準模型在9名受試者的腦電數據上進行建模,平均準確率比原始模型分別提高2.78%,1.22%,2.50%,1.66%。通過調研文獻資料發現,Platt校準方法在數據量較少時會有更好的效果,因為Isotonic校準方法非常容易過擬合,當有足夠多的數據時,Isotonic方法會更有效。

通過繪制交叉驗證學習曲線觀察6種模型在受試者A03數據集上的表現情況。由于訓練數據集和測試數據集分別有144個,數據量偏少,選擇將兩組數據組合在一起,總共288個數據樣本,建立模型后,以每次訓練的不同的樣本數量為橫坐標,訓練分數和測試分數為縱坐標來繪制學習曲線,如圖5所示。從圖上可以看出,支持向量機和邏輯回歸模型在訓練數據量較小時都存在嚴重的過擬合現象,隨著樣本量的增大,模型過擬合的情況會得到緩解;概率校準后,有效地減輕了模型的過擬合情況。兩種概率校準后的模型測試準確率均高于原始模型的表現,達到85%以上,且經Platt方法校準的模型表現略勝一籌,說明Platt方法在數據集較少時的表現確實好于Isotonic方法。從圖上可以預見,采集更多的腦電數據用于訓練,兩種方法校準后模型的準確率會進一步提高。

本文的不足之處:第一,只提取腦電信號頻域特征,有效信息量過少,接下來工作會從時域、頻域、空域三種不同的角度提取腦電信號特征,然后進行特征融合,利用啟發式算法選擇特征。第二,經典單一分類器的表現效果或許不如多模型融合以及神經網絡模型,后續工作會進行驗證。

5 結束語

腦機接口技術改變了人們與外界的信息交互方式,在未來許多領域必定會大放異彩,腦電信號的解碼至關重要。本文對運動想象腦電信號使用PSD方法提取頻域特征,利用PCA技術降低特征維數,選擇SVM和LR兩種算法建立腦電信號分類預測模型,選用Platt、Isotonic兩種概率校準方法對模型有偏的輸出結果進行校準,兩種方法在本文數據集中多名受試者的腦電數據上均達到不錯的效果,且隨著數據量的增加,模型過擬合情況得到緩解,分類準確率也能進一步提高。

——————————

參考文獻:

〔1〕Kamhi S, Zhang S, Ait Amou M, et al. Multi-Classification of Motor Imagery EEG Signals Using Bayesian Optimization-Based Average Ensemble Approach[J]. Applied Sciences, 2022, 12(12): 5807.

〔2〕許冬萍,陳峰.基于改進小波變換和模糊熵的腦電信息研究[J].計算機仿真,2019,36(10):227-232.

〔3〕Yang Y J, Jeon E J, Kim J S, et al. Characterization of kinesthetic motor imagery compared with visual motor imageries[J]. Scientific Reports, 2021, 11(01): 1-11.

〔4〕田貴鑫,陳俊杰,丁鵬,等.腦機接口中運動想象的執行與能力的評估和提高方法[J].生物醫學工程學雜志,2021,38(03):434-446.

〔5〕劉拓, 葉陽陽,王坤,等.運動想象腦電信號分類算法的研究進展[J].生物醫學工程學雜志,2021, 38(05):995-1002.

〔6〕Li C, Chen M, Zhang L. A Domain Adaptation-Based Method for Classification of Motor Imagery EEG[J]. Mathematics, 2022, 10(09): 1588.

〔7〕魯杰,楊曉棟,彭靖宇,等.基于LSTM的運動想象腦電信號分類方法[J].電子設計工程,2021,29(04):88-92.

〔8〕Shi M, Wang C, Li X Z, et al. EEG signal classification based on SVM with improved squirrel search algorithm[J]. Biomedical Engineering/Biomedizinische? Technik, 2021, 66(02): 137-152.

〔9〕Miao M, Zeng H, Wang A, et al. Discriminative spatial-frequency-temporal feature extraction and classification of motor imagery EEG: An sparse regression and Weighted Na?觙ve Bayesian Classifier-based approach[J]. Journal of neuroscience methods, 2017, 278: 13-24.

〔10〕Niculescu-Mizil A, Caruana R. Predicting good probabilities with supervised learning[C]//Proceedings of the 22nd international conference on Machine learning. 2005: 625-632.

〔11〕Zadrozny B, Elkan C. Transforming classifier scores into accurate multiclass probability estimates[C]//Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining. 2002: 694-699.

〔12〕Zhong W, Kwok J T. Accurate probability calibration for multiple classifiers[C]//Twenty-Third International Joint Conference on Artificial Intelligence. 2013.

〔13〕范雙龍,趙志強,余紅梅,等.基于概率校準的彌漫性大B細胞淋巴瘤患者死亡風險預測[J].中國衛生統計,2021,38(05):670-674.

〔14〕肖瑤,謝貴才,朱兵.淺談分類問題中的概率校準[J].中國統計,2018,66(05):35-37.

〔15〕Platt J. Probabilistic outputs for support vector machines and comparisons to regularized likelihood methods[J]. Advances in large margin classifiers, 1999, 10(03): 61-74.

〔16〕Qin J, Garcia T P, Ma Y, et al. Combining isotonic regression and EM algorithm to predict genetic risk under monotonicity constraint[J]. The annals of applied statistics, 2014, 8(02): 1182.

〔17〕Naeem M, Brunner C, Leeb R, et al. Seperability of four-class motor imagery data using independent components analysis[J]. Journal of neural engineering, 2006, 3(03): 208-216.

〔18〕Tang Z, Li C, Sun S. Single-trial EEG classification of motor imagery using deep convolutional neural networks[J]. Optik, 2017, 130: 11-18.

〔19〕Daud S S, Sudirman R. Butterworth bandpass and stationary wavelet transform filter comparison for electroencephalography signal[C]//2015 6th international conference on intelligent systems, modelling and simulation. IEEE, 2015: 123-126.

〔20〕吳全玉,張文強,潘玲佼,等.一種結合自適應噪聲完備經驗模態分解和盲反卷積去除腦電中眼電偽跡的新方法[J].數據采集與處理,2020,35(04):720-729.

〔21〕Ayer M, Brunk H D, Ewing G M, et al. An empirical distribution function for sampling with incomplete information[J]. The annals of mathematical statistics, 1955: 641-647.

收稿日期:2023-02-11

通訊作者:吳全玉(1977-),男,漢族,安徽碭山人,副教授,碩士研究生導師。研究方向:嵌入式康復系統開發、醫學信號處理和血流動力學仿真。

基金項目:國家自然科學基金青年項目(62001196);江蘇省重點研發計劃(SBE2020648);常州市社會發展項目(CE20225045)

主站蜘蛛池模板: 免费一看一级毛片| 91青草视频| 国产精品区视频中文字幕| 中国特黄美女一级视频| www.91中文字幕| 在线观看国产精品第一区免费 | 国产原创自拍不卡第一页| 成人亚洲视频| 免费a级毛片视频| 一级全免费视频播放| 久久人人97超碰人人澡爱香蕉| 91福利免费| 亚洲久悠悠色悠在线播放| 99re精彩视频| 日本黄色不卡视频| 国产成人资源| 亚洲天堂伊人| 毛片三级在线观看| 亚洲无限乱码一二三四区| 国产欧美高清| 毛片免费在线视频| 久久精品国产亚洲麻豆| 欧美中文字幕无线码视频| 97亚洲色综久久精品| 亚洲中文字幕av无码区| 91精品专区| 国产亚洲精品自在线| 青青青视频蜜桃一区二区| 91精品国产情侣高潮露脸| 国产女人爽到高潮的免费视频| 一级香蕉视频在线观看| 日本免费一区视频| 超薄丝袜足j国产在线视频| 精品视频在线一区| 欧美色丁香| 欧美一区二区三区国产精品 | 九色国产在线| 欧美日韩在线国产| 国产在线专区| 影音先锋亚洲无码| 午夜国产理论| 久久国产免费观看| 亚洲男人天堂2020| 少妇精品网站| 国产理论最新国产精品视频| 国产性生大片免费观看性欧美| 亚洲精品综合一二三区在线| 自拍中文字幕| 亚洲VA中文字幕| 国产chinese男男gay视频网| 欧美国产中文| 色综合五月婷婷| 成人在线天堂| 免费视频在线2021入口| 欧美成人午夜视频免看| 日韩久久精品无码aV| 欧美日韩资源| 91精品啪在线观看国产| 99久久精品久久久久久婷婷| 亚洲国产av无码综合原创国产| 丰满人妻被猛烈进入无码| 国产乱视频网站| 欧美一区国产| 理论片一区| 久久国产V一级毛多内射| 国产凹凸视频在线观看| aⅴ免费在线观看| 亚洲一区二区黄色| 欧美午夜在线播放| 国语少妇高潮| 亚洲综合色在线| 国产精品第一区在线观看| av大片在线无码免费| 精品免费在线视频| 国产午夜看片| 日韩AV无码一区| 成人久久精品一区二区三区| 免费va国产在线观看| 国产一区二区丝袜高跟鞋| 国产黄网永久免费| 久久青草视频| 亚洲天堂色色人体|