尹濤 何昭璇 蘭蕾 曾芳
摘要 在中國“腦科學計劃”的背景下,基于機器學習和神經(jīng)影像表征的分類預(yù)測研究方興未艾。針對針灸療效預(yù)測的研究也已經(jīng)起步,必將成為針灸腦科學研究的重要前沿。本文試從機器學習在神經(jīng)影像學研究中的應(yīng)用概況、基于神經(jīng)影像表征的針灸療效預(yù)測研究現(xiàn)狀和未來研究的建議3個方面進行簡要評述,以期為基于機器學習與神經(jīng)影像表征的針灸療效預(yù)測研究提供參考與借鑒。
關(guān)鍵詞 機器學習;神經(jīng)影像;針灸;療效預(yù)測;支持向量機;人工智能
Abstract In the context of China Brain Project,research on classification and prediction based on machine learning and neuroimaging properties is in the ascendant.The study on the prediction of acupuncture efficacy is just starting,and it will become an important frontier of acupuncture and brain science research.This paper attempted to briefly review the application of machine learning in neuroimaging research and the current status of prediction for acupuncture efficacy based on neuroimaging properties,with a view to providing reference for the research on the prediction of acupuncture efficacy based on machine learning and neuroimaging.
Keywords Machine learning; Neuroimaging; Acupuncture; Efficacy prediction; Support vector machine; Artificial intelligence
中圖分類號:R2-03;R246文獻標識碼:Adoi:10.3969/j.issn.1673-7202.2020.11.007
以機器學習為代表的人工智能在醫(yī)療領(lǐng)域廣泛應(yīng)用,為實現(xiàn)客觀精準辨別個體差異,輔助醫(yī)生制定臨床決策提供了技術(shù)支撐。近年來,機器學習在中醫(yī)藥領(lǐng)域中的運用也在逐步開展,其中利用機器學習算法,基于神經(jīng)影像數(shù)據(jù)預(yù)測針灸療效,篩選和評價針灸治療的適宜人群引起了研究者的極大興趣。本文試從機器學習在神經(jīng)影像學研究中的應(yīng)用概況、基于神經(jīng)影像表征的針灸療效預(yù)測研究現(xiàn)狀和展望3個方面進行簡要評述,以期為基于機器學習與神經(jīng)影像表征的針灸療效預(yù)測研究提供參考與借鑒。
1 機器學習在神經(jīng)影像學研究中的應(yīng)用概況
機器學習是通過算法,學習經(jīng)驗以改善系統(tǒng)性能的一門學科[1]。利用機器學習算法,計算機可以對現(xiàn)有知識進行結(jié)構(gòu)劃分,并從大量繁雜的數(shù)據(jù)中自動分析獲得規(guī)律,訓練模型,而后使用訓練好的模型對未知個體數(shù)據(jù)進行分析預(yù)測[2]。2019年《Nature Medicine》人工智能專刊系列研究表明,利用機器學習和人工智能技術(shù)輔助臨床醫(yī)生診療可以顯著提高臨床工作效率,產(chǎn)生1+1>2的協(xié)同效應(yīng)[3]。根據(jù)算法的復(fù)雜程度不同,機器學習可劃分為傳統(tǒng)機器學習和深度學習。其中傳統(tǒng)機器學習包括支持向量機、隨機森林、決策樹、樸素貝葉斯等算法,這類算法具有模型簡單、可解釋性強、易于提取特征、小樣本結(jié)果穩(wěn)定的優(yōu)點。而深度學習是近年來機器學習研究領(lǐng)域的熱點,其模型主要包括卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)和生成對抗網(wǎng)絡(luò)等[4]。相較于傳統(tǒng)機器學習算法,深度學習模型更加復(fù)雜,它可以基于深層構(gòu)架進行分層學習,解決很多傳統(tǒng)機器學習不能較好解決的問題,被廣泛應(yīng)用于模式識別、信號處理等領(lǐng)域。
自2001年Haxby等[5]開創(chuàng)性地進行了第一項基于功能磁共振成像數(shù)據(jù)的多變量模式分析研究以來,神經(jīng)影像和機器學習結(jié)合的研究逐年增多,也促使了神經(jīng)影像研究由傳統(tǒng)的組水平分析模式向個體水平轉(zhuǎn)換。研究者以高維神經(jīng)影像表征作為輸入特征,基于機器學習算法建立起了針對多種疾病的分類和診斷模型,實現(xiàn)了個體水平相對精準的疾病診斷[6-8]。此外,神經(jīng)影像和機器學習結(jié)合的研究方法還被應(yīng)用于個體疾病預(yù)后及療效預(yù)測研究中。研究者使用支持向量機、隨機森林、卷積神經(jīng)網(wǎng)絡(luò)等算法,開展了大量基于神經(jīng)影像標志物的療效預(yù)測研究[9-12]。這些研究結(jié)果表明,患者基線期的特定神經(jīng)影像表征可以為預(yù)測干預(yù)后臨床癥狀的變化提供重要信息。如Redlich等[9]以前扣帶皮層灰質(zhì)體積為特征,采用支持向量回歸算法成功實現(xiàn)了從個體水平預(yù)測電驚厥療法改善重型抑郁的臨床療效,為精準篩選對電驚厥療法敏感的重性抑郁患者提供了客觀證據(jù)。而Cash等[11]的研究則表明,靜息狀態(tài)下默認網(wǎng)絡(luò)和情感網(wǎng)絡(luò)之間的功能連接可以作為支持向量機識別對經(jīng)顱磁刺激敏感的重型抑郁患者的重要神經(jīng)影像標志物。
2 基于神經(jīng)影像表征的針灸療效預(yù)測研究
針灸是獨具特色的傳統(tǒng)中醫(yī)外治法,也是世界范圍內(nèi)運用最為廣泛的補充替代療法,它通過刺激機體穴位和特定部位以激發(fā)經(jīng)氣、調(diào)理臟腑、平衡陰陽、糾正機體失衡狀態(tài)而發(fā)揮治療作用。患者的機體狀態(tài)是影響針灸方法選擇和治療效應(yīng)的重要因素。因此,察色按脈、分別陰陽、明辨機體狀態(tài)以恰當?shù)剡x穴施術(shù)是針灸臨床治療的前提,也是提高針灸療效的關(guān)鍵。然而,由于疾病臨床表現(xiàn)的模糊性、傳統(tǒng)四診資料的主觀性和醫(yī)生辨證的經(jīng)驗性,有可能造成醫(yī)生對于患者機體狀態(tài)的把握和治療方法的選擇存在偏差,進而影響針灸療效的取得。因此,客觀、精確地辨別機體狀態(tài)特征,拓展醫(yī)生的判斷視野,輔助醫(yī)生制定適宜的治療策略對于提高針灸臨床療效具有重要價值。
針灸作為一種外源性的物理刺激,中樞整合是實現(xiàn)其臨床療效的關(guān)鍵。自上世紀90年代以來,基于神經(jīng)影像技術(shù)的針灸中樞機制研究廣泛開展,迄今為止,有近400篇中文和200余篇英文針灸神經(jīng)影像研究論文發(fā)表。針灸影像學也逐漸發(fā)展成為一門新興的交叉學科[13]。受到經(jīng)顱磁刺激等物理療法療效預(yù)測研究的啟發(fā),近年來開始有研究嘗試融合機器學習與神經(jīng)影像表征開展針灸療效預(yù)測,并取得了較好的預(yù)測效果。如Liu等[14]在2018年發(fā)表了第1篇基于白質(zhì)微結(jié)構(gòu)的安慰針刺治療偏頭痛療效預(yù)測研究,在該研究中,作者使用了纖維示蹤技術(shù)提取了偏頭痛患者內(nèi)側(cè)前額葉與杏仁核之間白質(zhì)纖維微結(jié)構(gòu)參數(shù),并將其作為療效預(yù)測模型的輸入特征,而后使用一般線性核函數(shù)支持向量機和留一交叉驗證法,較為準確地預(yù)測了8周假針刺治療后偏頭痛患者的應(yīng)答程度,總體識別正確率超過84%。而Tu等[15]在近期的一項研究中,使用了基線期默認網(wǎng)絡(luò)、凸顯網(wǎng)絡(luò)、執(zhí)行控制網(wǎng)絡(luò)和感覺運動網(wǎng)絡(luò)網(wǎng)絡(luò)內(nèi)部及網(wǎng)絡(luò)間的靜息態(tài)功能連接作為識別特征,采用基于徑向基核函數(shù)的支持向量回歸算法,結(jié)合網(wǎng)格參數(shù)尋優(yōu),構(gòu)建回歸模型預(yù)測真假針刺治療4周后慢性下腰痛患者的疼痛緩解,結(jié)果發(fā)現(xiàn)內(nèi)側(cè)前額葉和腦島、殼核、尾狀核之間的功能連接可以有效預(yù)測患者針刺治療后的疼痛緩解,而內(nèi)側(cè)前額葉和背側(cè)前扣帶回、頂上小葉之間的功能連接則對預(yù)測假針刺治療效果具有較大貢獻。本團隊近期也開展了一項基于靜息態(tài)功能腦網(wǎng)絡(luò)的針刺治療功能性消化不良應(yīng)答程度預(yù)測研究[16]。在該研究中,基線期全腦116個腦區(qū)之間的功能連接被選擇為輸入特征,并使用顯著差異連邊遞增的方法進行特征篩選,而后基于一般線性核函數(shù)支持向量機,預(yù)測針刺治療4周后功能性消化不良患者對針刺治療的響應(yīng)程度,取得了84.9%的總體分類正確率,并提取出右腦島-左楔前葉、左中部眶額回-左丘腦、左腦島-左前扣帶回等多條連邊作為區(qū)別針刺高低響應(yīng)功能性消化不良患者的重要識別特征。除以上三項基于支持向量機的療效預(yù)測研究以外,早期研究者[17]還嘗試過基于模糊神經(jīng)網(wǎng)絡(luò),使用腦電雙頻指數(shù)改變、末梢灌注指數(shù)等腦電圖參數(shù)作為輸入特征,預(yù)測即時電針刺激過程中疼痛相關(guān)物質(zhì)β-內(nèi)啡肽改變,結(jié)果發(fā)現(xiàn)預(yù)測值和實測值高度一致,間接提示使用腦電圖數(shù)據(jù)預(yù)測針刺鎮(zhèn)痛效應(yīng)的可行性。
以上研究初步證實了機器學習和神經(jīng)影像表征結(jié)合開展針灸療效預(yù)測的可行性和有效性,進一步促進了針灸神經(jīng)影像學研究由傳統(tǒng)的單變量、組水平向多變量、個體水平發(fā)展,也為針灸腦科學研究領(lǐng)域開辟了新的研究方向。
3 優(yōu)化研究設(shè)計促進針灸療效預(yù)測研究水平的提升
當前基于機器學習和神經(jīng)影像表征的針灸療效預(yù)測研究尚處于起步和探索階段,還有諸多問題亟待解決。結(jié)合當前神經(jīng)影像和機器學習領(lǐng)域研究前沿,本文從樣本量、特征選擇、模型選擇以及模型評價4個方面對后續(xù)研究提出如下建議:
第一,增加樣本量以提高研究結(jié)果的穩(wěn)定性和可重復(fù)性。一方面,研究結(jié)果可重復(fù)性低是制約當前神經(jīng)影像學研究成果向臨床轉(zhuǎn)化的重要瓶頸,增加樣本量,降低樣本間異質(zhì)性是提高神經(jīng)影像研究結(jié)果穩(wěn)定性和可靠性的有效手段。另一方面,機器學習,尤其是深度學習模型的穩(wěn)定性和泛化能力也受到訓練集數(shù)據(jù)多少的顯著影響,增加訓練樣本以幫助計算機找到更為穩(wěn)健的識別特征,是提高模型預(yù)測性能的可靠方法。因此,在開展基于機器學習和神經(jīng)影像表征結(jié)合的針灸療效預(yù)測研究時,應(yīng)當特別重視樣本量的問題。本團隊前期的文獻研究[18]結(jié)果提示,截至2014年,基于神經(jīng)影像學的針灸中樞機制研究平均單組樣本量為15例,這和Chen等[19]提出的神經(jīng)影像學研究單組樣本量應(yīng)當大于40例以保證研究結(jié)果的穩(wěn)健性和可靠性還有很大的差距。而Scheinost等[20]的研究則認為,當訓練樣本數(shù)大于200,基于神經(jīng)影像表征的預(yù)測研究結(jié)果才能維持在相對高的穩(wěn)定狀態(tài),而之前的幾項預(yù)測研究中樣本量最大為94例,均未能達到該要求,相關(guān)研究結(jié)果有待在更大樣本中重復(fù)。
第二,重視預(yù)測特征的選擇以增強預(yù)測結(jié)果的準確性和可解釋性。單一模態(tài)神經(jīng)影像提供的信息相對有限,基于多模態(tài)影像表征建立的療效預(yù)測模型能夠更加精準地捕獲大腦與臨床特征之間的關(guān)聯(lián),以取得更好的分類或者預(yù)測效果。多項研究[8,21-22]結(jié)果提示,以多模態(tài)神經(jīng)影像表征為輸入特征可以取得較單一模態(tài)更高的分類準確率和更好的預(yù)測性能。近3年來,國家自然科學基金委資助了多項基于神經(jīng)影像表征的針灸療效預(yù)測研究,從這些研究題目中不難看出,多模態(tài)神經(jīng)影像表征融合以及神經(jīng)影像表征與疾病特異性臨床表征的融合將是以后針灸療效預(yù)測研究特征選擇的重要發(fā)展方向。除多模態(tài)融合以外,對于神經(jīng)影像表征的選擇還應(yīng)當具有目的性,即根據(jù)明確的先驗假設(shè)選擇適當?shù)念A(yù)測特征。相較于數(shù)據(jù)驅(qū)動的特征選擇方法,以先驗假設(shè)為導(dǎo)向,選擇特定感興趣特征開展的療效預(yù)測研究結(jié)果具有更高的可解釋性,其邏輯鏈也更加嚴密。同時,由于排除了其他冗余特征的干擾,基于目的驅(qū)動選擇特征構(gòu)建的模型一般具有更好的預(yù)測性能。而在選擇臨床表征作為療效預(yù)測特征時,還應(yīng)該充分體現(xiàn)中醫(yī)特色,將一些相對客觀可量化的中醫(yī)指標(如得氣量表評分)作為預(yù)測特征之一,以構(gòu)建更為契合針灸臨床實際的療效預(yù)測模型。
第三,選擇合適的預(yù)測模型以提高模型的魯棒性和泛化能力。一般而言,復(fù)雜程度越高的模型,在訓練樣本中表現(xiàn)出的性能越好,但同時也更容易出現(xiàn)過擬合現(xiàn)象,導(dǎo)致在其他未知樣本中泛化能力下降。相較于深度學習算法,支持向量機等傳統(tǒng)機器學習算法在樣本量較小的情況下可以表現(xiàn)出更強的泛化能力。Davatzikos等[23]開展的一項基于灰質(zhì)體積預(yù)測被試年齡的研究認為,使用一般線性核函數(shù)支持向量回歸算法取得的預(yù)測結(jié)果顯著優(yōu)于多層人工神經(jīng)網(wǎng)絡(luò),提示在解決線性可分問題時,傳統(tǒng)機器學習算法可能更加合適。不同于一般的模式識別研究只重視識別結(jié)果的準確性,基于神經(jīng)影像表征建立療效預(yù)測模型的最終目標還包括確定神經(jīng)影像表征與臨床指標之間的潛在關(guān)聯(lián),挖掘重要的識別或預(yù)測特征。因此,在選擇算法構(gòu)建預(yù)測模型的時候,還應(yīng)該注意模型是否會影響預(yù)測結(jié)果到預(yù)測特征映射的建立。通過深度學習算法建立的預(yù)測模型可能具有更好的預(yù)測性能,但由于其普遍存在的黑箱現(xiàn)象,預(yù)測結(jié)果很難映射到具體影像表征上[24]。相比之下,支持向量機、隨機森林等傳統(tǒng)機器學習算法可以更加清晰地構(gòu)建預(yù)測結(jié)果和預(yù)測特征之間的映射,最終為理解大腦特征與臨床指標之間的關(guān)聯(lián)提供更多的神經(jīng)生物學信息[25]。基于以上兩點原因,在使用較小樣本量構(gòu)建基于神經(jīng)影像表征的療效預(yù)測模型時,應(yīng)當優(yōu)先選擇支持向量機等傳統(tǒng)機器學習算法,以提高模型的預(yù)測性能和泛化能力。
最后,還應(yīng)當特別注意在新的獨立樣本中對預(yù)測結(jié)果進行驗證。為盡可能減少模型建立尤其是深度學習模型建立過程中由于神經(jīng)影像數(shù)據(jù)維度過高以及模型參數(shù)選擇等原因?qū)е碌哪P瓦^擬合現(xiàn)象,研究者普遍認為非常有必要在新的獨立樣本中對已有模型及結(jié)果進行驗證,進一步評價模型的泛化能力[20,26]。同樣,基于神經(jīng)影像表征構(gòu)建的針灸療效預(yù)測模型的泛化能力也應(yīng)當在完全獨立的樣本中進行驗證,并且獨立驗證集數(shù)據(jù)的選擇應(yīng)當根據(jù)研究目的和研究階段的不同有所側(cè)重。對于重點在明確影像表征和臨床指標關(guān)聯(lián)的研究,應(yīng)當盡可能選擇同一中心、同一掃描參數(shù)的異質(zhì)性相對較小的被試構(gòu)建獨立驗證集;而對于以臨床應(yīng)用為主要目標的預(yù)測研究,則應(yīng)該選擇來自不同中心的被試進行獨立驗證,以更大程度地評價模型的泛化能力。
4 小結(jié)
綜上所述,盡管基于機器學習和神經(jīng)影像表征的針灸療效預(yù)測研究尚處于探索階段,但已有的研究已經(jīng)初步證明其可行性和有效性,該研究方向必將成為針灸腦科學研究的前沿。基于前期的研究經(jīng)驗和相關(guān)學科發(fā)展趨勢,今后的研究應(yīng)當進一步增加樣本量,同時注重特征的選擇,綜合使用多模態(tài)神經(jīng)影像表征、疾病特異性臨床表征以及可量化的中醫(yī)學指標為特征建立療效預(yù)測模型,并做好預(yù)測結(jié)果的獨立驗證,以提高模型的預(yù)測性能和泛化能力。
參考文獻
[1]周志華.機器學習[M].北京:清華大學出版社,2016:10-13.
[2]Deo R C.Machine Learning in Medicine[J].Circulation,2015,132(20):1920-1930.
[3]He J,Baxter S L,Xu J,et al.The practical implementation of artificial intelligence technologies in medicine[J].Nature Medicine,2019,25(1):30-36.
[4]田啟川,王滿麗.深度學習算法研究進展[J].計算機工程與應(yīng)用,2019,55(22):25-33.
[5]Haxby J V,Gobbini M I,F(xiàn)urey M L,et al.Distributed and overlapping representations of faces and objects in ventral temporal cortex[J].Science,2001,293(5539):2425-2430.
[6]Walter M,Alizadeh S,Jamalabadi H,et al.Translational machine learning for psychiatric neuroimaging[J].Prog Neuropsychopharmacol Biol Psychiatry,2019,91:113-121.
[7]Jollans L,Boyle R,Artiges E,et al.Quantifying performance of machine learning methods for neuroimaging data[J].Neuroimage,2019,199:351-365.
[8]Ahmed M R,Zhang Y,F(xiàn)eng Z,et al.Neuroimaging and Machine Learning for Dementia Diagnosis:Recent Advancements and Future Prospects[J].IEEE Rev Biomed Eng,2019,12:19-33.
[9]Redlich R,Opel N,Grotegerd D,et al.Prediction of Individual Response to Electroconvulsive Therapy via Machine Learning on Structural Magnetic Resonance Imaging Data[J].JAMA Psychiatry,2016,73(6):557-564.
[10]Tetreault P,Mansour A,Vachon-presseau E,et al.Brain Connectivity Predicts Placebo Response across Chronic Pain Clinical Trials[J].PLoS Biol,2016,14(10):e1002570.
[11]Cash R F H,Cocchi L,Anderson R,et al.A multivariate neuroimaging biomarker of individual outcome to transcranial magnetic stimulation in depression[J].Human Brain Mapping,2019,40(16):4618-4629.
[12]Tian S,Sun Y,Shao J,et al.Predicting escitalopram monotherapy response in depression:The role of anterior cingulate cortex[J].Human Brain Mapping,2020,41(5):1249-1260.
[13]許能貴,方繼良.針灸影像學[M].北京:人民衛(wèi)生出版社,2018:3-4.
[14]Liu J,Mu J,Chen T,et al.White matter tract microstructure of the mPFC-amygdala predicts interindividual differences in placebo response related to treatment in migraine patients[J].Hum Brain Mapp,2019,40(1):284-292.
[15]Tu Y,Ortiz A,Gollub R L,et al.Multivariate resting-state functional connectivity predicts responses to real and sham acupuncture treatment in chronic low back pain[J].Neuroimage Clin,2019,23:101885.
[16]尹濤,孫睿睿,何昭璇,等.基于靜息態(tài)功能腦網(wǎng)絡(luò)預(yù)測針刺治療功能性消化不良臨床療效[J].中華中醫(yī)藥雜志,2020,35(5):18-21.
[17]郝旺身,朱訓生,王祥瑞,等.模糊神經(jīng)網(wǎng)絡(luò)預(yù)測電針鎮(zhèn)痛中生化指標的變化[J].上海交通大學學報,2008,42(2):177-180.
[18]Qiu K,Jing M,Sun R,et al.The Status of the Quality Control in Acupuncture-Neuroimaging Studies[J].Evidence-based complementary and alternative medicine:eCAM,2016,2016:3685785.
[19]Chen X,Lu B,Yan C-G.Reproducibility of R-fMRI metrics on the impact of different strategies for multiple comparison correction and sample sizes[J].Human Brain Mapping,2018,39(1):300-318.
[20]Scheinost D,Noble S,Horien C,et al.Ten simple rules for predictive modeling of individual differences in neuroimaging[J].NeuroImage,2019,193:35-45.
[21]Nicholson A A,Densmore M,Mckinnon M C,et al.Machine learning multivariate pattern analysis predicts classification of posttraumatic stress disorder and its dissociative subtype:a multimodal neuroimaging approach[J].Psychol Med,2019,49(12):2049-2059.
[22]Lee J,Mawla I,Kim J,et al.Machine learning-based prediction of clinical pain using multimodal neuroimaging and autonomic metrics[J].Pain,2019,160(3):550-560.
[23]Davatzikos C.Machine learning in neuroimaging:Progress and challenges[J].NeuroImage,2019,197:652-656.
[24]Lecun Y,Bengio Y,Hinton G.Deep learning[J].Nature,2015,521(7553):436-444.
[25]Shen X,F(xiàn)inn E S,Scheinost D,et al.Using connectome-based predictive modeling to predict individual behavior from brain connectivity[J].Nature Protocols,2017,12(3):506-518.
[26]Tu Y,Zeng F,Lan L,et al.An fMRI-based neural marker for migraine without aura[J].Neurology,2020,94(7):e741-e751.
(2020-05-10收稿 責任編輯:徐穎)