昝道廣 梁肖裕 劉忠青 徐西彤 李晨輝 山東科技大學電氣信息系
人體大腦的結構、功能相當復雜,弄清大腦運轉的機制是人類面臨的挑戰之一。世界上各國都注入了大量的人力財力。例如,大腦研究計劃的啟動。關于大腦的科研成果一方面幫助人類了解大腦、開發大腦的潛能,另一方面對于阿爾茨海默病、帕金森氏癥等腦疾病的診斷和治療也做出了重大貢獻。近幾年來,科技飛速發展,現代成像技術如磁共振成像、正電子發射斷層掃描等成像技術已經能夠有效的對人腦進行探索,構建腦網絡分析。腦網絡分析方法已成為近年來腦影像研究中的熱點。腦網絡是和大腦連接的一種表示,分為結構性腦網絡和功能性腦網絡。當前,腦網絡的分析方法主要有2種:一是以特定假設為基礎驅動的群體測試;二是以機器學習為基礎的個體分類預測。第二種研究手段如多用于精神分裂癥、抑郁癥等疾病的治療。因為能夠自動分析數據而獲得規律,并預測未知數據進而尋找和疾病相關的生物標記,以機器學習為基礎的腦網絡分析方法已成為了研究上的熱點,引起了很多研究者的注意。
以機器學習為基礎的腦網絡分析過程有3個關鍵步驟:(1)腦網絡的構建,在數據中完成腦網絡結構的構建;(2)特征學習,在構建的腦網絡結構中學習生物標記的特征;(3)分類預測,即利用特征學習對未知的樣本數據進行預測和分類。
該步驟是第一步,是分析中的基礎步驟。腦網絡的構建分為結構性腦網絡連接和功能性腦網絡連接。結構性腦網絡連接是基于擴散頻譜成像建立的某種追蹤,把大腦區域連接成一個矩陣,直接對矩陣進行分析,主要依賴的是醫學的連接模式;而功能性腦網絡的構建主要是基于相關性、稀疏化的方法來刻畫腦區間的交互作用。構建時主要是時間序列的獲取,然后根據序列的相關性把大腦表示成被閾值化的連接網。
特征學習決定著腦網絡分析的成敗,特征學習的好壞會直接影響后續識別的性能,好的特征學習能夠對未知的樣本數據有著好的分析。腦網絡數據結構中能夠獲取的樣本個數少,因此包含著大量的低層次特征。為了解決問題,我們首先要從數據選擇上選取有意義的測量特征如最短路徑等。然后機器的特征學習時要選擇合適的算法過濾掉那些不重要、無意義的特征,只保留對分類和預測重要的特征。這樣,對疾病分類的精確度不僅有提高,還可以快速的尋找與疾病相關的標記,更好地對疾病進行診斷和治療。特征學習主要有兩種常見的方法,單一模態的學習和多模態的學習。
1.2.1 單一模態的特征學習方法
較為典型的是最近的一種拓撲結構的特征學習方法,他是依據圖形和計算腦網絡之間具有相似性,從而選擇出了既有局部測量性又有著拓撲結構信息的特征。實驗證明,這種方法提高學習能力,而且更容易對疾病敏感的腦區進行分類預測。
1.2.2 多模態特征學習
因為大腦的復雜性,僅用單一模態的方法中尋找生物標志是比較困難的,因此多模態特征學習是不可缺少的,他也為特征學習提供了新的方法。一方面為了精確診斷某種疾病,需要病人的多種模態的數據分析作參考;另一方面,多模態的學習方法在機器學習領域等領域被廣泛的應用。多模態特征學習的方法可以彌補以前僅利用單模態分析數據時的不足,更好的進行疾病病理的理解和分析。
分類預測是最后的步驟。腦網絡分析中包含著許多模式識別的分類方法。例如精神分裂癥、抑郁癥、自閉癥等腦科疾病。
腦網絡分析提供了探察腦疾病和腦的結構功能之間的關系的一個有效的工具,尋找一些主要的生物標志來幫助腦科疾病的診斷和治療。當前許多研究者已把腦網絡應用在了腦科疾病的分析治療中,而且取得了良好的效果。其中,機器學習在分析過程中扮演著重要的角色,并成為了研究熱點。本文以機器學習為基礎,介紹了腦網絡分析的概念、方法和3個主要過程。以機器學習為基礎的腦網絡分析有著良好的效果應用,是近幾年的研究熱點,但它的實際應用過程還存在著沒有解決的問題和未來能夠更好發展的工作,主要有:(1)復雜的交互性網絡的刻畫問題。腦網絡是一個非常復雜的網絡系統,如何刻畫這種復雜的交互性會是未來的研究中一個話題。(2)多模態的數據下疾病如何進行分類。不同模態得出的數據反映著腦結構功能結構的不同視角,如何充分利用模態信息和數據對未來腦疾病的診斷水平有著深刻的影響,這也是未來的一個研究的方向。(3)小樣本和數據不平衡的問題。當下的研究樣本數量小且非常不平衡。如何在小樣本和極不平衡的數據中得到有意義的信息也是現在的一項挑戰。