周霓呂洞賓 王凡馬瑋亮 洪武 △
雙相障礙 (bipolar disorder,BD)在全球的患病率約為1%~2%,其特征是情緒不穩定,抑郁和躁狂交替發作[1]。目前對BD的診斷仍基于癥狀學。而在BD治療中,通常方案要經歷長時間反復調整,患者才能接受有效治療。同時BD具有高復發率特點,隨訪研究發現45%患者會出現一次以上復發[2-4]。因此,BD的診斷與治療由于具有較強主觀性和個體差異,往往導致患者治療效果不佳,病情遷延。機器學習作為大數據時代背景下的一門新興學科,結合了多門學科的思想,憑借其對數據的分析和預測能力,為臨床診斷、治療方案選擇及預后判斷等提供了新方法、新思路。機器學習中心原則是通過從大型數據集中提取適用規律和模式來實現自動化歸納推理[5]。機器學習算法的目標就是建立一個適合數據的數學模型,一旦這個模型符合已知的數據,它就可以用來預測新數據的從屬或預測未來走向[6]。目前已有許多類型的機器學習算法,包括支持向量機 (support vector machine,SVM)、隨機森林和k-近鄰算法等,具體問題的模型選擇取決于數據特征和期望結果的類型[7-8]。這些算法的本質基本都是根據訓練集的數據進行迭代改進,以構建用于自主預測的模型,不斷提高性能[9]。機器學習可分為有監督學習和無監督學習兩種類型[10]。在有監督學習中,用戶向機器提供輸入數據和預期結果(即標簽),機器主要通過分類或回歸方法學習數據特征到標簽之間的規律[11]。而在無監督學習中,無標簽的數據直接暴露在算法中,機器主要通過聚類和降維的方法組織數據集,以此發現和描述數據間的規律[12]。……