陳婉琦,林勇
上海理工大學醫療器械與食品學院,上海200093
骨質疏松癥是骨骼的主要疾病,其特征是骨密度降低和骨組織微結構損壞,進而導致骨折敏感性增加[1]。由骨質疏松癥引起的骨折叫骨質疏松性骨折,其給患者帶來巨大痛苦,并給社會和醫療系統帶來沉重負擔[2]。骨質疏松癥的發病率在女性中最高,但在接下來的50年中,男性的發病率有可能會翻3倍[3]。因此根據臨床變量預測男性骨質疏松性骨折風險對其預防至關重要。
近年來機器學習在醫學領域的應用越來越廣泛,出現了基于機器學習的骨質疏松性骨折預測研究。章軼立等[4]通 過Group Lasso 回歸算法和Logistic回歸模型初步構建骨質疏松性骨折風險評估工具。Villamor等[5]結合臨床和生物力學數據通過支持向量機(Support Vector Machine,SVM)對髖部骨折進行有效預測。此類單一模型的預測精度仍有較大提升空間,進而有研究提出采用集成學習方法提高模型預測性能。Kruse 等[6]使用邏輯回歸、隨機森林模型以及Bagging 和Boosting 集成學習方法預測髖部骨折,研究結果表明集成學習方法預測效果更佳。Kilic 等[7]使用 Bagging、梯度提升(Gradient Boosting)、隨機子空間(Random Subspace)采樣等集成學習方法對絕經后婦女進行骨質疏松性骨折預測,結果顯示基于隨機子空間的隨機森林(Random Forest based on Random Subspace, RSM-RF)集成分類器模型預測精度最佳。目前使用集成學習模型的研究絕大多數是對相同結構的個體學習器進行集成,使用異構分類器的研究還相對較少。
本研究使用學習法的典型代表Stacking 構建異構分類器……