喬 瀚,容芷君*,許 瑩,但斌斌,趙 慧
(1.武漢科技大學工業工程系,武漢 430081;2.武漢市第五醫院,武漢 430050)
調查研究表明,糖尿病的發病率呈現逐年增加的趨勢,截至2017年,中國成年人糖尿病患病率為12.8%,糖尿病前期患病率為35.2%[1],在慢性疾病的防控問題中,糖尿病問題位居第一。糖尿病防控不好會增加并發癥的風險,嚴重威脅患者的健康狀況,因此,做好糖尿病的預防尤為重要[2]。隨著醫療大數據的發展,積累了大量醫療健康數據,通過對醫療數據挖掘和分析,以疾病的多種指標來建立預測模型[3],對糖尿病早期預測,能夠對糖尿病的防控和治療起到很大作用。
目前通過醫療大數據對疾病的預測方法主要分為兩種[4]:一種是基于傳統的建模方法,該方法是通過已有患者數據,提取影響某疾病的危險因素,使用各種機器學習的算法來訓練生成全局預測模型,找出危險因素與疾病之間的關系,構建模型,輸出疾病預測結果。Bala等[5]采用深度神經網絡分類器構建糖尿病預測模型;Kadhm等[6]采用決策樹構建預測模型對糖尿病進行診斷;Namrata[7]采用集成的方法構建模型。這種對于糖尿病的預測建模方法是使用所有可用的同一批訓練樣本為所有測試樣本構建相同的預測模型,對新加入的患者在這種預測模型中得到的預測結果可能不理想,由于患者與患者之間存在一定的差異性,這種全局預測模型方法的會忽略和丟失目標患者的信息,導致得到的預測結果不準確[8]。
另一種方法是通過建立患者個性化模型,即通過患者的臨床概念(年齡、性別、疾病診斷、實驗室指標)定量化度量患者之間的距離,然后匯總為樣本間的相似性[4],利用最相似的一簇數據來進行糖尿病的早期預測。……