桑祎瑩 黃仕鑫 易 靜 曾 慶
(1 重慶市衛(wèi)生健康統(tǒng)計(jì)信息中心統(tǒng)計(jì)與政策研究部,重慶市 401120,電子郵箱:1341475734@qq.com;2 重慶市渝北區(qū)人民醫(yī)院,重慶市 401120;3 重慶醫(yī)科大學(xué)公共與衛(wèi)生管理學(xué)院,重慶市 401120)
糖尿病周圍神經(jīng)病變(diabetic peripheral neuropathy,DPN)在糖尿病患者中的發(fā)生率為41%~91%,是糖尿病常見的慢性并發(fā)癥之一,可嚴(yán)重影響糖尿病患者的生活質(zhì)量[1-2]。DPN的發(fā)病機(jī)制十分復(fù)雜,目前主要認(rèn)為氧化應(yīng)激、神經(jīng)炎癥和細(xì)胞凋亡在DPN的發(fā)病機(jī)制中起著關(guān)鍵作用[3]。早期診斷、早期治療是延緩DPN發(fā)展、改善患者預(yù)后的關(guān)鍵[4]。
近年來,數(shù)據(jù)挖掘技術(shù)已經(jīng)被廣泛應(yīng)用于零售、金融、保險(xiǎn)、電信、生物信息、醫(yī)療衛(wèi)生等領(lǐng)域中,在醫(yī)療衛(wèi)生領(lǐng)域,隨著醫(yī)學(xué)的進(jìn)步和信息技術(shù)的發(fā)展,數(shù)據(jù)挖掘技術(shù)在疾病的相關(guān)因素分析、預(yù)后預(yù)測、診斷等方面得到了良好的應(yīng)用[5]。在慢性病學(xué)研究中,Logistic回歸模型簡單易用,而隨機(jī)森林模型算法穩(wěn)健,對納入模型的數(shù)據(jù)結(jié)構(gòu)不做要求、不存在共線性與過擬合[6],因此兩者用途非常廣泛。本研究采用Logistic 回歸模型和基于機(jī)器學(xué)習(xí)理論的隨機(jī)森林模型建立DPN診斷模型,并比較這兩種模型診斷DPN的效果,為計(jì)算機(jī)輔助早期診斷DPN提供參考,從而改善患者的預(yù)后。
1.1 臨床資料 納入2016年1~12月在重慶醫(yī)科大學(xué)附屬第二醫(yī)院內(nèi)分泌科確診為DPN的患者(共計(jì)2 199例)為病例組,同時(shí)采用簡單隨機(jī)抽樣法從同期體檢對象中選取2 610例非DPN的體檢人群作為對照組。病例組納入標(biāo)準(zhǔn):(1)均為2型糖尿病患者[7];(2)符合DPN的診斷標(biāo)準(zhǔn)。……