王嬌嬌,陳圓煜,鄭子薇,楊永忠,陳哲,李超,王海東,武建輝,王國立
頸動脈粥樣硬化(carotid atherosclerosis,CAS)是一種以內膜大、中動脈增厚為特征的病理改變[1],是心腦血管疾病的誘因[2],其高發病率和致殘率不同程度地影響著人類健康[3]。鋼鐵工人作為鋼鐵企業的主力軍,長期暴露于粉塵、高溫、噪聲等危險因素并面臨職業緊張和倒班的壓力,CAS發生率也隨之增加[4]。
目前,機器學習已廣泛應用于醫學預測模型,支持向量機(Support Vector Machine,SVM)、BP神經網絡(Back Propagation Neural Network,BPNN)與隨機森林(Random Forest,RF)模型是機器學習中的3項重要技術,其中SVM模型的學習和泛化能力比較強,常應用于文本識別、車輛交通、醫療檢測等領域;BPNN模型在預測和函數逼近方面具有明顯的優勢;RF模型憑借計算效率高、訓練速度快而對各行各業的數據分析均能起到推動作用;三者均能夠從海量數據中快速挖掘出有效信息,但對于不同的數據類型三者的應用效果不同。目前關于3種模型預測鋼鐵工人CAS效能方面的比較還鮮有報道。本研究采用SVM、BPNN和RF模型構建鋼鐵工人CAS的風險預測模型,并比較三者的預測性能,以期為這一群體的健康保護與促進以及CAS的預防提供指導。
1.1 研究對象 選取2017年3—6月在唐山市弘慈醫院進行體檢和健康監測的4 568例鋼鐵工人。納入標準:在崗,且工齡≥1年。排除標準:接觸過有害影響因素者(現在不倒班、不接觸高溫作業、噪聲作業),變量信息缺失者。本研究經華北理工大學倫理委員會審核通過(審批號為15006),研究對象均知情同意。……