趙金超,李 儀,王 冬,張俊虎
(青島科技大學 信息科學技術學院,山東 青島266061)
目前醫學領域正面臨由傳統醫學模式向精準醫學模式轉變的契機,給人工智能技術充分參與醫療實踐活動創造了有利的環境[1-2]。國內外研究人員,依靠不同的算法,通過對心臟病進行分類從而實現幫助醫生進行輔助診斷,正在進行大量的研究工作。COMAK等[3]在2007年通過支持向量機建立了對心臟病識別的系統。PARTHIBAN等[4]在2011年應用樸素貝葉斯算法在心臟病治療上。史琦等[5-7]連續3 a分別使用數據挖掘、決策樹、模式識別對心臟病進行了分類預測研究,史瑜等[8]在2015年用K近鄰算法對心臟病進行分類,得到了75%的準確率。醫生在診斷患者時,主要根據病人的一系列的醫學檢查結果,自己學習的醫療知識和以往的經驗,對病人是否患有該疾病進行判斷。然而在醫生做出判斷時,會由于人為不可抗原因,可能會產生錯誤判斷。而目前流行的通過醫療與機器學習算法相結合的方法,能夠幫助醫生有效減少誤診率,提高診療準確率和效率,對醫療事業的發展有著推動作用。在機器學習算法中,隨機森林就是一種易理解,易應用的集成學習的方法,本研究基于隨機森林算法建立一種KNN-RF模型,對心臟病進行輔助診斷,通過對算法進行優化和與其他機器學習算法對比,獲得較高準確率。
隨機森林的基本組成單元是決策樹,對用與分類與回歸問題的研究,它是許多各自獨立同分布的決策樹結合而成的,組成隨機森林的每一棵決策樹都會對輸入數據進行分類處理,處理完成后,對每棵樹的決策結果進行投票處理,票數高的即為輸出結果。……