全雪峰
(南陽醫學高等專科學校 衛生管理系,河南 南陽 473061)
基于隨機森林的乳腺癌計算機輔助診斷
全雪峰
(南陽醫學高等專科學校 衛生管理系,河南 南陽 473061)
為提高乳腺癌診斷的準確性,該文提出了一種基于隨機森林算法的乳腺癌診斷方法。用 UCI數據集提供的683例乳腺腫瘤患者進行了分類識別,5-折交叉驗證結果表明,采用新方法檢測乳癌平均準確率達到96.93%,優于概率神經網絡識別方法,說明了其在乳腺癌計算機輔助診斷方面的可行性。
隨機森林;乳腺癌;計算機輔助診斷
乳腺癌是一種危及婦女健康和生命的惡性腫瘤,是導致女性癌癥死亡的第二大原因[1]。根據世界衛生組織的報道,每年有超過120萬女性被診斷患有乳腺癌[2]。因此早期診斷、積極預防已成為迫切需要解決的問題。隨著人工智能技術的迅速發展,運用計算機輔助診斷乳腺癌已受到越來越多的關注,并取得了不少成果。劉瓊蓀[3]等提出基于徑向基神經網絡的乳腺癌分類模型,對100個檢測樣本的平均誤識率為23.5%。毛利鋒[4]等采用決策樹方法對乳腺癌進行判別,準確率達到96%以上。劉興華[5]等人利用支持向量機進行乳腺癌識別,最佳平均分類準確率達到96.24%。徐勝舟[6]等人提出結合遺傳算法的支持向量機乳腺癌診斷新方法,AUC值達到了0.908。唐思源[7]等人利用支持向量機對癌細胞的識別,取得了較好的正確識別率。
隨機森林是一種比較新的機器學習模型,它在沒有顯著提高運算量的前提下提高了預測精度。……