楊佳琦 張銀娟(承德醫學院 河北 承德 067000)
應用BP神經網絡預測西非三國埃博拉出血熱疫情
楊佳琦張銀娟
(承德醫學院河北承德067000)
摘要目的:為研究BP( Back Propagation)神經網絡模型在疾病預測中的應用價值,并為埃博拉出血熱的防治工作提供理論依據。方法:應用BP神經網絡模型對2014年至今西非三國埃博拉出血熱流行趨勢進行預測。以西非三國2014年3月至12月埃博拉出血熱疫情資料建立預測模型,預測2015年1月西非三國埃博拉出血熱疫情水平。結果:外推預測平均誤差率為0. 05998,預測準確度為94. 00%。結論: BP神經網絡模型可用于西非三國此次埃博拉出血熱疫情的預測。
關鍵詞疾病預測; BP神經網絡;埃博拉
埃博拉出血熱是由埃博拉病毒( Ebola virus,EBOV)所引起的一種急性出血性傳染病,主要通過患者的血液和排泄物傳播,臨床表現主要為急性起病、發熱、肌痛、出血、皮疹和肝腎功能損害,病死率極高,對人類健康危害巨大。2014年該病于非洲地區爆發,感染及死亡人數均創歷史新高,其防治成為重要課題。近年來,BP神經網絡在醫藥衛生研究領域中得到越來越多的重視和應用。本文將BP神經網絡應用于非洲埃博拉出血熱流行趨勢的預測,以建立埃博拉出血熱的神經網絡預測模型,為埃博拉出血熱的防治工作提供理論依據。
1. 1資料來源世界衛生組織官方網站、中國疾病控制中心官方網站、美國疾病控制中心官方網站2014年3月至今為止埃博拉出血熱流行資料。神經網絡的實現選用MATLAB軟件。
1. 2預測內容及方法以西非三國2014年3月至12月埃博拉出血熱疫情資料建立預測模型,預測2015年1月西非三國埃博拉出血熱疫情水平。
1. 3BP神經網絡模型原理及方法
1. 3. 1原理神經網絡是一種運用類似生物神經系統工作原理進行信息處理的數學模型。BP( Back Propagation)神經網絡是近年來應用較多的神經網絡之一,是一種按誤差逆向傳播算法進行學習的多層前饋網絡,通過誤差的反向傳播不斷調整各層神經元連接權值,以保證網絡輸出誤差達到最小或小到可接受的范圍內[1]。其預測過程的工作原理大致為:將歷史數據或已知數據作為網絡的訓練數據對網絡進行訓練,訓練數據一般應分為網絡輸入數據和期望輸出數據兩部分,神經網絡在訓練過程中通過學習擬合網絡輸入數據與期望輸出數據之間的映射關系或規律,訓練結束后(即輸出誤差達到要求),神經網絡將最優的連接方式和連接權值保存下來,當再次輸入符合該規律的新的數據時,神經網絡將按保存下來的連接方式和連接權值對其予以處理、運算,并最終推測出預測值,完成預測工作[2]。
1. 3. 2結構本文采取3層的BP神經網絡,分別為輸入層、隱層、輸出層,每層設神經元若干。
1. 3. 3網絡輸入、期望輸出數據以西非三國(幾內亞、利比里亞、塞拉利昂) 2014年3月至11月埃博拉出血熱累積報告病例數作為網絡輸入數據,以2014年12月累積報告病例數作為期望輸出數據,對網絡進行訓練。網絡訓練好后對西非三國2015年1月埃博拉出血熱累積報告病例數進行預測。
1. 4精度檢驗為了檢驗模型的預測效果。采用絕對誤差,平均誤差率以及預測準確度檢驗其擬合和預測效果。
平均誤差率=平均絕對誤差/實際值的均值預測準確度= ( 1-平均誤差率)×100%
2. 1西非三國埃博拉出血熱疫情資料整理將西非三國2014年3月至今為止埃博拉出血熱流行資料按月統計累積報告病例數,結果見表1。
2. 2BP神經網絡模型經過大量實驗,最終確定輸入層神經元數為3,隱層神經元數為8,輸出層神經元數為1;以線性函數為功能函數。此時網絡輸入數據為2014年3月至11月數據,輸入數據P為P =[112 8 0; 221 13 0; 281 12 16; 390 51 158; 460 329 533; 648 1378 1026; 1074 3458 2021; 1667 6535 5338; 2155 7635 7109],期望輸出數據為2014年12月數據,期望輸出數據T為T =[2707 8018 9446],并對數據進行歸一化處理,歸一化處理后進行網絡的訓練,訓練誤差達到要求,網絡訓練完成。以訓練好的網絡預測西非三國2015年1月埃博拉出血熱累積報告病例數,此時以2014年4月至12月數據為輸入數據,此時輸入數據命名為P2,P2 = [221 13 0; 281 12 16; 390 51 158; 460 329 533; 648 1378 1026; 1074 3458 2021; 1667 6535 5338; 2155 7635 7109; 2707 8018 9446],經歸一化處理后輸入網絡,運行網絡得到預測結果,將結果反歸一化,得到最終預測結果}:西非三國2015年1月埃博拉出血熱累積報告病例數預測值為幾內亞3260例、利比里亞8390例、塞拉利昂9770例。
2. 3預測效果經計算,本文針對西非三國2015年1月埃博拉出血熱累積報告病例數的預測,
平均誤差率為0. 05998,預測準確度為94. 00%,具體指標見表2。
3. 1埃博拉出血熱屬于接觸性傳播疾病,2014年于西非爆發,給非洲人民帶來重大生命健康危害,其防治工作成為關注重點,目前針對該病的特效藥物及疫苗兩方面的研究進展并不喜人,預防工作困難重重,如能對其病例出現的數量進行預判,對合理分配醫療力量與資源,及時展開治療、隔離等工作均有積極意義。本文立意于此,進行研究,建立了西非三國埃博拉出血熱累積報告病例數的BP神經網絡預測模型,預測準確度較高,達94%,預測效果較好,表明BP神經網絡可用于西非三國埃博拉出血熱疫情的預測。今后研究應致力于完善預測方法、提高外推預測能力及對爆發情況的預測等方面,以達到更好的預測效果[5]。
3. 2BP神經網絡在醫學研究中的應用日漸增多,因其具有擬合非線性映射的能力,故具有更廣的應用范圍,在疾病預測方面已取得較多應用成果。本文所建立的BP神經網絡仍以時間序列模型為基礎,通過歷史數據的處理來掌握其發生規律,在網絡學習過程中對網絡結構的不斷調整,逐步完善網絡模型的建立。針對網絡結構的選擇,目前尚無絕對規律可循,一般都需研究者自行探索,針對不同問題或同一問題的不同期數據都需重新調整網絡。網絡的擬合效果與數據質量的優劣緊密相關,欲取得較好的預測效果,數據的選擇、整理至關重要[6]。本文所用數據來自世界衛生組織、中國疾控中心、美國疾控中心官方網站,真實性有所保證。
參考文獻
[1]Bing Wang,Steve Valentine,Manolo Plasencia,et al. Artificial neural networks for the prediction of peptide drift time in ion mobility mass spectrometry[J]. BMC Bioinformatics,2010,( 182) : 1-11.
[2]Haykin S.神經網絡原理(葉世偉等譯)[M].第2版.機械工業出版社,2004:59.
[3]歐陽玉梅,馬志強,方若森.基于MATLAB的遺傳神經網絡的設計于實現[J].信息技術,2008,( 6) :73-80.
[4]飛思科技產品研發中心.神經網絡理論與MATLAB7實現[M].第1版.電子工業出版社,2005:83.
[5]段瓊紅,聶紹發,仇成軒,等.應用BP神經網絡預測前列腺癌流行趨勢[J].中國公共衛生,2010,16( 3) :193-195.
[6]王俊杰,陳景武. BP神經網絡在疾病預測中的應用[J].數理醫藥學雜志,2008,21( 3) :259-262.
【中圖分類號】R183
【文獻標識碼】B
【文章編號】1009-6019( 2015) 12-0031-01
作者簡介:楊佳琦,男,承德醫學院預防醫學教研室,碩士學歷。