3種統計模型在預測肺癌術后并發癥中的比較

2014-02-13 01:50:35周洋洋郭亮亮王保龍

安徽醫科大學學報 2014年4期

宋健，蘇虹，周洋洋，郭亮亮，王保龍

宋健1，蘇虹1，周洋洋1，郭亮亮1，王保龍2

目的探討BP神經網絡模型在預測肺癌術后并發癥中的應用價值。方法調查肺癌患者術后并發癥發生情況。分別應用Logistic回歸、BP神經網絡模型和經Logistic回歸篩選變量后的BP神經網絡模型3種辦法建立預測模型，并比較3種模型的預測準確度。結果Logistic回歸、BP神經網絡模型和經Logistic回歸篩選變量后的BP神經網絡模型的預測一致率分別為81.6%、89.7%、90.8%。3種模型受試者工作特征曲線（ROC曲線）下面積（AUC）分別為0.636、0.801、0.808。Logistic模型的AUC與兩種BP神經網絡模型的差異有統計學意義（P＜0.05）。結論BP神經網絡對肺癌術后并發癥預測的效果優于Logistic回歸模型。

Logistic模型；BP神經網絡；肺癌；并發癥

肺癌是嚴重威脅人類健康的主要惡性腫瘤之一，其發病率和病死率在全球范圍內呈逐年上升趨勢［1］。手術治療仍是現階段治療肺癌患者的主要手段，但肺癌術后并發癥的發生卻影響了患者的康復。因此有必要準確地進行術后并發癥的預測，提供合適的治療方案。以往多采用Logistic回歸進行術后并發癥危險因素的研究，較少對其預測的準確性進行評價。人工神經網絡是一項模仿生物神經系統中神經元的一種新數學處理方法。其中，應用最廣泛的是采用誤差反向傳遞學習方法（error back propagation learning methods）的多層感知機神經網絡，簡稱BP神經網絡，具有很強的非線性映射能力和柔性的網絡結構［2］。該研究嘗試探討BP神經網絡在預測肺癌術后并發癥中的應用價值，并與傳統的Logistic回歸方程相比較，為尋求一種更加準確的預測方法提供參考依據。

1 材料與方法

1.1 一般資料回顧性調查安徽醫科大學附屬省立醫院2009年～2012年的349例肺癌手術病例。利用病案數據庫查找與研究相關的患者資料。所有數據資料經過核實校對后，運用Epidata軟件建立數據庫。

1.2 Logistic回歸采用SPSS 17.0進行多因素分析。模型采用最大似然估計前進法進行逐步回歸分析，入選變量的標準是P＜0.05，剔除變量的標準是P＞0.10。通過訓練數據建立多因素回歸預測模型，并帶入測試數據進行預測。概率的判別標準為0.5，即P＞0.5時預測結果為發生并發癥，否則為不發生，統計學顯著性水平規定為α＝0.05。

1.3 BP神經網絡BP神經網絡由輸入層、若干隱藏層和輸出層組成。每一層有若干神經元連接，同層神經元之間無連接。其基本原理［3］是：輸入信號Xi通過中間節點作用于輸出節點，經過非線性變化，產生輸出信號Yk，網絡輸出值Y與期望輸出值T之間的偏差，通過反向調整輸入節點與隱藏層、輸出層與隱藏層之間的權值系數及闕值，使誤差沿梯度方向下降，經過反復學習訓練，確定合適的連接權值與闕值，以使輸出值Y與期望輸出值T之間的誤差最小。經過訓練的神經網絡能對類似樣本信息的輸入自行處理并進行合理的預測。

本研究采用SPSS 17.0統計軟件中的神經網絡模塊的多層感知器（multilayer perceiver，MLP）。MLP是基于BP神經網絡的一種算法。本研究將數據隨機分為訓練樣本、預測樣本和校驗樣本。分別占總樣本的1/2、1/4和1/4。訓練樣本用于網絡的訓練，產生合適的網絡參數。校驗樣本在訓練過程中起監督作用，防止過度擬合。預測樣本為最終評價神經網絡的獨立數據集，它不用于構建模型。輸入層和輸出層節點數分別有輸入變量和結局變量決定。首先輸入層變量為所有研究變量，考慮到輸入層神經元個數過多對樣本量的要求較高，筆者嘗試將Logistic回歸與BP神經網絡相結合，輸入變量為Logistic多因素分析結果中有意義的變量。結局變量均為有無并發癥發生。研究證實對于任何閉區間內的一個連續函數都可以用一個隱層的BP網絡來逼近。對于隱藏層內神經元數，目前尚無公認的計算公式。選擇“自動體系結構選擇”，隱含層中最小單位數為1，最大單位數為50，訓練類型為“批處理”，優化算法選用“調整的共輒梯度”，初始Lambda值為0.000 000 5，初始Sigma值為0.000 05，間隔中心點為0，間隔偏移量為±0.5。兩種BP神經網絡模型隱含層激活函數為雙曲正切函數，輸出層激活函數為Softmax。

1.4 受試者工作特征曲線（receiver operator characteristic curve，ROC曲線）比較ROC曲線是根據一系列不同的二分類方式，以靈敏度為縱坐標，1－特異度為橫坐標繪制的曲線。通過分別計算各個試驗的ROC曲線下面積（area under curve，AUC）進行比較，AUC最大者表示該試驗的診斷價值最佳。ROC的AUC值在0.5和1.0之間。在AUC＞0.5的情況下，AUC越接近于1，說明診斷效果越好。AUC＝0.5時，說明診斷方法完全不起作用，無診斷價值。所以對AUC要首先檢驗與0.5的差異有無統計學意義。本研究利用醫學統計軟件包Medcalc，使用先前獲得預測樣本的Logistic回歸和人工神經網絡的預測擬概率，繪制ROC曲線，并進行不同AUC的非參數顯著性檢驗（統計量為Z）。

2 結果

2.1 一般情況2009年～2012年肺癌患者術后住院期間死亡1例，共348例患者納入該研究。其中男220例，女128例，≥70歲患者102例，＜70歲患者246例。術后發生心肺并發癥的患者共79例，占手術患者的22.7%。研究變量主要包括年齡、性別、術中輸血、切除部位、病理類型、吸煙史、糖尿病史、高血壓史、冠心病史、手術方式、術前生理指標［白蛋白、血紅蛋白和一秒用力呼氣容積/用力肺活量（FEV1%）］、術前化療史、心電圖檢查共15項。變量賦值及計數統計見表1。

2.2 Logistic分析結果由于Logistic模型建立方程不需要校驗樣本，故將訓練樣本和校驗樣本都用來擬合模型。將所有15個變量納入Logistic多因素分析，結果有5個變量作為肺癌并發癥發生的危險因素有統計學意義，分別為年齡、手術方式、高血壓史、白蛋白、FEV1%。見表2。根據其模型參數建立的預測方程為：

Nagelkerke決定系數為0.778，顯示模型擬合程度較好。根據方程對預測集數據進行預測。

表1 肺癌患者一般情況統計

表2 肺癌術后心肺并發癥發生Logistic多因素分析

2.3 BP神經網絡分析結果

2.3.1 BP神經網絡將所有15個變量納入神經網絡模型中。通過“自動體系結構選擇”模型，隱含層單元數為4。對各個自變量進行敏感度分析，結果顯示對肺癌并發癥發生影響最大的前5位因素依次是白蛋白（0.112）、高血壓（0.111）、FEV1%（0.104）、年齡（0.098）和吸煙史（0.096）。

2.3.2 經Logistic回歸篩選變量后的BP神經網絡

聯合應用Logistic方程與BP神經網絡，輸入層變量為Logistic多因素分析結果中有意義的變量共5個。對各個自變量進行敏感度分析，結果顯示對肺癌并發癥發生影響最大的因素是FEV1%（0.302），其余依次是高血壓（0.208）、年齡（0.205）、白蛋白（0.196）和手術方式（0.089）。

2.4 模型預測能力比較

2.4.1 預測結果的比較 Logistic預測模型的一致率、靈敏度和特異度均低于BP神經網絡模型和經Logistic模型篩選變量的BP神經網絡模型。表明Logistic模型的預測能力低于BP神經網絡模型。見表3。

表3 3種模型預測能力比較（%）

2.4.2 ROC曲線面積比較通過Medcalc計算，Logistic模型預測的AUC為0.636，95%CI為0.526～0.736。BP神經網絡模型的AUC為0.801，95% CI為0.702～0.879。經Logistic模型篩選變量的BP神經網絡模型的AUC為0.808，95%CI為0.710～0.885。見表4。經檢驗，三者AUC與0.5比較差異有統計學意義（P＜0.05）。3種模型AUC兩兩比較結果顯示Logistic模型預測的AUC與BP神經網絡模型（Z＝2.696，P＝0.007）、經Logistic模型篩選變量的BP神經網絡模型的AUC（Z＝2.464，P＝0.014）的差異均有統計學意義（P＜0.05）。表明BP網絡模型在預測性能上優于Logistic回歸模型。兩種BP神經網絡模型的AUC比較差異無統計學意義（Z＝0.191，P＝0.849）。見圖1。

表4 3種模型ROC的AUC

3 討論

3.1 肺癌術后并發癥發生的危險因素肺癌患者多為中老年人群，身體免疫力和耐受力低下，多數患者還同時伴有其他疾病。肺癌手術往往創面大，影響患者呼吸功能。本研究數據顯示術后并發癥發生率為22.7%，故有必要對肺癌術后并發癥進行預測。本研究通過Logistic回歸多因素分析顯示，年齡≥70歲和全肺切除是肺癌術后并發癥的危險因素，這與錢永祥［4］研究結果相同。隨著年齡的增加，機體抵抗力下降，伴隨疾病增多和恢復較慢會增加發生并發癥的風險。肺切除的范圍決定了對肺周圍血管和神經叢損害的大小。全肺切除一般手術創面大，切除后會導致肺容量減少和心臟負荷增加等，進而導致發生并發癥的可能性增加。FEV1%較低反映了患者的肺功能損減，與國外研究［5］相同，本研究也證實了FEV1%降低是術后并發癥發生的危險因素。因此，對于FEV1%偏低患者術后應予以重視，術前的肺功能恢復鍛煉也是有利的。由于腫瘤是一種消耗性疾病，白蛋白減少患者一般存在營養不良的情況，會影響術后恢復的時間，增加患病的可能。對于伴有高血壓的肺癌患者，高血壓會損害患者的心臟，引起心臟結構異常，甚至造成心功能的損害。本研究結果證實高血壓也是肺癌術后并發癥的危險因素之一。因此，術前對血壓的控制十分必要。

圖1 3種預測模型ROC曲線

3.2 BP神經網絡模型優缺點神經網絡模型是生物神經網絡在結構、功能及某些基本特性方面的理論抽象和模擬而構成的一種信息處理系統。目前已廣泛應用于醫學的各個領域，如疾病診斷及衛生管理等［6－7］。BP神經網絡模型屬于有監督學習的網絡模型，被認為是穩定性較強的人工神經網絡之一。與傳統的統計學方法相比，BP神經網絡模型沒有精確的數學模型，對自變量和因變量均沒有任何要求（如正態性和獨立性）。在處理一系列復雜的非線性問題時，具有很強的容錯性。但是，神經網絡仍然存在一些不足需要解決。首先，建立神經網絡模型的過程中各參數及函數的設置并沒有統一的標準，這些設置的正確性缺乏理論依據［2－3］。本研究中采用SPSS軟件中的“自動體系結構選擇”功能，有系統自行運算選擇最優的參數設置。其次，神經網絡模型并不能像Logistic回歸那樣給出明確的方程，每個自變量對因變量作用的合理解釋尚無法知曉。變量準入和剔除的原則尚不明確。

3.3 BP神經網絡與Logistic回歸的預測應用本研究結果顯示神經網絡預測性能優于Logistic回歸，而兩種納入不同變量數目的BP神經網絡的預測能力的差異并無統計學意義。雖然神經網絡模型預測性能高于Logistic回歸，但由于神經網絡模型無法對自變量進行解釋，所以在實際應用中，可將兩者相互配合，充分發揮各自的優點，提高應用價值。同時，國內外許多學者也對神經網絡模型與Logistic模型的預測性能進行了比較。Shi et al［8］比較兩種模型預測原發性肝癌術后住院死亡的準確性，結果同樣提示神經網絡模型具有更高的準確度。Biglarian et al［9］使用這兩種模型對大腸癌患者發生遠處轉移進行預測，Logistic回歸和神經網絡模型AUC分別為0.77和0.82，后者優于前者。有學者使用Logistic回歸、決策樹和神經網絡模型預測胃癌術后并發癥，結果顯示神經網絡模型是3種模型中預測準確性最高［10］。

［1］ Siegel R，Naishadham D，Jemal A.Cancer statistics，2013［J］.CA Cancer J Clin，2013，63（1）：11－30.

［2］李麗霞，王彤，范逢曦.BP神經網絡與logistic回歸的比較研究［J］.中國衛生統計，2005，22（3）：138－40.

［3］元昌安.數據挖據原理與SPSS Clementine應用寶典［M］.北京：電子工業出版社，2009：239－47.

［4］錢永祥.非小細胞肺癌術后并發癥的危險因素分析和預防措施［J］.癌癥進展，2012，10（6）：627－9.

［5］ Takamochi K，Oh S，Matsuoka J，et al.Risk factors for morbidity after pulmonary resection for lung cancer in younger and elderly patients［J］.Interact Cardiovasc Thorac Surg，2011，12（5）：739－43.

［6］余小蘭，姚永忠，桑劍鋒，等.基于BP神經網絡的甲狀腺癌無創診斷模型的研究［J］.現代生物醫學進展，2012，12（36）：7104－8.

［7］葉健偉，沈亞誠，黃小玲.基于BP神經網絡的肺炎醫保住院費用分析［J］.衛生經濟研究，2013，6：38－40.

［8］ Shi H Y，Lee K T，Lee H H，et al.Comparison of artificial neural network and logistic regression models for predicting in-hospital mortality after primary liver cancer surgery［J］.PLoS One，2012，7（4）：e35781.

［9］ Biglarian A，Bakhshi E，Gohari M R，et al.Artificial neural network for prediction of distant metastasis in colorectal cancer［J］.A-sian Pac J Cancer Prev，2012，13（3）：927－30.

［10］Chien C W，Lee Y C，Ma T S，et al.The application of artificial neural networks and decision tree model in predicting post-operative complication for gastric cancer patients［J］.Hepatogastroenterology，2008，55（84）：1140－5.

A comparison between three statistical models in predicting post-operative complication for lung cancer patients

Song Jian，Su Hong，Zhou Yangyang，et al
（Dept of Epidemiology and Biostatistics，School of Public Health，Anhui Medical University，Hefei 230032）

ObjectiveTo explore the application value of BP neural network in predicting post-operative complication for lung cancer patients.MethodsWe applied Logistic regression，BP neural network model and BP neural network model screening variables by Logistic regression to establish prediction models and evaluate the practical application of each model in the prediction accuracy.ResultsThe prediction accuracy of Logistic regression，BP neural network model and BP neural network model screening variables by Logistic regression were 81.6%，89.7%，90.8%and the AUC of ROC in the three models were 0.636，0.801，0.808，respectively.There were significant differences of the AUC of ROC between Logistic regression and two BP neural network models.ConclusionThe discrimination performance of BP neural network models is better than Logistic regression in the prediction of post-operative complication for lung cancer patients.

Logistic regression；BP neural network；lung cancer；complication

R 195.1；R 734.2；R 619.9

1000－1492（2014）04－0472－04

2013－10－16接收

國家自然科學基金（編號：81172172）

1安徽醫科大學公共衛生學院流行病與衛生統計學系，合肥 230032

2安徽醫科大學附屬省立醫院檢驗科，合肥 230001

宋健，男，碩士研究生；蘇虹，女，教授，碩士生導師，責任作者，E-mail：suhong5151＠sina.com