張斌,劉弋,胡宗舉
根據2019年國家癌癥中心發布的最新數據顯示,胃癌發病率居我國惡性腫瘤第2位,死亡率居第3位。國內的研究報告胃癌術后5年生存率普遍低于30%,遠低于歐美及日本等發達國家。因此,明確胃癌術后預后的影響因素及通過各種影響因素對胃癌術后生存時間進行預測,有著重要的臨床意義。本研究用人工神經網絡技術(ANN)建立胃癌的預后模型對胃癌術后5年生存率進行預測,與傳統logistic回歸模型預測進行比較,尋求胃癌預后最佳預測方法。
1.1 一般資料 收集2011年1月至2016年12月阜陽市人民醫院收治的胃癌病人的臨床資料。納入標準:經胃鏡活檢或術后病理證實為胃癌。排除標準:(1)臨床資料不全者;(2)未行手術治療者;(3)合并有嚴重心肺功能疾病者;(4)術后隨訪期內失訪者(以及隨訪期未滿5年且存活者)。剔除后共選取152例病例,其中,男性125例,女性27例,男女比為4.63:1,年齡62.4歲,年齡范圍為22~82歲,>60歲占69.7%。術后隨訪方式為電話及門診隨診,前2年每6個月隨訪1次,后每年隨訪1次,共隨訪5年,隨訪日期截至2019年12月。
1.2 篩選預后因素及量化數據 根據以往文獻的報告,選取以下有可能影響胃癌預后的因素,包括性別、年齡、家族腫瘤史、血清癌胚抗原(CEA)水平、腫瘤發生部位、Borrmann分型、腫瘤最大直徑、浸潤深度(T分期)、淋巴結轉移數量(N分期)、TNM分期、分化程度、手術方式、術后化療、神經脈管浸潤共14項觀察指標。將以上14項可能影響胃癌預后的觀察指標量化處理,轉化成滿足ANN和logistic回歸數據分析輸入參數要求的數據。
1.3 統計學方法 本資料單因素生存分析采用SPSS 24.0軟件包進行分析,Kaplan-Meier法計算各組生存率,log-rank法比較各組間差異,P<0.05為差異有統計學意義。在Matlab2017b的環境下采用人工神經網絡(ANN)和logistic回歸對胃癌術后5年生存概率進行預測,其中人工神經網絡使用Matlab神經網絡工具箱中的BP神經網絡。
2.1 總體生存率 152例病人中,截止到5年隨訪期結束共存活45例,死亡107例,中位生存期33個月,術后1年、3年、5年生存率分別為82.89%、48.68%、29.61%。
2.2 單因素分析 將152例病人的臨床及病理資料分組,其中13例行姑息性手術(內引流、造瘺或大網膜切除活檢術),缺少Borrmann分型、腫瘤大小、浸潤深度、淋巴結轉移、分化程度、神經脈管浸潤等資料。采用Kaplan-Meier法計算各組生存率,Logrank法比較各組間差異,結果顯示:CEA水平、Bor‐rmann分型、浸潤深度、淋巴結轉移、分化程度、TNM分期、手術方式、神經脈管浸潤共8項指標差異有統計學意義(P<0.05),見表1。

表1 影響胃癌預后的臨床病理參數分析

續表1 影響胃癌預后的臨床病理參數分析


設置神經網絡訓練的目標誤差為10,最大迭代次數為500,學習率為0.01,a=3,k=15。當y≥0時,病例的預測結果為1,即是“5年死亡”,否則,病例的預測結果為0,即是“5年生存”。27例測試樣本運算結果顯示準確率85.19%(23/27),敏感度88.24%(15/17),特異度80%(8/10),如表2所示。為了更直觀的展示預測效果,將預測結果與真實值進行比較,見圖2。

圖1 BP神經網絡結構圖

表2 ANN測試集預測結果/例

圖2 測試集(27例隨機樣本)運算結果圖
2.4 建立logistic回歸預測模型 為了避免和ANN預測模型對比的人為誤差,沿用ANN預測模型的112例訓練樣本和27例測試樣本,將單因素生存分析中8項有統計學差異的指標納入logistic回歸預測作為分析的自變量。logistic回歸模型如下:

設置初始參數θ=θ=…=θ=1,步長為0.01,損失精度為0.000 1。當y≥0.5時,病例的預測結果為1,即是“5年死亡”,否則,病例的預測結果為0,即是“5年生存”。預測結果為是否5年生存,結果提示27例測試樣本預測準確率74.07%(20/27),敏感度82.35%(14/17),特異度60%(6/10),見表3。

表3 logistic回歸測試集預測結果/例
2.5 ANN模型在不同TNM分期中的預測 為了研究ANN預測模型對于不同TNM分期病人是否適用,將139例病人根據TNM分期定義訓練集和測試集。沿用上文ANN所設置的模型參數,將Ⅱ期和Ⅲ期病人共121例設為訓練集學習預測模型,對18例I期病人(測試集)的5年生存率進行預測,結果顯示預測準確率77.78%(14/168) ,敏感度7 40%(2/85),特異度92.31%(12/13),具體結果見圖3、表4。

圖3 測試集(I期病人)運算結果圖

表4 ANN測試集預測結果/例
胃癌因起病隱匿、癥狀不典型、轉移及復發幾率高等特點,預后較差。在臨床工作中,對于胃癌術后,其病人及家屬不可避免的會問一個問題“我還能活多長時間?”。因影響胃癌預后的因素較為復雜,對于這個問題,臨床醫師往往根據自己的臨床經驗及主觀因素給出一較模糊的答案。本研究通過分析152例胃癌術后的臨床及病理資料,探索其影響胃癌預后的各種獨立因素,分別用人工神經網絡(BP神經網絡)、logistic回歸兩種方法建立胃癌的預后模型對胃癌術后生存時間進行預測,尋求胃癌預后最佳的預測方法。
本研究的單因素生存分析顯示,CEA水平、Bor‐rmann分型、浸潤深度、淋巴結轉移、分化程度、TNM分期、手術方式、神經脈管浸潤8個因素與胃癌術后的總生存時間呈顯著性相關(P<0.05)。CEA水平越高、TNM分期越晚、分化程度越差、存在神經脈管浸潤的病人其生存時間越短、5年生存率越低,根治性手術病人明顯要比姑息性手術病人生存時間長。本研究結果與國內外目前研究結果相一致,Hou等研究發現病理分化程度越高、TNM分期越早、淋巴結轉移率越低的胃癌病人,其生存時間越長。Ueno等研究發現,以75歲為界限,75歲以上病人病理結果和術后并發癥是其生存率的重要預后因素,而75歲以下則病理結果和術后化療是其重要的預后因素。Katai等對日本118 367例胃癌病人進行統計,其中I期胃癌病人占總數的58.7%,總5年生存率達到71.1%,遠遠超過國內研究統計的5年生存率,本研究的總體5年生存率偏低(29.61%),考慮原因與此次研究資料以進展期胃癌為主、未排除Ⅳ期行姑息性手術病人且早期胃癌占總樣本比例較小(I期胃癌僅占比11.8%)有關。因此深入研究影響胃癌預后的相關因素極其重要,對于降低胃癌術后復發轉移率有著重要的意義。
ANN是模擬人類大腦的神經系統,對復雜信息進行綜合處理的一種數學模型,因其智能化的自適應學習能力特點,被廣泛應用在語音識別、圖像識別、醫學診斷與預測等各個專業領域。人工神經網絡包括BP神經網絡、概率神經網絡、卷積神經網絡等,其中BP神經網絡應用較為廣泛。Walczak等使用ANN方法對219例胰腺癌病人進行術后7個月的生存預測,結果發現ANN的敏感度在90%以上。鄭駿明、高新研究發現通過人工神經網絡建立去勢抵抗性前列腺癌病人的預后預測模型跟傳統COX比例風險模型相比具有更高的準確性。唐雯等發現對656例腹膜透析病人的預后構建預測模型,循環神經網絡相比傳統logistic回歸有著明顯的優越性。通過本研究結果可以觀察到,在隨機分配的ANN預測模型中,27例胃癌測試樣本中BP神經網絡的預測準確率(85.19%)、敏感度(88.24%)和特異度(80%)高于傳統logistic回歸模型預測(74.07%、82.35%、60%),結果與國內外的研究較為一致;在不同TNM分期構建的ANN預測模型中,根據Ⅱ期和Ⅲ期病人的臨床數據構建的ANN預測模型對I期病人同樣有著較高的預測準確度和特異度,說明了ANN預測模型的普適性,不受TNM分期的影響。但預測結果敏感度相對較低,不能排除測試樣本的總陽性數量偏少所致,在以后的研究中可以增加研究樣本數量以求得更精確的效果。
本研究的結論提示人工神經網絡相比傳統lo‐gistic回歸在胃癌預后方面有著更好的的準確性,但在醫學生存分析領域,并不能說明人工神經網絡可以完全替代傳統logistic回歸、Cox回歸等經典回歸方法,但人工神經網絡的優勢在于處理復雜的非線性關系、較好的容錯率、可學習性和適應性強等。故筆者認為,在目前的研究趨勢中,人工神經網絡方法可以和傳統logistic回歸、Cox回歸等經典回歸方法相互補充,進一步提高惡性腫瘤術后的預后預測。同時本研究中兩種方法的預測準確率均未達到90%以上,考慮可能由于總樣本樣偏少、對胃癌預后分析所采用的影響因素不夠完全等原因造成。在以后的研究中可以增加總樣本量及增加多個可能影響胃癌預后的獨立因素,以求達到更高的預測值,從而更好輔助臨床進行決策及干預。