于 李
我國乙型肝炎病毒(hepatitis B virus,HBV)相關原發(fā)性肝癌患者的生存率低,年齡標化的5年相對生存率僅為10.1%[1]。 老齡化加劇導致老年患者比例增加,其病情復雜,治療難度大,使用現(xiàn)有癥狀評估及預后判定體系效果有限。 而中醫(yī)采用整體方式對患者進行綜合評估[2]。
人工智能(artificial intelligence,AI)旨在模仿人類認知功能,促進醫(yī)療數(shù)據的可用性及分析技術發(fā)展,但醫(yī)學疾病非線性關系特征導致其建模難度大[3],因此須采用特定的方式。 人工神經網絡(artificial neural network,ANN)是一種受人類神經突觸系統(tǒng)啟發(fā)的機器學習技術,為模擬人腦的一種算法,可推導出描述樣本特征的數(shù)據模型[4]。 近年來,ANN 在醫(yī)療領域取得諸多方面的進展[5]。 本研究旨在應用ANN 算法結合中醫(yī)證候分類建立一種有效的預測模型,用于老年HBV 相關原發(fā)性肝癌患者的預后判定。
1.1 研究對象 選擇2010年1 月—2014年12 月于北京中醫(yī)藥大學第三附屬醫(yī)院收治診斷為HBV相關原發(fā)性肝癌老年患者408 例(≥60 歲),全部患者均住院治療。 收集患者人口學、疾病史、臨床資料、實驗室及病理檢查結果等數(shù)據。 對入組患者進行5年隨訪(生存或死亡)自患者死亡時間或隨訪時間點終止,平均隨訪時間為12 個月。
患者臨床診斷依據WHO HBV 相關原發(fā)性肝癌分類診斷標準[6]。 根據“臨床研究指導原則”,5 位高年資中醫(yī)學主任醫(yī)師(具有20年以上中醫(yī)行醫(yī)經驗)以共識確定中醫(yī)證候[7]。 排除嚴重心血管、泌尿、造血等各系統(tǒng)重大疾病,以及心理障礙疾病患者。
1.2 預測變量及ANN 模型的選擇 通過應用研究特定的特征提取軟件(KNIME 2.6)從27 個可用變量中(性別、確診時年齡、身高、體重、ALT、AST、ALP、白蛋白、總膽紅素、膽固醇、甘油三酯、血糖、血清鐵、鐵蛋白、T3、T4、TSH、AFP、腫瘤大小、原發(fā)腫瘤范圍、是否淋巴結轉移、是否遠期轉移、腫瘤分化程度、是否存在門脈瘤栓、是否侵襲血管、腫瘤是否存在分隔及中醫(yī)辨證證候特征)提取出11 個(性別、確診時年齡、腫瘤大小、原發(fā)腫瘤范圍、是否淋巴結轉移、是否遠期轉移、腫瘤分化程度、是否存在門脈瘤栓、是否侵襲血管、腫瘤是否存在分隔以及中醫(yī)辨證的證候特征),表1。
HBV 相關原發(fā)性肝癌老年患者的中醫(yī)證候特征與其他年齡患者不同,根據相關研究經驗,將本研究入組的全部患者歸結為5 種主要證候,即脾虛證、肝腎陰虛證、肝膽濕熱證、肝郁氣滯證和肝血瘀阻證[7]。
采用單時間點神經網絡模型[5],其可以在任意預定時間點有效預測患者的生存概率。

表1 基于神經網絡模型用于評估患者預后的臨床特征
1.3 預測效果評價 通過計算準確度、敏感度、特異度、陽性預測值、陰性預測值及曲線下的面積(area under curve,AUC)來評估ANN 預測模型的性能。本研究中,如果事件(死亡)在所預測的時間段內未發(fā)生,則將患者分類為“存活”,否則將患者分類為“死亡”。 ROC 分析曲線的ANN 預測模型的預測精度由ROC AUC 表示。
總體AUC 的交叉驗證估計值是從5 次獨立計算所獲得的5 個測試集的平均值。 模型校準評估的預測與AUC 標準不同。 使用Hosmer-Lemeshow(HL)擬合優(yōu)度檢驗模型進行校準。 參與研究的所有受試者均根據其預測的死亡概率進行分類,分為十分位數(shù)。 然后根據在每個十分位中觀察到的與預期生存概率之間的差異,進行卡方檢驗。 對于給定的有效水平α計算χ2和P值。P>0.05 表示預測結果與實際情況生存概率之間無顯著差異。
2.1 預測結果 單一時間點模型的目標是,預測在特定時間點的死亡概率。 5 個獨立的單時間點ANN模型被用來預測1 ~5年內的死亡率。 事件(死亡)的發(fā)生被編碼為1,事件的未發(fā)生被編碼為0。 模型輸出包括數(shù)據集中每個患者的一組死亡概率評估。在給定的時間點,如果在該時間段內沒有發(fā)生死亡,則將患者分類為“生存”,否則將其視為“死亡”。 對于特定患者,根據分類規(guī)則,“死亡”意味著網絡輸出大于截止水平,如P≥0.5,否則為“生存”。
首先,對模型進行錯誤分類的評估,表2 為1~5年內預測的混淆矩陣。 ①在408 例患者中,106(76±30)例患者在1年內死亡,302(291±11)例患者在1年內存活。 該模型準確預測出291 例生存患者和76 例死亡患者,準確率為89.95%。 ②本研究結果表明,2年內模型預測死亡患者人數(shù)的準確率為85.78%。 在2年內,232(199±33)例患者死亡,176(164±12)例患者存活。 ANN 模型準確預測了199名死亡患者和164 名生存患者,準確率為88.97%。③3年內有297(266±31)例患者死亡,111(99±12)例患者存活。 該模型對266 名死亡患者和99 名生存患者進行了準確分類,準確率為89.46%。 此外,研究結果顯示4年和5年時預測的死亡患者人數(shù),并基于精度測量法對模型進行了評估,表2。

表2 1~5年內生存期的預測結果
2.2 基于5 次檢驗的5 倍交叉效度分析所獲得的平均結果對運用單時間點ANN 模型預測1 ~5年患者存活期的評估效果分析 對于1年生存期預測,ANN 模型的準確率為90.3%,靈敏度為70.7%,特異性為96.2%,表明該模型在預測患者存活率優(yōu)于對患者死亡率的預測。 其陽性和陰性預測值分別為85.2%和91.5%。 AUC 為0.96(95%CI:0.871 ~0.928),結果提示本研究建立的老年晚期肝癌患者預后預測的單時間點ANN 模型是一個比較完善的模型。 對于2年生存期預測,單時間點ANN 模型的準確率為88.9%,靈敏度為84.4%,特異性為93.2%。 陽性預測值是92.0%,陰性預測值為86.5%,表明在該模型預測的“生存”患者中,86.5%實際上存活,AUC 為0.958,表3。

表3 1~5年內生存期的預測結果的準確率、敏感度、特異度分析
近期研究表明,中醫(yī)藥在腫瘤防治的全過程中均可發(fā)揮重要作用,中醫(yī)辨證在其中起到關鍵性作用。 本研究通過中醫(yī)辨證明確患者個體的不同證候特征,并探尋其做為長期預后預測指標的可行性、應用前景及臨床價值。
本研究旨在探討是否能夠結合中醫(yī)證候數(shù)據建立一個有效的ANN 結構模型用于患者預后預測。本研究在前期工作中已比較是否包括中醫(yī)辨證分型(5 型)做為預測模型指標,而未應用中醫(yī)辨證分型(5 型)做為預測指標的模型其預測準確率僅在60%~70%之間。 同時,經權重分析證實,中醫(yī)辨證分型(5 型)的相對權重為0.085(12.6%)。 因此,本研究所探討的預測模型中增加了中醫(yī)證候指標做為預測因素。
本研究通過應用單時間點前饋ANN 模型,同時結合中醫(yī)證候用于預測老年HBV 相關原發(fā)性肝癌患者術后1、2、3、4 及5年的生存率。 本預測模型,精確度范圍為88.7%~90.2%,靈敏度范圍為70.2%~92.5%,特異度范圍為66.7%~96.2%。 本模型AUC值大于0.9,表明該模型在1 ~5年內預測老年HBV相關原發(fā)性肝癌患者的生存時間均較為準確。
本研究提出的單時間點ANN 模型能夠為患者提供生存預測。 這些信息對于臨床醫(yī)生和患者均具有一定的臨床意義及價值。 對于高死亡風險患者可能需要獲得比低死亡風險患者更為頻繁的追蹤隨訪,以便將有限的資源向高風險患者傾斜,而所獲得預后的預測結果也有利于患者規(guī)劃其術后生活。本研究收集入組的均為≥60 歲的老年HBV 相關原發(fā)性肝癌患者且為小樣本單中心研究,隨訪病例數(shù)量有限。 有待進一步深入探討該模型在其他年齡組HBV 相關原發(fā)性肝癌患者中的預測效果,同時應進行多中心長期隨訪研究。 此外,ANN 預測其他年齡問題未見國內外相關研究報道,其優(yōu)劣勢也有待進一步研究。