李皇保,周俊,吳曉俊,趙鳳慶,閔捷
(嘉興市第一醫院 肝膽外科,浙江 嘉興 314000)
膽囊癌起病隱匿,發現時超過一半的患者已發展至TNM IV期[1],因此預后差。即使是手術后的患者,5年生存率僅有20%左右[2]。對預后的準確判斷是制定術后后續治療方案的重要條件,因此患者預后情況評估方法的可靠度和準確性至關重要。TNM分期雖然可以對治療進行指導,但是它納入的危險因素僅有腫瘤侵犯范圍、淋巴結轉移、遠處轉移等,對預后預測的準確性不足,且無法實現可視化及個體化應用[3]。
列線圖是一個能綜合分析預后危險因素從而進行可視化、個體化評估的方法[3]。但是在膽囊方面,目前僅發現少量的相關研究[4-6],而且由于數據結構及適用范圍的原因,這些研究的局限性均較大。本研究提取SEER(Surveillance,Epidemiology,and End Results Program)數據庫中膽囊癌患者的臨床病理數據,評估影響預后的危險因素,并在此基礎上建立列線圖,從而為臨床醫師對膽囊癌預后判斷及治療提供參考。
使用SEER*stat軟件從數據庫提取數據,提取條件為“發病部位:膽囊;診斷年份:2004至2014年;既往無腫瘤病史,膽囊癌為首發原發腫瘤”,提取變量為“病案號、登記地址(州)、性別、年齡、種族、婚姻、診斷年份、分化等級、手術方式、區域淋巴結檢出數、區域淋巴結陽性數、腫瘤直徑、侵襲范圍、轉移情況、病理類型、TNM分期(因第六版TNM分期在數據庫中數據完整性較好,故本文TNM分期參照第六版)、疾病相關生存狀態、生存時間”。
納入標準:手術方式根據數據庫手冊選擇行膽囊根治性切除術[RX Summ-Surg Prim Site(1998+):40,50,60];既往無腫瘤病史,且膽囊癌為首發原發惡性腫瘤。診斷年份為2004至2014年。
排除標準:SEER數據庫目前更新至2014年12月,共獲得7 943例膽囊癌患者數據。為使所有患者獲得至少1年以上隨訪,排除診斷年份為2014年者;同時剔除30 d內死亡者、各變量中有缺失值者及隨訪信息不完整者的數據,獲得2004年1月至2013年12月具有完整信息的有效數據832例。
SEER數據庫記錄了美國18個州的腫瘤患者信息及隨訪信息,通過整群隨機抽樣法,選取11個州的608例患者作為訓練集,另外7個州(Connecticut,Hawaii, Iowa, New Jersey, New Mexico, Rural Georgia, San Jose-Monterey)的224例患者作為驗證集,訓練集與驗證集的特征對比詳見表1。
數據庫數據每年連續隨訪,隨訪內容包括死亡時間(精確到月)、生存狀態,其中死亡類型包括總死因死亡與疾病相關死亡,本研究采用疾病相關死亡為終止事件,隨訪時間截止為2014年12月。
統計分析應用SPSS 22.0(IBM Corporation,Armonk,NY,USA)軟件包實現。在患者基線資料中,非正態分布變量采用Mann-Whitney U檢驗,分類變量采用χ2檢驗。為使變量可納入列線圖分析,連續性變量采用X-tile軟件(Rimm Laboratory,Yale School of Medicine,New Haven,CT,USA)獲取最佳截取值轉換為分類變量[7]。壽命表法計算1、3、5年生存率,Cox比例風險回歸模型篩選影響預后的獨立危險因素。列線圖的繪制使用R語言(The R Project for Statistical Computing,Vienna,Austria)的survival包及rms包實現,變量得分使用nomogramEx包計算。列線圖的準確性通過一致性指數(C-index)及校正曲線判斷[8]。內部驗證通過Bootstrap法重復取樣1 000次自檢完成,外部驗證通過驗證集進行驗證。本研究與AJCC分期的預測能力比較采用R語言的rcorrp.cens函數實現。P< 0.05為差異有統計學意義。
通過提取SEER數據庫2004年1月至2014年12月的膽囊癌數據,42.6%(3 387/7 943)的膽囊癌診斷時為TNM IV期,接受根治手術者占49.0%(3 894/7 943)。剔除各個變量中含有缺失值的數據后共有832例患者納入研究,根據整群隨機抽樣法,608例患者進入訓練集,224例患者納入驗證集。各組的臨床病理資料詳見表1。訓練集與驗證集的基本資料差異不明顯,只有種族及遠處轉移兩個變量有統計學差異(P<0.05)。在對變量進行分組時,根據侵襲范圍繪制的Kaplan-Meier生存曲線中侵犯至膽囊肌層外結締組織以內的各組(黏膜層、肌肉固有層、膽囊肌層外結締組織)的曲線有較多重合及交叉,故將以上3組合并成“肌肉層外結締組織”組。

表1 訓練集及驗證集患者臨床病理基線資料
訓練集患者的中位疾病相關生存(disease-specific survival,DSS)期為22.07個月,術后1、3、5年DSS率為67.6%、36.8%、29.2%。多因素回歸分析提示性別、年齡、分化程度、淋巴結轉移、腫瘤直徑、侵襲范圍、遠處轉移是影響預后的獨立危險因素(P<0.05),病理類型、婚姻狀態、種族、區域淋巴結檢出數等因素與預后無統計學相關性(P> 0.05)。Cox多因素回歸分析見表2。

表2 DDS Cox多因素回歸分析
列線圖基于上述獨立危險因素繪制,見圖1,內部驗證的C-index為0.76(95%CI0.74~0.78),術后5年DSS校正曲線提示在觀察值與預測值之間有良好的一致性(圖2A)。AJCC分期的C-index為0.70(95%CI0.67~0.73),本列線圖的預測能力優于AJCC分期,兩組之間比較有統計學意義(P< 0.001)。根據各變量的相應回歸系數,由R語言nomogramEx包計算各變量相應得分,見表2,每個患者可基于列線圖或根據表2中單個變量的得分計算總分,然后根據總分在列線圖上獲取對應的1、3、5年預測生存率。例如某患者男,65歲,病理分級中分化,伴淋巴結轉移,腫瘤直徑2 cm,侵犯漿膜層,無遠處轉移,則可以通過以上各變量在列線圖“評分”線上尋找對應的得分,或直接從表2中獲取變量的對應得分,這兩種方法是等效的。根據各變量的得分計算總分為31.5+0+0+80+0+50+0=161.5,然后在“總分”線上找到161.5,做一條向下垂直線,得到該患者1、3、5年的生存率約為72%、36%、27%,該預測值的準確性為76%(C-index值)。
驗證集的中位DSS生存期為25.14個月,術后1、3、5年DSS相關生存率為71.0%、38.7%、30.5%。外部驗證C-index為0.73(95%CI0.68~0.78),以5年生存率為例,外部驗證與訓練集的一致性較好(圖2B)。

圖1 DSS列線圖(pDSS:預測疾病相關生存率)

圖2 列線圖校正曲線
在本研究中,我們從SEER數據庫中提取信息完整的膽囊癌根治手術后的患者資料共832例,其中608例患者作為訓練集,224例患者作為外部驗證集。經過Cox回歸分析,我們納入7個影響預后的獨立危險因素作為列線圖的變量,經過驗證,本列線圖顯示出較高的準確度,與既往的預后評估方法(AJCC分期)相比,其優勢體現在可視化、個體化,可為個體的膽囊癌患者預后評估提供指導。
根據Cox回歸分析,我們發現性別、年齡、分化程度、淋巴結轉移、腫瘤直徑、侵襲范圍、轉移情況等是影響根治性切除術預后的獨立危險因素。其中分化程度、淋巴結轉移、腫瘤直徑、侵襲范圍、遠處轉移等因素對預后的影響已獲得廣泛認同[9-10]。在既往的研究中,性別及年齡對預后的影響存在爭議,國內的研究普遍認為性別、年齡對預后無影響[11-13],而部分國外的文獻則提示男性、高齡為危險因素[14-15],本研究提示女性的發病率雖然高于男性,但是預后好于男性,與國外的研究結論相符。另外隨著分組年齡的增加,患者預后變差,年齡對預后的影響可能來源于高齡導致的全身機能減退及其他合并癥對壽命的影響[16]。國內研究結果的差異可能與納入的病例數較少有關。
基于以上預后獨立危險因素,本研究建立了預測膽囊癌術后DSS生存率的列線圖。建立的列線圖在預測準確性上表現出色,訓練組的內部驗證和驗證組的外部驗證C-index分別是0.76和0.73,5年生存率的校正曲線也顯示列線圖預測的疾病相關生存率與實際觀察的生存率一致性較好。目前國內有一篇基于淋巴結轉移率的膽囊癌列線圖文獻,但是該文過于強調淋巴結轉移率的作用,忽略了其他影響預后的變量,而且并未進行驗證,存在較多不足[17]。通過檢索PubMed數據庫,也僅發現少量相關研究,其中兩篇研究用于評價術后放化療效果,而且第一作者為同一個研究者[5-6],一篇用于預測磁化膽囊患者中早期膽囊癌的發生情況[4]。我們根據臨床工作中易于獲取的臨床病理因素建立的列線圖彌補了以上文獻的不足,可在預后評估時發揮重要作用。
本列線圖對膽囊癌術后患者預后的預測準確性(C-index 0.76)優于傳統的AJCC分期(C-index 0.70)。傳統的AJCC分期主要基于膽囊癌侵襲深度、淋巴結轉移情況及遠處轉移情況,雖然能夠對預后及后續治療提供給指導,但是影響預后的因素還包括性別、年齡、分化程度及腫瘤直徑等,在對患者的預后評估中,應充分考慮以上因素。我們的研究也證明,在納入以上因素后,列線圖的預測準確性有所提高。而且以上因素在根治性手術患者中易于獲取,在臨床工作中具有很好的實用性。
盡管我們提供了一個準確性較高的列線圖模型,但是該模型還有以下不足。首先,其他影響預后的因素如放化療情況、靶向治療、炎癥狀態等由于數據庫本身的缺陷未納入。其次,雖然該列線圖進行了外部驗證且驗證證明一致性較好,但數據均來源于美國,如果有東方人種的數據進行進一步的驗證,可能效果更好。
綜上所述,性別、年齡、分化程度、淋巴結轉移、腫瘤直徑、侵襲范圍、轉移情況等是影響預后的獨立危險因素。基于以上因素建立的列線圖能較準確、直觀地個體化預測膽囊癌術后患者的疾病相關生存率。
感謝美國國立腫瘤研究所SEER數據庫提供的開放獲取數據。