章銳,阮劍,趙建國
乳腺癌是全世界女性中最常見的惡性腫瘤,也是導致癌癥死亡的第2 大原因[1],從1976 年至2009年,50 歲以下女性乳腺癌的發病率以每年0.2%的速度增長,而在被確診為乳腺癌的病人中,遠處轉移的發病率則以每年約2%的速度增長[2]。各期乳腺癌的5 年相對生存率為89.7%,而晚期乳腺癌的預后較差,5 年生存率僅為26.9%[3]。晚期乳腺癌包括遠處轉移和局部晚期乳腺癌,目前遠處轉移性乳腺癌仍然是無法治愈的疾病,激素受體陽性并且人表皮生長因子受體2(Her-2)陰性的晚期乳腺癌比其他類別的晚期乳腺癌具有更好的生存率[3-4],但是晚期乳腺癌(遠處轉移性乳腺癌)個體化的預后并不明確。
列線圖是一個能綜合分析預后危險因素,從而進行可視化、個體化評估的方法,目前被廣泛用于各種類型的癌癥[5-6],但是在遠處轉移性乳腺癌方面,僅發現極少量的研究。本研究基于SEER(The Surveillance,Epidemiology,and End Results)數據庫首次較好地建立遠處轉移性乳腺癌的預后列線圖,根據SEER 數據庫中遠處轉移性乳腺癌病人的臨床病理資料,以確定該模型可以較為準確地預測病人的存活率,從而為臨床醫師對遠處轉移性乳腺癌預后判斷及治療提供參考。
1.1 數據資料獲取使用SEER*stat 軟件從數據庫中提取數據,提取條件為“(1)發病部位:乳腺;(2)性別:女性;(3)診斷年份:2010—2012 年;(4)既往無腫瘤病史”,提取變量為“病人ID、生存時間、生存狀態、年齡、種族、婚姻狀態、組織學分級、原發灶是否手術、雌激素受體(ER)狀態、孕激素受體(PR)狀態、Her-2狀態、第七版美國癌癥聯合委員會(AJCC)T 分期、第七版AJCC N 分期、有無骨轉移、有無腦轉移、有無肝轉移、有無肺轉移”。本研究符合《世界醫學協會赫爾辛基宣言》相關要求。
1.2 納入、排除標準納入標準:為保證所有病人均隨訪5 年以上,選擇診斷年份為2012 年前的乳腺癌;遠處轉移數據庫中SEER combined mets at DXbone/brain/liver/lung(2010+)為2010年后的乳腺癌。共獲得臨床資料完整的139 584 例女性乳腺癌病人。排除標準:生存時間為0,無遠處轉移。獲得2010 年1 月至2012 年12 月具有完整臨床信息的有效數據3 989例。
1.3 數據分組通過整群隨機抽樣法[7],以3∶1 分組,從3 989 例病人選2 993 例為建模組,996 例為驗證組。
1.4 統計學方法采用SPSS 25.0 統計分析危險因素,變量分組計數后采用χ2檢驗,多變量分析采用Cox 比例風險回歸模型篩選影響預后的獨立危險因素,按照文獻[5-6]中的方法基于多變量分析的結果使 用R 版 本3.6.2(https://www.r-project.org/)中 的“rms”包和“survival”包繪制列線圖。列線圖的準確性通過C 指數和校準曲線進行衡量,C 指數越大(接近1),預后預測越準確。內部驗證通過Bootstrap 法重復取樣1 000 次自檢完成,對列線圖的外部驗證通過驗證組進行驗證。受試者工作特征曲線(ROC曲線)下面積用于評估模型預測遠處轉移性乳腺癌預后的準確性。P<0.05被認為差異有統計學意義。
2.1 兩組的臨床病理資料兩組臨床病理資料差異無統計學意義(P>0.05),見表1。
2.2 Cox 比例風險回歸分析分析提示年齡、婚姻狀態、種族、組織學分級、ER 狀態、PR 狀態、Her-2狀態、T 分期、原發灶是否手術、骨轉移、腦轉移、肝轉移、肺轉移是影響預后的獨立危險因素(P<0.05),其中相對于年輕(<35歲),年老(>49歲)是遠處轉移性乳腺癌病人預后的危險因素(P<0.05);Her-2陰性相對于Her-2 陽性是預后的危險因素(P<0.05);原發灶手術相對于原發灶不手術具有更低的風險比(P<0.05);N 分期與預后相關性差異無統計學意義(P>0.05)。Cox單因素和多因素回歸分析見表2。
2.3 遠處轉移性乳腺癌生存預后列線圖及其內/外部驗證基于Cox 比例風險回歸分析繪制列線圖,見圖1。內部驗證的C指數為0.702[95%CI:(0.696,0.708)],遠處轉移性乳腺癌校準曲線提示在觀察值與預測值之間的一致性:1年和3年生存率一致性良好,5年生存率一致性較好,見圖2。外部驗證C指數為0.707[95%CI:(0.706,0.708)],1年和3年生存率外部驗證一致性良好,5年生存率一致性較好,見圖3。
2.4 遠處轉移性乳腺癌建模組和驗證組的ROC 曲線建模組和驗證組的校準圖提示該臨床預測模型在1 年和3 年的預測結果與實際觀測數據具有良好的一致性。建模組1 年、3 年、5 年的ROC 曲線下面積分別為0.8、0.7、0.7,驗證組的1 年、3 年、5 年的ROC 曲線下面積分別為0.8、0.8、0.695,也證實了該模型能夠準確預測遠處轉移性乳腺癌的預后,尤其是1年和3年預后。
隨著乳腺癌藥物治療的研究發展及相關臨床試驗的開展,乳腺癌的遠處轉移率及死亡率顯著下降,但是遠處轉移仍然是乳腺癌病人致死的主要原因[8-9],遠處轉移的預后不良,其5 年生存率約為27%,腦轉移乳腺癌病人預后最差,中位總生存時間為10 個月[95%CI:(9,12)個月][10]。乳腺癌的隨訪研究不僅能及早發現復發及轉移,并且能從中不斷總結經驗,完善診治。SEER 數據庫涵蓋了大約28%的美國人口的癌癥治療隨訪數據[11],該數據庫中獲得的研究數據代表了該人群的流行病學狀況,在癌癥監測科學以及收集、分析、解釋和傳播可靠的基于人口的統計數據方面處于國家領導地位。SEER 數據庫收集的癌癥數據中免疫組化從2010年開始錄入,癌癥結局包括死亡與否以及死亡原因,對研究復發、轉移或進展有限制,但該數據庫對預后研究具有較大的指導意義。
據文獻報道,晚期乳腺癌的預后與以下變量有關:腫瘤的分型、年齡[12]、生理機能、轉移的器官、全身化療、原發灶手術切除、原發灶的大小、孤立轉移/多發轉移,因此此次模型建立時納入了在晚期乳腺癌的生存方面存在差異的因素。在文獻中,年齡<50 歲較>50 歲,局部無復發生存更高,>65 歲是晚期乳腺癌生存的不利因素[12]。在本研究中證實年齡同樣是晚期乳腺癌預后的重要因素,較大年齡(>49歲)是轉移性乳腺癌的危險因素,而在早期乳腺癌
復發風險分層中,<35 歲作為復發的危險因素之一,此次研究側重于轉移性乳腺癌的預后分析,雖然年輕病人復發轉移概率較高,但其對后期治療的耐受性更好,年齡越大(>49 歲)出現治療不能耐受的可能越大,所以其預后更差。Her-2 陽性乳腺癌的預后優于三陰性乳腺癌[4,13],Her-2 陽性晚期乳腺癌的4 年總生存為31%~70%[14],三陰性晚期乳腺癌的中位生存時間僅為18~25個月[15],我們分析發現Her-2陽性遠處轉移性乳腺癌病人預后優于Her-2 陰性遠處轉移性乳腺癌[16],可能得益于Her-2 陽性乳腺癌靶向治療的多樣性、有效性、安全性[17-19]。我們構建了預測遠處轉移性乳腺癌生存預后的列線圖,列線圖通過建模組的內部驗證和驗證組的外部驗證,并且通過校準和判別評估性能。校準曲線是用于評估列線圖的估計風險和觀察風險之間的一致性,保證所建立的列線圖的可靠性。在遠處轉移性乳腺癌預后列線圖的部分文獻中報道其C 指數<0.700[13],而本研究列線圖的內部驗證和外部驗證的C 指數分別是0.702 和0.707,高于之前的研究,并且3 年生存率的校準曲線顯示生存一致性良好,表明列線圖對轉移性乳腺癌具有很高的預測能力,而5年生存率的校準曲線一般的主要原因在于遠處轉移性乳腺癌病人(肝、肺、腦轉移)5年生存率極低。

表2 建模組2 993例遠處轉移性乳腺癌病人預后影響因素Cox單因素和多因素回歸分析

圖1 遠處轉移性乳腺癌預后列線圖

圖2 建模組遠處轉移性乳腺癌1年(A)、3年(B)、5年(C)預測生存的校準曲線

圖3 驗證組遠處轉移性乳腺癌1年(A)、3年(B)、5年(C)預測生存的校準曲線
盡管我們提供了一個準確性較高的列線圖模型,但是該模型仍有較多不足。因臨床資料來源于SEER 數據庫,而針對乳腺癌的化療、靶向治療、放療等關鍵性的治療方案并不能從該數據庫中獲得,所以在一致性上只能達到0.7 左右,如果能夠將乳腺癌的相關治療納入其中,可能預測效果更好。
綜上所述,年齡、種族、婚姻狀態、組織學分級、原發灶是否手術、ER狀態、PR狀態、Her-2狀態、T分期、骨/腦/肝/肺轉移是影響預后的獨立危險因素,基于以上因素建立的列線圖能較為準確、直觀地個體化預測遠處轉移性乳腺癌病人的生存率。