曲南坤,梁 爽,孔啟超,姚安琪,朱思淵,王伏生△
(1.山西醫科大學第二臨床醫學院,太原 030000;2.山西醫科大學第二醫院乳腺外科,太原 030000)
乳腺癌(BC)是世界范圍內最常見的女性惡性腫瘤,其在全世界范圍內具有較高的發病率和病死率[1],而三陰性乳腺癌(triple-negative breast cancer,TNBC)不表達雌激素受體(ER)、孕激素受體(PR)和人表皮生長因子受體2(HER2),發病率占全部侵襲性乳腺癌10%~20%[2]。盡管發病率低,但相較于其他類型的乳腺癌來說,TNBC的復發率高,預后較差[3-4]。據國內外的相關文獻報道[5-6],TNBC相較于其他類型的乳腺癌,缺少有效的藥物治療靶點,因此,其治療效果欠佳,預后生存率也相對較低。近年來,TNBC治療的臨床研究取得了較好的成就,其治療后的生存時間也越來越長[7]。為了改善患者的生存質量、延長患者的生存時間及提高醫療資源的利用率,如果通過常規的臨床病理特征能夠比較準確地評估TNBC患者的生存時間,可以為臨床醫生及患者家庭提供一個良好的參考。列線圖是納入了多種對預后生存具有影響的因素而建立,其可以對這些影響因素進行量化,將結果客觀地展現出來,從而達到精準預測患者預后生存時間的效果[8-9 ]。
美國國立癌癥研究所的SEER數據庫從美國約28%的人口中收集癌癥患者的發生率和生存數據,提供了多樣且可靠的TNBC患者的數據[10]。目前對TNBC的預后模型報道相對較少。本研究通過篩選SEER 數據庫中TNBC患者數據繪制預測TNBC患者3年總生存率的列線圖,以預測 TNBC 患者的生存預后情況,為個體化治療提供依據。
建模組病例為來源于美國國立癌癥研究所的SEER數據庫2010年1月1日至2015年12月31日入庫的TNBC患者,通過SEER*Stat 8.3.6 軟件獲取數據。驗模組為山西醫科大學第二醫院乳腺外科2016年1月1日至2020年12月31日期間初診為TNBC的患者。病例納入標準:(1)病理診斷為TNBC;(2)性別為女性;(3)患者一般臨床病理信息完整。排除標準:(1)存在多原發腫瘤;(2)信息缺失患者。
從SEER數據庫和山西醫科大學第二醫院中提取患者的協變量包括年齡、種族、婚姻狀況、TNM分期、手術情況、組織學分級、放化療情況、生存時間、生存狀態情況等信息。共篩選出17 819例(建模組17 621例及驗模組198例)符合要求的病例。
使用Kaplan-Meier方法進行生存分析,log-rank 法分析比較建模組中TNBC患者的生存預后。通過單因素和多因素的Cox比例風險回顧模型確定與TNBC患者總生存率有關的獨立危險因素,并使用R-studio將模型可視化繪制列線圖。使用“rms”函數計算C指數(C-index)及校正值,用于評估列線圖的預測效果,同時繪制受試者工作特征(relative operating characteristic,ROC)曲線與校正曲線,并采用 Bootstrap 法分別在建模組和驗模組進行內部與外部驗證。C指數及ROC曲線下面積(AUC)用來評估殘線圖的預測價值。C指數越大,對預后效果預測越準確。C指數的最大值為1,表示100%的預測精度,最小值為0.5[11]。以P<0.05為差異有統計學意義。
本研究共收集到17 819例TNBC 患者,其中建模組17 621例,驗模組198例。建模組和驗模組患者的一般資料情況見表1。兩組患者中位隨訪時間分別40.8和38.4個月。

表1 建模組和驗模組一般資料情況[ n(%)]

續表1 建模組和驗模組一般資料情況[ n(%)]
將表1中的建模組所有變量納入Cox比例風險模型進行多因素分析。納入因素包括年齡、種族、婚姻狀況、組織學分級、T分期、N分期、M分期、手術情況、放療、化療情況。結果顯示:患者的年齡大于或等于65歲、黑種人、未婚、組織學分級(中、高分化)、T分期(T2~T4)、N分期(N1~N3)、M1分期、未手術治療、未放化療均為TNBC 3年總生存率的獨立危險因素(P<0.05)。見表2。

表2 影響建模組17 621例TNBC患者3年總生存率的多因素分析

續表2 影響建模組17 621例TNBC患者3年總生存率的多因素分析
根據多因素分析的結果,將Cox比例風險回歸模型中差異有統計學意義的預后影響因素納入(包括年齡、種族、婚姻狀況、組織學分級、T分期、N分期、M分期、手術情況、放化療情況),使用R軟件構建列線圖,根據TNBC患者每一項臨床病理特征向上投射到小標尺(分值)即可得出該患者每一項的分值,將各項分值相加得到總分值,總分值越高,生存預后越差,3年總生存率越低。對TNBC患者3年及5年總生存率的預測結果見圖1。

圖1 列線圖對TNBC患者3年、5年總生存率的預測結果
通過R studio計算建模組和驗模組的C指數分別為0.793(95%CI:0.785~0.801)和0.857(95%CI:0.799~0.915),校正后的C指數分別為0.792、0.774,提示其具有良好的預測價值。接著使用“survival”函數計算出每項獨立危險因素的風險評分,并繪制出ROC曲線(圖2A、B),建模組AUC為0.774,驗模組的AUC為0.847,提示該預測模型對TNBC患者3年總生存率具有良好的評估能力。最后采用Bootstrap法對列線圖進行內部(建模組)驗證及外部(驗模組)驗證,自抽樣本量B=1 000,驗證結果顯示,建模組與驗模組3年總生存率的校正曲線(圖2C、D)均靠近理想的45°參考線,預測值和實際結果高度擬合,提示預測效果準確。
根據Cox比例風險回歸分析結果,使用Kaplan-Meier 對相關因素內部進行生存分析,結果顯示:年齡、種族、婚姻狀況、T分期、N分期、M分期、組織學分級、手術情況、放化療情況是TNBC患者生存的影響因素(P<0.05),見圖3。

A:建模組患者3年生存的ROC曲線;B:驗模組患者3年生存的ROC曲線;C:建模組患者的3年總生存率校正曲線;D:驗模組患者的3年總生存率校正曲線。
近年來國內外乳腺癌的發病率和病死率呈上升趨勢[12-13 ]。而與發達國家比較,我國乳腺癌發病率已成為國內發病率最高的惡性腫瘤[14]。相較于其他類型的乳腺癌,TNBC具有分化差、組織學分級高、復發和轉移率高等特點[15-16],了解TNBC的臨床特點和術后生存的關聯有助于術前患者選擇和預后判斷。本研究基于SEER數據庫,構建了一個客觀的列線圖,對患者的3年及5年總生存率能夠做出較為準確的預估,對醫患雙方病情管理的合理性有進一步提升,對臨床決策有著重要的意義。
本研究分析了多種可能影響預后的因素。結果顯示,年齡、種族、婚姻狀況、T分期、N分期、M分期、組織學分級、手術情況、放化療情況是患者3年總生存率的影響因素。因此,筆者結合國內外研究結果對本研究結果進行分析:年齡和種族是TNBC 3年總生存率的危險因素,而不同種族的TNBC生存率差異可能是社會經濟[17]、地理環境、基因組學、蛋白質組學[18]、表觀遺傳學[19]等因素造成。已有研究顯示,年齡是乳腺癌發生發展的重要因素,目前化療是TNBC主要治療措施,其中老年患者藥物耐受性差及合并基礎疾病,易發生各種藥物不良反應且對藥物的選擇具有局限性[20]。本研究結果提示年齡越大,患者生存預后也越差,這與其他研究基本一致[21]。
婚姻狀況會影響患者的預后[22-23]。本研究結果顯示,已婚狀態與未婚相比,已婚的危害風險是未婚的0.81倍,根據經驗,筆者認為這可能與婚姻狀況通過對患者內分泌的影響進而影響患者的預后。
腫瘤的分期和病理特征是影響患者預后的關鍵因素。多因素Cox分析結果顯示,腫瘤的T分期、N分期和M分期為TNBC不良預后的影響因素,與患者的預后呈負相關。在一般研究中,隨著 TMN 分期的進展,患者的預后明顯降低,這些是評價乳腺癌預后的指標,也是評估和治療的關鍵參考指標,但僅僅只有腫瘤的分期和病理不能準確預測患者的預后,這也是本研究構建列線圖的動機之一。
據報道顯示[24-25],在TNBC患者中,手術切除后接受放化療對患者具有較高臨床價值,LOI等[26]發現,TNBC患者接受輔助化療對改善預后有較高價值。而近年來,新輔助化療已逐漸成為首選的全身治療方法,尤其是在淋巴結陽性的TNBC患者中。在TNBC中,美國新輔助化療的使用比例從2010年的19.5%增加到2015年的33.7%。對接受新輔助化療的患者進行的meta分析顯示,在手術中達到病理完全緩解(pCR)的患者,接受新輔助化療對其長期生存狀況有所改善,本研究也得到類似的結果(P<0.05)[25]。因此,針對此類患者采取個體化精準診療,可望提高其生存率。
本研究的創新在于運用大數據分析TNBC的風險因素,構建TNBC的生存模型并采用多種方法驗證,對臨床醫師的診療和分析患者的轉歸提供了證據支持。本研究的不足之處在于:(1)排除了一些隨訪缺失的病例,可能導致預測結果的偏差;(2)TNBC的診療是多階段、全身性的治療過程,如果能納入腫瘤標記物、家族史、月經史、生育情況、基因組狀態、身體質量和吸煙這些信息和干預措施,模型的預測準確性也許能進一步提高。此外本研究結論有待國內數據進一步佐證。
綜上所述,年齡、婚姻狀況、TNM 分期、組織學分級、手術情況、化療和放療是影響TNBC預后的獨立影響因素,以此為基礎構建TNBC預后風險模型并進行驗證,為臨床對TNBC患者預后判斷提供了證據支持。