李文樂 胡朝暉 王永輝 高森 劉鶴 覃川
作者單位:530000南寧,廣西中醫藥大學研究生院 (李文樂、高森);545000廣西,柳州市人民醫院脊柱外科(李文樂、胡朝暉、王永輝、覃川);541001廣西,桂林醫學院附屬醫院脊柱外科 (劉鶴)
脊索瘤 (chordoma) 是一種罕見且生長緩慢的間葉性腫瘤,起源于胚胎脊索殘留物。整體發病率為萬分之一,以男性為主 (2∶1,男∶女)[1-2],占所有骨惡性腫瘤的 1%~4%[3]。脊索瘤好發于中樞骨,最常見的部位是骶骨 (50%~60%)、蝶枕區(25%~30%)、頸椎 (10%) 和胸、腰椎 (5%)[4]。但是脊索瘤經常被誤認為是一種低到中等級別、生長緩慢的腫瘤,這可能會導致人們錯誤地認為它們是相對良性的腫瘤,由于它們傾向于以破壞性和侵入性的方式生長,根治性切除即使對經驗豐富的外科醫生也具有挑戰性[5]。脊索瘤有很強的局部復發傾向,但超過 30% 的脊索瘤患者發生轉移通常發生在自然病程較晚的時間,10年相對生存率在 50%~60%[6-7]。
脊索瘤治療的主要手段是根治性手術切除和輔助的放療[8-10],一項 30年單機構的回顧性分析表明,采用手術切除和輔助放射治療相結合的方法,可以使原發性的腫瘤或首次局部復發腫瘤的患者獲得良好的總體生存率、局部無復發生存率和遠處無復發生存率[11]。脊索瘤侵襲程度越大,預后越差,這可能使死亡或復發的風險增加約 5.1倍[12],根治性切除的患者與次全切除的患者相比,從手術到局部復發的時間差異有統計學意義[13]。目前研究認為,脊索瘤尚無有效的藥物治療方法,并且化療并不適用于多數脊索瘤的治療,僅適用于部分的去分化脊索瘤患者[9,14]。
就目前研究來看,預測單個患者的生存率依然存在困難,更準確的個體預測勢在必行[12]。脊索瘤是一種非常罕見的疾病[1],評估預后因素的研究應該有相對較大的樣本量,以確保足夠的統計能力。然而,這通常很難從單個機構獲得。SEER (the surveillance,epidemiology,and end results) 數據庫由美國國家癌癥研究所支持,自 1973年以來一直提供有關腫瘤病例的統計信息,為更好地了解脊索瘤提供了機會,它從 17個基于人群的癌癥登記收集發病率和存活率數據,約占美國人口的 26%[15]。
Nomogram是一種圖形工具,旨在快速近似復雜的計算,而不需要計算機或計算器,是 19世紀發明的,在計算器和計算機變得容易獲得之前就蓬勃發展了[16]。相較于常規預后因素分析相比,如回歸分析、相關性分析等,Nomogra通過綜合各種重要因素,提供了對事件概率的個性化估計,因為它可以為臨床醫生預測生存率提供清晰的圖像,從而可以在臨床治療過程中作出對于治療更有價值的決策[17]。本研究基于 SEER數據庫,構建脊索瘤的預測模型并進行驗證,為臨床醫生和脊索瘤患者進行幫助。
本研究基于 SEER數據庫的脊索瘤患者臨床數據。通過 SEER* Stat軟件檢索 SEER數據庫中病理診斷為脊索瘤的患者,使用國際腫瘤學組織學分類第 3版 (ICD-O-3) 代碼 9370~9372進行識別,其中包括未另行指定的脊索瘤、軟骨樣脊索瘤和去分化脊索瘤。
1.納入標準:(1) 2004~2015年,我院診斷為脊索瘤患者 (ICD-O-3/ WHO 2008形態學編碼為 9370);(2) 臨床資料完整者 (包括:診斷時的年齡、性別、種族、確診年份、原發部位、腫瘤體積、腫瘤擴展情況、遠處轉移情況、腫瘤轉移情況及相關資料信息等);(3) 隨訪資料完整者。
2.排除標準:(1) 隨訪資料不完整者;(2) 有其它原發腫瘤者;(3) 分化程度、分期、腫瘤直徑、人種以及婚姻狀態信息缺失者。
所有數據均來自 SEER數據庫。利用 SEER數據庫中使用患者數據不需經患者同意的特性,使用軟件 SEER* STAT (8.3.5版) 提取 2004~2015年脊索瘤患者數據。
本研究使用統計軟件 SPSS 21.0、Graph Pad Prism 8和 R version 4.02軟件進行數據統計分析。
對入選病例進行生存分析:采用 Kaplan-Meier法計算生存率并繪制生存曲線,展示各個因素對于脊索瘤患者生存率的影響,偏差評定采用對數秩和檢驗。通過 R軟件,以 7∶3的比例進行隨機分組,建立建模組 (n=420) 與驗證組 (n=177),采用單因素和多因素 Cox比例風險模型計算建模組的危險比 (HR) 和 95% 可信區間 (CI),并確定預后因素與生存率之間的關系。通過建模組構建了預測 3年和5年生存率的 Nomogram,并使用 C-index指數對其一致性進行了測試,驗證組對其進行外部測試。患者年齡分為 3組:< 30歲組,30~60歲組,> 60歲組。手術類型編碼由訓練有素的編碼員提取,用于對手術切除范圍進行分類。手術被分為 3組:未手術組 (no surgery)、單純切除組 (subtotal resection)、根治性切除組 (radical resection)。P值 < 0.05被認為差異有統計學意義。
本研究共納入 597例。通過 R軟件進行隨機拆分后,訓練組n=420例,驗證組n=177例,且P均 > 0.05,提示訓練組與驗證組差異無統計學意義。表 1顯示了患者的人口學和臨床病理特征。在患者年齡分布上,12.1% 的患者 < 30歲。在人種分布中,白人占了絕大多數,85% 以上。男性患者相較女性患者也更多。在腫瘤原發部位中,頭面部以及盆腔和骶尾部較脊柱部位高,單發的腫瘤占了大多數,22% 的患者出現了遠端轉移。大部分患者都進行手術治療,17% 左右的患者未進行手術治療,使用放療的患者占總數 12% 左右。
1.Kaplan-Meier分析:采用 Kaplan-Meier分析(圖 1),脊索瘤患者在 3年和 5年生存率分別為81.8%、73.1%。經對數秩檢驗,年齡 (P< 0.001)、腫瘤分期 (T,P< 0.001;N,P< 0.001,M < 0.001)、是否放療 (P< 0.0001)、腫瘤擴散范圍 (P< 0.05)、腫瘤大小 (P< 0.0001)、種族 (P< 0.05)、原發腫瘤數量 (P< 0.05) 和部位 (P< 0.001) 及手術切除范圍 (P<0.0001) 與生存率有關。創建 Kaplan-Meier曲線,對數秩檢驗表明,年齡 > 60歲、M1、腫瘤大小 ≥10 cm、遠處轉移、多發腫瘤、未手術切除與較差的生存預期有關。

圖1 患者的生存率 Kaplan-Meier曲線 Kaplan-Meier根據年齡 (age)、是否放療 (radiation)、腫瘤擴散范圍 (extension)、種族(race)、腫瘤大小 (tumor size)、疾病分期 (TNM)、腫瘤發生數量 (Number of tumor origin)、腫瘤原發部位 (prima site) 和手術切除范圍(surgery site) 來評估脊索瘤患者的存活率Fig.1 Kaplan-Meier curve of patients’ survival Kaplan-Meier was used to evaluate the survival rate of patients with chordoma based on age,radiation,extension,race,tumor size,TNM,number of tumor origin,primary site,and surgery site
2.單因素和多因素 Cox分析結果:采用 Cox回歸模型進行單因素和多因素分析。對這些變量的初步分析結果匯總于表 2。單因素 Cox中P值若 <0.05,代表該因子與患者預后相關;多因素 Cox分析結果中,若P值 < 0.05時,代表該因子是影響患者預后的獨立因素。
單因素 Cox分析顯示,年齡 > 60歲 (P< 0.0001,HR 7.177,95%CI2.628~19.604)、原發腫瘤位于脊柱 (P< 0.01,HR 2.035,95%CI1.278~3.241)、腫瘤分期 T2 (P< 0.0001,HR 2.218,95%CI1.489~3.304),M1 (P< 0.0001,HR 5.616,95%CI2.714~11.619)、手術方式 (全切除,P< 0.0001,HR 0.241,95%CI0.167~0.396;根治性擴大切除,P< 0.0001,HR 0.257,95%CI0.15~0.385)、是否放療 (P< 0.05,HR 0.605,95%CI0.411~0.88)、腫瘤 ≥ 10 cm (P<0.0001,HR 2.407,95%CI1.495~3.874)、遠處轉移(P< 0.05,HR 1.765,95%CI1.2~2.594) 和腫瘤原發的部位與數量 (P< 0.05,HR 1.647,95%CI1.112~2.441) 是影響脊柱脊索瘤患者生存率的預后因素。
進一步進行 Cox多因素分析用于評估這些變量對脊索瘤的影響,結果顯示:年齡 > 60歲 (P<0.001,HR 5.723,95%CI1.988~16.474)、M1 (P<0.001,HR 4.121,95%CI1.834~9.257)、手術方式 (全切除,P< 0.01,HR 0.416,95%CI0.236~0.732;根治性擴大切除,P< 0.0001,HR 0.251,95%CI0.143~0.442是獨立預后因素。
3.Nomogram分析及預測能力驗證:最后,根據患者年齡、種族、原發部位及數量、腫瘤分期(TNM)、手術方式、是否放療、腫瘤轉移和腫瘤大小建立并解釋了 Nomogram (圖 2) 來預測患者 3年、5年的存活率。在使用 Nomgarm時,每位患者的分值位于每個變量軸上,向上畫一條線來確定每個變量值的接收點數。這些數字的總和位于總分數點的數軸上,并向下繪制一條向下到生存軸的線,從而預測患者 3年和 5年生存的可能性。在建模組內部驗證中,C指數為 0.774 (95%CI0.676~0.872),通過驗證組進行外部驗證,C指數為 0.778 (95%CI0.632~0.928),圖 3~4曲線擬合度較好,說明模型具有較好的預測能力。本研究結果顯示年齡 >60歲、白種人、腫瘤分期為 NX、M1以及未做手術是降低患者生存率的主要因素。

圖2 預測 ES患者 3年、5年生存率 Nomogram預測脊索瘤患者生存率的 Nomogram。(在使用 Nomgarm時,單個患者的分值位于每個變量軸上,向上畫一條線來確定每個變量值的接收點數。這些數字的總和位于總分數點的數軸上,并向下繪制一條向下到生存軸的線,從而預測患者 3年和 5年生存的可能性)Fig.2 3-year and 5-year survival rates of ES patients predicted by nomogram Nomogram predicting survival rates of chordoma patients (the individual score was on each variable axis,and a line was drawn upward to determine the number of receiving points for each variable value.The sum of these numbers was placed on the number line of the total score,and a line was drawn downward to the survival axis to predict the likelihood of survival at 3 and 5 years)

表1 患者人口統計和臨床特征Tab.1 Demographic and clinical characteristics of patients

圖3 C-index圖用于預測患者 3年生存期的校準曲線。Nomogram-預測的總體生存概率是在 x軸上繪制的;實際的總體生存概率是在 y軸上繪制Fig.3 C-index Calibration curves predicting 3-yearsurvival rates.Nomogram:overall survival probability was plotted on the X-axis;actual overall probability of survival was plotted on the Y-axis

圖4 C-index圖用于預測患者 5年生存期的校準曲線。Nomogram-預測的總體生存概率是在 x軸上繪制的;實際的總體生存概率是在 y軸上繪制Fig.4 C-index Calibration curves predicting 5-yearsurvival rates.Nomogram:overall survival probability was plotted on the X-axis;actual overall probability of survival was plotted on the Y-axis
本研究建立了一個預后模型預測脊索瘤患者生存率。目前對于預測因子的篩選尚存在爭議,主流篩選方式有:(1) 基于文獻報道;(2) 基于統計學方法;(3) 基于醫學認識[18]。筆者考慮到 Nomogram應更加便捷的服務于臨床工作和數據可靠性,閱讀脊索瘤相關文獻以及臨床報道,在 SEER數據庫中篩選出數據較為完整且臨床容易獲得的相關預后因素,建立了共計 12個預后因素的 Nomogram,包括年齡、性別、種族、原發部位及數量、腫瘤分期(TNM)、手術方式、是否放療、腫瘤轉移和腫瘤大小。在模型中,≤ 60歲患者的預后明顯好于 >60歲的患者。此外,手術切除可以顯著改善預后。預測的總體生存概率是在 x軸上繪制的;實際的總體生存概率是在 y軸上繪制的。此外,臨床醫生還可以使用 Nomogram來預測每位患者的生存率,以進一步指導臨床治療。在使用 Nomogram時,每位患者的分值位于每個變量軸上,向上畫一條線來確定每個變量值的接收點數。這些數字的總和的分數位于總分數軸上,并向下繪制一條向下到生存軸的線,以確定 3年、5年生存的可能性。本研究建立的Nomogram的 C指數為 0.778,說明該 Nomogram的校準是相對準確的。因此,該 Nomogram具有較高的預測患者生存時間的能力。通過驗證組的 C-index曲線 (圖 3~4) 顯示實際存活率與預測存活率密切相關,說明本研究建立的 Nomogram具有比較強預測能力,可以準確預測存活率,該 Nomogram具有潛在的臨床價值。相關研究發現,年齡 > 60歲的患者預后較差,與本研究結論一致[19]。對這些結果可能的解釋是,基于年齡的因素,年齡較大的患者可能會有更多的并發癥,臨床醫生更加傾向于保守的治療方式。

表2 患者生存率的單因素和多因素 Cox回歸分析Tab.2 Univariate and multivariate survival rates of Cox regression analysis
本研究中,是否手術也被確定為獨立的預后因素。對于改善生存率而言,手術治療優于非手術治療,差異有統計學意義 (P< 0.0001)。在手術治療方面,有多篇文獻報道,與未接受手術的患者相比,接受手術切除的脊索瘤患者的存活率更高[20-22]。對于手術方式選擇上,脊索瘤的位置通常毗鄰血管和神經,這給寬切緣手術切除帶來了極大的困難[12,16-17]。
鑒于腫瘤很難完全切除,本研究結果顯示根治性切除組的生存率高于單純切除組和未手術組。有報道手術切緣不足與局部復發有很強的關系,充分的手術切除可以顯著提高生存率[20,23]。有相關研究證明切緣陰性的整塊切除是長期預后的決定因素[24],更加徹底的手術對于患者長期療效具有肯定的價值。大約1/ 4的脊索瘤病例在被發現時已經出現轉移[25],本研究的結果 M1期出現遠端轉移及 NX期淋巴結無法評估對于患者預后有較差影響,佐證了這些研究表明遠處轉移與存活率降低有關[26-27]。本研究發現發生在脊柱的脊索瘤預后較差,此前也有相關研究報道,脊柱脊索瘤相對其它部位的患者存活率更低[26]。
在單因素及多因素 Cox分析中,檢驗甄別出的有統計學意義的影響因素存在差異,如原發部位、T2、放射治療、腫瘤大小等。出現這種情況,最常見的因素有兩點:(1) 多因素回歸自變量個數太多,樣本量不夠,建模失敗;(2) 存在著混雜變量。脊索瘤作為一種罕見的疾病,病例數據收集是比較困難的。既往的脊索瘤回顧性研究包括各種不同的原發性和復發性疾病患者,其相似而又不同的治療方案,包括手術或放療,考慮到單純手術的局部控制率很低以及放療研究中改善局部控制率的建議,在這些患者中提供輔助放療似乎是合理的,這些研究認為骶骨脊索瘤在具有進行放療似乎可以提高疾病的局部控制率[14,28-29]。但是,SEER數據庫中并沒有太多詳細的放療記錄,本研究的結果顯示是否放療對患者預后影響有限,因此對于脊索瘤患者放療的研究還需更加深入。
本研究有一定的局限性。首先,本研究是回顧性隊列研究,可能會導致不可避免的選擇和歸因偏差。其次,SEER數據庫只顯示是否進行了手術或放療,但沒有提供切緣狀況和術后腫瘤復發的情況。第三,SEER數據庫遺漏了一些關于患者合并癥和其它輔助化療的詳細信息。第四,SEER數據庫基于北美人群收集,中國人種構成與之差異較大。第五,因為筆者無法訪問其它數據來源,沒有進行外部數據來驗證測試本研究 Nomogram的校準。因此,在將該模型應用于臨床之前,須進行正式的外部驗證。在未來考慮收集國內的脊索瘤數據并加以更新本研究的 Nomogram。
該研究的 Nomogram可以更準確地預測脊索瘤患者的預后。本研究結果顯示表明:年齡 > 60歲和不手術是顯著縮短脊索瘤患者生存時間的主要危險因素。