喻微,葉波,續力云,王兆宇,王善軍,曹捍波,陳志軍,張永奎
(1.溫州醫科大學附屬舟山醫院 胸心外科,浙江 舟山 316021;2.上海交通大學附屬胸科醫院 胸外科,上海 200030;3.溫州醫科大學附屬舟山醫院 舟山市肺癌研究中心,浙江 舟山 316021;4.溫州醫科大學附屬舟山醫院 病理診斷中心,浙江 舟山 316021;5.溫州醫科大學附屬舟山醫院 放射診斷中心,浙江 舟山 316021)
預測惡性孤立性肺結節logistic回歸診斷模型的建立
喻微1,葉波2,續力云3,王兆宇4,王善軍5,曹捍波5,陳志軍1,張永奎1
(1.溫州醫科大學附屬舟山醫院 胸心外科,浙江 舟山 316021;2.上海交通大學附屬胸科醫院 胸外科,上海 200030;3.溫州醫科大學附屬舟山醫院 舟山市肺癌研究中心,浙江 舟山 316021;4.溫州醫科大學附屬舟山醫院 病理診斷中心,浙江 舟山 316021;5.溫州醫科大學附屬舟山醫院 放射診斷中心,浙江 舟山 316021)
目的:建立一個預測孤立性肺結節惡性可能性的logistic回歸模型,為臨床診斷提供參考。方法:回顧性分析溫州醫科大學附屬舟山醫院2012年1月至2015年12月期間經胸部CT檢查發現且有手術病理證實的良性孤立性肺結節患者90例和2013年1月至2013年12月期間經胸部CT檢查發現且有手術病理證實的惡性孤立性肺結節患者122例,共計212例的臨床資料和CT影像資料。多因素回歸分析得出孤立性肺結節惡性可能性的獨立預測因素,建立logitic回歸預測模型,并用另外242例有明確病理診斷的孤立性肺結節患者驗證此logistic回歸預測模型。結果:212例孤立性肺結節患者中58%的結節為惡性,42%為良性。Logistic回歸分析顯示結節類型、邊界清楚、分葉、毛刺、胸膜牽拉征等特征在良性結節與惡性結節間差異均有統計學意義(P<0.05),是孤立性肺結節惡性的獨立預測因素。預測模型為:P=ex/(1+ex),X=-1.252-(0.741×混雜磨玻璃結節)-(3.712×實性結節)+(2.301×邊界清楚)+(1.589×分葉征)+(1.269×毛刺征)+(1.528×胸膜牽拉征),e為自然對數。此模型的靈敏度為81.8%,特異度為85.7%,陽性預測值為88.2%,陰性預測值為78.3%。結論:本研究建立的預測模型能準確評估孤立性肺結節惡性可能性,能為孤立性肺結節的臨床診斷提供依據。
logistic回歸模型;孤立性肺結節;多因素分析;獨立預測因素
Abstract: Objective:To establish a logistic regression model for predicting the probability of malignancy in solitary pulmonary nodules (SPNs) and provide guidance for the diagnosis.Methods:The clinical data and computed tomography (CT) images of 212 patients with a clear pathological diagnosis of SPNs were retrospectively analyzed from Zhoushan Hospital Affiliated to Wenzhou Medical University were analyzed retrospectively,among which, benign SPNs were collected from January 2012 to December 2015, and malignant SPNs were collected from January 2013 to December 2013. To estimate the independent predictors of malignancy of SPNs,multivariate analysis was used. A logistic regression prediction model was subsequently created. Data from an additional 242 patients with pathologic diagnosis of SPNs were used to validate this logistic regression prediction model.Results:Fifty-eight percent of the nodules from 212 SPNs patients were malignant and 42% were benign.Logistic regression analysis showed that there were significant differences in nodule type, clear border, lobulation, spiculaion, pleural retraction sign between subgroups with benign and malignant SPNs (P<0.05). Thesefactors were identified as independent predictors of malignancy in SPNs. In our model, sensitivity was 81.8%,specificity was 85.7%, positive predictive value was 88.2%, and negative predictive value was 78.3%. Conclusion:The prediction model established in this study can be used to assess the probability of malignancy in SPNs,thereby providing help for the diagnosis of SPNs.
Key words:logistic regression model; solitary pulmonary nodules; multivariate analysis; independent predictors
孤立性肺結節定義為肺內單發,圓形或者卵圓形且直徑小于3 cm的非透明病灶,該病灶周圍由肺實質包繞,并不伴有肺不張、縱膈淋巴結腫大或者胸腔積液[1]。近年由于CT的廣泛使用,孤立性肺結節的檢出率顯示出明顯增加的趨勢。在孤立性肺結節患者中,惡性結節占5%~69%,平均為40%[2-3]。惡性結節的早期診斷和治療能夠顯著提高肺癌患者的總生存率和預后。然而,孤立性肺結節通常是小的,且位于肺實質的深部,并經常有非典型的影像學表現,因此,孤立性肺結節的正確診斷還存在一定困難。以往對于孤立性肺結節的術前早期診斷基本上是基于臨床和放射科醫師的主觀經驗性預測,為了減少人為因素的干擾并提高診斷準確率,本研究通過對孤立性肺結節患者的臨床CT診斷與病理診斷進行對比分析,根據良、惡性孤立性肺結節的臨床特征和CT影像特征的差異性,建立logistic回歸模型,探討其在孤立性肺結節良惡性鑒別診斷中的應用價值。
1.1 對象 本研究納入了溫州醫科大學附屬舟山醫院2012年1月至2015年12月間經胸部CT檢查發現且有手術病理證實的良性孤立性肺結節患者90例和2013年1月至2013年12月期間經胸部CT檢查發現且有手術病理證實的惡性孤立性肺結節患者122例,共計212例,男99例,女113例,年齡21~80歲,平均(56.7±10.9)歲,該組樣本定義為建立回歸模型的訓練樣本。另外納入上海交通大學附屬胸科醫院2015年1月1日至2015年12月31日經手術病理證實的孤立性良、惡性肺結節患者242例,該組樣本定義為回歸模型的驗證樣本,其中男108例,女134例,年齡28~86歲,平均(57.1±10.3)歲。所有孤立性肺結節患者的手術方式包括肺楔形切除、肺段切除和肺葉切除,且由1名高年資病理醫師進行明確的病理診斷。
1.2 臨床和CT影像資料 收集的臨床資料包括患者性別、年齡、吸煙史、腫瘤家族史、腫瘤既往史。另由1名高年資放射科醫師收集CT影像資料,包括結節的位置、直徑、類型、邊界、邊緣、空氣支氣管征、血管集束征、胸膜牽拉征、鈣化和空洞等。
1.3 統計學處理方法 采用SPSS20.0統計軟件進行數據統計與分析。采用單因素分析法篩選出可能影響孤立性肺結節良惡性的因素,采用二分類非條件logistic回歸分析選擇獨立預測因子,并建立診斷孤立性肺結節良惡性的數學預測模型。確定合適的診斷臨界值,計算該模型診斷驗證組樣本的敏感性、特異性、陽性預測值、陰性預測值和準確率。P<0.05為差異有統計學意義。
2.1 病理診斷 在訓練組,有122例患者(占57.55%)診斷為惡性孤立性肺結節,包括腺癌113例(占92.6%),鱗狀細胞癌6例(占5.0%),大細胞神經內分泌癌2例(占1.6%),淋巴上皮瘤樣癌1例(占0.8%)。90例診斷為良性孤立性肺結節,包括錯構瘤20例(占22.2%),炎性假瘤19例(占21.1%),非特異性炎癥15例(占16.7%),硬化性肺泡細胞瘤9例(占10.0%),結核9例(占10.0%),淋巴結炎6例(占6.7%),隱球菌感染5例(占5.6%),肉芽腫性炎4例(占4.4%),纖維鈣化結節1例(占1.1%),血管球瘤1例(占1.1%)和曲霉菌感染1例(占1.1%)。在驗證組,有137例惡性孤立性肺結節患者和105例良性孤立性肺結節患者。2組的性別、結節直徑比較差異無統計學意義(P>0.05)。
2.2 孤立性肺結節獨立預測因子的單因素和多因素分析 研究變量的賦值情況見表1,單因素分析顯示良性和惡性孤立性肺結節患者在年齡、結節類型、邊界清楚、邊緣光滑、分葉征、毛刺征、空泡征、空氣支氣管征、血管集束征、胸膜牽拉征、鈣化等臨床和CT影像上的差異有統計學意義(P<0.05),見表2。將單因素分析均有統計學意義的11個臨床和CT影像特征作為自變量,通過二分類非條件logistic回歸分析篩選自變量,最后結節類型、分葉征、毛刺征、邊界清楚、胸膜牽拉征共5個自變量選入模型,這5個因素是惡性孤立性肺結節的獨立預測因子,見表3。

表1 臨床和CT影像特征得賦值情況
2.3 logistic回歸診斷模型的建立 孤立性肺結節惡性可能性的預測模型:P=ex/(1+ex),X=-1.252-(0.741×混雜磨玻璃結節)-(3.712×實性結節)+(2.301×邊界清楚)+(1.589×分葉征)+(1.269×毛刺征)+(1.528×胸膜牽拉征)。其中e是自然對數;因結節類型為三分類變量,故在模型設置上引入2個啞變量代替“結節類型”變量,分別為D1(1=混雜磨玻璃結節;0=非混雜磨玻璃結節)、D2(1=實性結節;0=非實性結節),即當肺結節是純磨玻璃結節,則混雜磨玻璃結節=0,實性結節=0;如果肺結節是混雜磨玻璃結節,則混雜磨玻璃結節=1,實性結節=0;如果肺結節是實性結節,則混雜磨玻璃結節=0,實性結節=1;如果肺結節邊界清楚,有分葉征,毛刺征,胸膜牽拉征,則用1表示,否則為0。
2.4 訓練樣本的自身檢驗 將訓練樣本各數據分別代入回歸方程,回歸方程計算結果P≥0.5判斷為惡性,P<0.5判斷為良性作為判斷標準時,準確率為84.0%(178/212),靈敏度為91.8%(112/122),特異度為91.8%(66/90),陽性預測值為82.4%(112/136),陰性預測值為86.8%(66/76),見表4。
2.5 驗證樣本的外部檢驗 將驗證樣本各數據分別代入回歸方程,計算結果P≥0.5判斷為惡性,P<0.5判斷為良性作為判斷標準時,準確度為83.5%(202/242),靈敏度為81.8%(112/137),特異度為85.7%(90/105),陽性預測值為88.2%(112/127),陰性預測值為78.3%(90/115),見表5。
肺癌是世界范圍內發病率最高的癌癥,也是癌癥死亡的首位病因[4-5]。由于近年吸煙人數的減少,戒煙人數的增加,治療手段的進步,肺癌的病死率已經大大降低[6-8]。然而,肺癌的預后較差,5年生存率只有16%[9]。近年來隨著CT的廣泛使用,肺結節的檢出率和診斷準確率顯著提高,有助于肺結節患者早期發現和治療,患者的生存質量和生存率均可明顯提高,CT已成為肺結節早期診斷的首選方法。孤立性肺結節由于其病因的多樣性和高度惡性的潛能,已成為臨床上的一個巨大挑戰和沉重負擔。晚期肺癌的預后極不理想,而臨床I期的非小細胞肺癌5年生存率為60%~80%[10-11]。因此對孤立性肺結節應該早期診斷,惡性結節要及時手術治療,良性結節則要避免侵入性的治療手段。
以往對于孤立性肺結節的診斷基本上是基于臨床和放射科醫師的經驗性診斷。本研究建立了一個基于logistic回歸分析的數學預測診斷模型。多因素logistic回歸分析顯示結節類型、邊界清晰、分葉征、毛刺征、胸膜牽拉征是惡性孤立性肺結節的獨立預測因子。
據相關研究報道,邊界清楚高度提示為良性結節,有一個清楚的邊界,孤立性肺結節的惡性可能性會降低75%[12]。而我們的研究顯示邊界清楚為惡性孤立性肺結節的獨立預測因子。可能是本研究納入的良性患者里非特異性炎性結節比例偏高,而非特異性炎性結節的邊界是模糊的。毛刺是由于腫瘤細胞沿著肺泡壁、淋巴管壁、血管壁生長或者纖維組織增生引起。毛刺的出現高度提示惡性,SWENSEN等[13]研究顯示毛刺出現的孤立性肺結節惡性可能性為88%~94%。本研究顯示,分葉征和胸膜牽拉征也高度提示孤立性肺結節為惡性。
年齡是最重要的臨床因素之一,隨著年齡的增長,人體體細胞的自我修復能力逐漸降低,被致癌物損傷的上皮細胞的修復能力也在下降。但在本研究中年齡差異無統計學意義,可能是因為本研究納
入的都是<3 cm的肺結節,處于較早階段,和良性肺結節的發生時間類似,所以良、惡性肺結節在年齡上差異無統計學意義。吸煙和肺部腫瘤的發生密切相關,但本研究顯示吸煙史差異無統計學意義,可能原因是本研究納入的惡性孤立性肺結節患者的腺癌比例偏高,而腺癌和吸煙史的關系并不明顯。腫瘤既往史差異無統計學意義,可能是因為孤立性肺結節患者有惡性腫瘤史的很少,也可能是樣本量過少。有研究[14]顯示,結節位置是惡性孤立性肺結節的獨立預測因子,然而,本研究結果顯示,結節位置不是惡性孤立性肺結節的獨立預測因子,可能原因是中國人有較高的結核發生率,在本研究的良性患者里結核患者有一個比較高的比例。而結核好發于上葉,和惡性肺結節類似,所以導致了良、惡性孤立性肺結節在結節位置上差異無統計學意義。

表2 訓練組患者臨床及CT影像特征單因素分析
本研究基于我院的孤立性肺結節病例建立的logistic回歸數學診斷模型,經內部驗證和外部驗證,都顯示了一個較好的診斷效能。該模型能提高臨床醫師診斷肺結節的診斷準確率。預測模型的準確診斷,一方面能及時對惡性孤立性肺結節進行早期診斷和治療,另一方面,也能避免良性孤立性肺結節的不必要的侵入性檢查和外科治療。當然,這個模型也存在著一些缺陷,收集納入研究的因素只包括臨床資料和CT影像資料,而沒有腫瘤標記物,另外,納入研究的樣本量過少,有待于進一步擴大樣本量,而且,納入的患者都是經過外科手術治療,而不是基于全部的人群,存在著選擇偏倚。

續表2

表3 多因素logistic回歸分析結果

表4 用所得方程檢測訓練樣本所得結果(n)

表5 用所得方程檢測驗證樣本所得結果(n)
本研究通過二分類logistic回歸分析,得到logistic回歸方程,回歸值P≥0.5時預報為惡性,P<0.5時預報為良性,方程預報準確率為84.0%。回歸模型雖然不能完全替代臨床醫師的經驗性判斷,但可以提高臨床醫師和放射科醫師對孤立性肺結節良惡性判斷的信心,提高工作效率,對于回歸模型P值接近0.50,而有一項或數項惡性臨床和CT影像特征時,建議進行緊密的隨訪觀察,可減少肺癌的漏診。
[1] 林潔, 唐坤, 殷薇薇, 等. P E T/C T及其數學預測模型對孤立性肺結節診斷價值的研究[J]. 溫州醫科大學學報, 2 0 1 5,4 5(5): 3 5 4-3 5 8.
[2] TRUONG M T, KO J P, ROSSI S E, et al. Update in the evaluation of the solitary pulmonary nodule[J]. Radiographics, 2014, 34(6): 1658-1679.
[3] KROCHMAL R, ARIAS S, YARMUS L, et al. Diagnosis and management of pulmonary nodules[J]. Expert Rev Respir Med, 2014, 8(6): 677-691.
[4] FERLAY J, SHIN H R, BRAY F, et al. Estimates of worldwide burden of cancer in 2008: GLOBOCAN 2008[J]. Int J Cancer, 2010, 127(12): 2893-2917.
[5] JEMAL A, SIEGEL R, XU J, et al. Cancer Statistics, 2010[J]. CA Cancer J Clin, 2010, 60(5): 277-300.
[6] GODTFREDSEN N S, PRESCOTT E, OSLER M. Effect of smoking reduction on lung cancer risk[J]. JAMA, 2005, 294(12): 1505-1510.
[7] FIELD J K, OUDKERK M, PEDERSEN J H, et al. Prospects for population screening and diagnosis of lung cancer[J]. Lancet, 2013, 382(9893): 732-741.
[8] ZHOU C, WU Y L, CHEN G, et al. Erlotinib versus chemotherapy as first-line treatment for patients with advanced EGFR mutation-positive non-small-cell lung cancer (OPTIMAL, CTONG-0802): a multicentre, open-label, randomised,phase 3 study[J]. Lancet Oncol, 2011, 12(8): 735-742.
[9] RAMI-PORTA R, BOLEJACK V, GOLDSTRAW P. The new tumor, node, and metastasis staging system[J]. Semin Respir Crit Care Med, 2011, 32(1): 44-51.
[10] TANOUE L T, DETTERBECK F C. New TNM classification for non-small-cell lung cancer[J]. Expert Rev Anticancer Ther, 2009, 9(4): 413-423.
[11] LI Y, CHEN K Z, WANG J. Development and validation of a clinical prediction model to estimate the probability of malignancy in solitary pulmonary nodules in Chinese People[J].Clin Lung Cancer, 2011, 12(5): 313-319.
[12] KHAN A, HERMAN P G, VORWERK P, et al. Solitary pulmonary nodules: comparison of classification with standard,thin-section, and reference phantom CT[J]. Radiology, 1991,179(2): 477-481.
[13] SWENSEN S J, SILVERSTEIN M D, ILSTRUP D M, et al.The probability of malignancy in solitary pulmonary nodules. Application to small radiologically indeterminate nodules[J]. Arch Intern Med, 1997, 157(8): 849-855.
[14] GOULD M K, ANANTH L, BARNETT P G, et al. A clinical model to estimate the pretest probability of lung cancer in patients with solitary pulmonary nodules[J]. Chest, 2007, 131(2): 383-388.
(本文編輯:趙翠翠)
Establishment of logistic regression diagnosis model predicting malignant solitary pulmonary nodules
YU Wei1, YE Bo2, XU Liyun3, WANG Zhaoyu4, WANG Shanjun5, CAO Hanbo5, CHEN Zhijun1, ZHANG Yongkui1.1.Department of Cardiothoracic Surgery, Zhoushan Hospital Affiliated to Wenzhou Medical University,Zhoushan, 316021; 2.Department of Thoracic Surgery, Chest Hospital Affiliated to Shanghai Jiaotong University,Shanghai, 200030; 3.Lung Cancer Research Center of Zhoushan City, Zhoushan Hospital Affiliated to Wenzhou Medical University, Zhoushan, 316021; 4.Pathology Diagnosis Center, Zhoushan Hospital Affiliated to Wenzhou Medical University, Zhoushan, 316021; 5.Radiology Diagnosis Center, Zhoushan Hospital Affiliated to Wenzhou Medical University, Zhoushan, 316021
R604
A
10.3969/j.issn.2095-9400.2017.09.007
2016-10-07
國家衛生計生委科研基金—浙江省醫藥衛生重大科技計劃(省部共建計劃)(WKJ2014-2-021);浙江省科技廳公益技術社會發展項目(2015C33254)。
喻微(1990-),男,浙江義烏人,碩士生。
張永奎,主任醫師,Email:zyk801801@126.com。