王紀文 高佳 赫捷
2007年全球肺癌新發病例約150萬,占年新發腫瘤的12%;因肺癌死亡的病例數占年癌癥致死數的17.6%,是癌癥的首位死因[1]。小細胞肺癌(small cell lung cancer,SCLC)約占肺癌總數的20%-25%,其生物學特性和臨床特點異于其它病理類型的肺癌。SCLC惡性程度較高,對化療敏感,其治療原則與非小細胞肺癌(non-small cell lung cancer, NSCLC)有較大差異。因此尋找能用于SCLC診斷及鑒別診斷的分子標志物具有重要意義。
神經元特異性烯醇化酶(neuron specific enolase,NSE)和胃泌素釋放肽前體(pro-gastrin-releasing peptide,ProGRP)均是SCLC相關的血清學診斷標志物。NSE已在臨床應用多年,是目前SCLC首選的實驗室診斷指標,它在SCLC中的陽性率為60%-81%,但診斷的特異性有待提高,7%-42%的NSCLC和11%-14%的非惡性腫瘤患者,NSE呈假陽性[2]。ProGRP是近年來研究較多的具有臨床應用前景的腫瘤標志物。研究[3]表明,它在鑒別SCLC和其他肺部疾病方面具有較高的敏感度和特異度。
ProGRP對SCLC的診斷價值是否優于NSE,各項研究尚未得到一致結論,亦無大樣本量的多中心研究予以證實。本研究通過meta分析,綜合評價ProGRP與NSE診斷SCLC的價值,以期為ProGRP的進一步研究和臨床應用提供參考。
1.1 文獻檢索 檢索Pubmed、OVID、Elsevier Sciencedirect、Springer、Cochrane Library、Embase、IFCC、中國生物醫學文獻數據庫和維普醫藥信息資源系統,收集2010年5月之前公開發表的關于ProGRP與NSE在肺癌中的血清濃度及其診斷意義的文獻。使用的檢索詞包括neuron specific enolase、pro-gastrin-releasing peptide、NSE、ProGRP、Lung Neoplasms、lung cancer、diagnosis、神經元特異性烯醇化酶、胃泌素釋放肽前體、肺癌。檢索語言為英語與漢語。
1.2 文獻納入與排除標準 文獻納入標準:①研究類型為含有ProGRP和NSE對SCLC診斷價值的前瞻性或回顧性研究;②研究對象涵蓋肺癌及肺部良性疾患,采用病理診斷為金標準,文獻需明確說明受試者為SCLC、NSCLC或其它病理類型;③文章提供了ProGRP及NSE檢測在各病例組的真陽性、真陰性、假陽性、假陰性例數或通過文章提供的數據可以計算;④每組病例數均>20。
文獻排除標準:①對照組僅有正常人;②ProGRP或NSE的檢測方法不是定量檢測;③重復性實驗中,發表較早或樣本量較小的文獻排除。
1.3 資料提取和質量評價 由2名評價者獨立按照預先制定的納入排除標準篩選文獻,根據QUADAS(quality assessment of diagnostic accuracy studies)評價標準[4]對納入文獻進行質量評價(總分33分,評分結果見表1),提取數據并交叉核對,意見不統一時協商解決或參考第三方意見。提取的資料包括文獻基本信息、實驗設計及實驗原始數據(真陽性、假陽性、真陰性及假陰性的例數)。
1.4 統計分析
1.4.1 異質性分析 采用Q檢驗分析納入研究之間是否存在異質性,以I2估算分析異質性的大小,然后根據異質性分析的結果選擇合適的統計分析模型進行后續的meta分析。
1.4.2 meta分析 對各研究的原始數據(真陽性、假陽性、真陰性及假陰性的例數)進行整合,采用DerSimonian Laird隨機效應模型分別計算ProGRP和NSE的平均敏感度、特異度、似然比及各自的95%可信區間(confidence interval, CI)。
采用Mose's constant線性模型擬合SROC曲線[5],以診斷比值比(diagnositic odd ratio, DOR)[6]、曲線下面積(aera under curve, AUC)和Q*統計量評價診斷試驗ProGRP和NSE對SCLC診斷的準確度,并以Z檢驗分析二者診斷的準確性是否存在差異。
計算真陽性率和假陽性率的Spearman相關系數ρ,分析是否存在閾值效應。以meta回歸(REML法)分別分析ProGRP和NSE異質性的可能來源[7]。
以每次減少1篇文獻的方法進行敏感性分析,評價本次分析的穩定性[7]。以漏斗圖和Egger線性回歸評價納入的研究是否存在發表偏倚[8,9]。
本文統計用軟件為STATA 10和Meta-Disc 1.4,以P<0.05為有統計學差異。
2.1 檢索結果及納入文獻 通過設定的檢索詞進行初步檢索,共找到164篇文獻。閱讀文題和摘要排除143篇,初步納入文獻21篇。進一步閱讀全文,排除未達到納入標準的文獻6篇,重復文獻3篇,無法獲得所需全部原始數據的文獻2篇,最終納入文獻共10篇。文獻的納入過程詳見圖1。
2.2 納入研究的基本特征和質量評價 本文共納入10項研究,累計病例2 536例(SCLC 935例,NSCLC 1 601例),對照849例。各研究的研究設計詳見表1,ProGRP和NSE的檢測方法、cutoff值及真陽性、假陽性、假陰性、真陰性的例數參見表2。
2.3 異質性檢驗 以DOR作為效應量,分別分析ProGRP和NSE的異質性,Q檢驗顯示Cochran-Q分別為23.93和58.37,P均<0.05,I2分別為62.4%和84.6%,研究間均存在異質性,故以下分析均選用隨機效應模型。
2.4 ProGRP和NSE檢測SCLC的敏感度、特異性和似然比圖2所示為ProGRP和NSE對SCLC診斷敏感度的森林圖。ProGRP鑒別SCLC和肺部其他腫物(NSCLC與肺良性疾患)的平均敏感度為0.70(95%CI: 0.67-0.73),NSE的平均敏感度為0.61(95%CI: 0.58-0.64)。圖3所示為ProGRP和NSE對SCLC診斷特異度的森林圖。ProGRP鑒別SCLC和肺部其他腫物(NSCLC與肺良性疾患)的平均特異度為0.93(95%CI: 0.92-0.94),NSE的平均特異度為0.90(95%CI: 0.88-0.91)。
此外,ProGRP和NSE診斷SCLC的陽性似然比(positive likelihood ratio, PLR)分別為11.57(95%CI: 7.71-17.39)和5.67(95%CI: 3.83-8.39);陰性似然比(negative likelihood ratio, NLR)分別為0.32(95%CI: 0.26-0.40)和0.45(95%CI: 0.37-0.55),DOR分別為36.45(95%CI:24.12-55.10)和13.08(95%CI: 7.70-22.23),數據詳見表3。
2.5 ProGRP和NSE鑒別SCLC與其它肺部腫物的SROC曲線圖4所示為ProGRP和NSE診斷SCLC的SROC曲線。ProGRP和NSE的AUC分別為0.873 7(SEAUC=0.039 1)和0.785 4(SEAUC=0.915 0),Q*統計量分別為0.804 2(SEQ*=0.027 5)和0.723 2(SEQ*=0.065 1)。對Q*統計量進行Z檢驗(Z=1.146, P>0.05),二者沒有明顯差異。
2.6 研究間異質性的來源分析
2.6.1 是否存在閾值效應 由ProGRP和NSE的SROC曲線可見,各研究對應的點散在分布,不呈“肩臂”狀外觀,計算靈敏度對數與(1-特異性)對數的Spearman相關系數ρ,ProGRP和NSE的ρ值分別為0.321和-0.067,P均>0.05,提示不存在閾值效應。
2.6.2 meta回歸分析可能的來源 以meta回歸(REML法)分別分析ProGRP和NSE異質性的來源,自變量選擇如下:發表年限、樣本量、研究設計(前瞻性設計或者回顧性設計)、患者的選擇(是否隨機)、是否采用盲法、檢測方法(ProGRP的檢測方法是商品化試劑盒或自建ELISA檢測;NSE的檢測方法是否是ELISA)。結果詳見表4。由表可見,檢測方法是NSE異質性的來源,將其引入meta回歸分析模型后,方差分量(τ)由0.594 3降為0.299 4,表明檢測方法可以解釋49.6%的異質性來源。
2.7 敏感度分析 以每次減少1篇文獻的方法進行敏感性分析,評估單個研究對本次meta分析的影響。表5顯示的是,刪除1篇文獻后計算的合并DOR及其95%CI。可見,無論剔除哪篇文獻,剔除之后的合并DOR均未發生明顯變化,提示本次分析結果并未過分依賴于某個研究,結論穩定。
2.8 發表偏倚 以DOR對數的標準誤(SELogDOR)為縱坐標,以Log(DOR)為橫坐標,繪制漏斗圖,如圖5所示。Egger線性回歸顯示P>0.05,未發現發表偏倚。

圖 1 選擇文獻流程圖Fig 1 Study identification, inclusion and exclusion for meta-analysis

表 1 納入文獻的基本特征Tab 1 General characteristics of included trials

表 2 納入研究中ProGRP和NSE檢測的實驗數據Tab 2 Summary of results of ProGRP and NSE in included studies

表 3 ProGRP和NSE的合并敏感度、合并特異性、合并似然比Tab 3 Pooled sensitivity, pooled specificity, and pooled likelihood ration of ProGRP and NSE

表 4 meta回歸分析異質性的來源Tab 4 Possible sources of heterogeneity of meta-analysis

圖 2 ProGRP(A)和NSE(B)的敏感度森林圖Fig 2 Forest plots of sensitivity of ProGRP (A) and NSE (B)

圖 3 ProGRP(A)和NSE(B)的特異度森林圖Fig 3 Forest plots of specificity of ProGRP (A) and NSE (B)

圖 4 ProGRP(A)和NSE(B)的SROC曲線Fig 4 SROC curve of ProGRP (A) and NSE (B)

表 5 各研究對meta分析結果的敏感度分析Tab 5 The influence of each trial for the outcome of the meta-analysis

圖 5 ProGRP(A)和NSE(B)的漏斗圖Fig 5 Funnel graph for ProGRP (A) and NSE (B)
本文對納入的10項研究進行meta分析,通過合并診斷效應量、擬合SROC曲線比較ProGRP和NSE對SCLC的診斷效能,通過分析研究間異質性及其來源查找可能影響研究結果的因素,最后通過敏感度分析和檢測發表偏倚評估本次meta分析的可信度。
本次評價結果顯示,ProGRP和NSE的合并DOR分別為36.45和13.08,提示二者均與SCLC有明顯的相關性,且ProGRP的相關性更高。用于鑒別SCLC和NSCLC時,ProGRP的敏感性和特異性均優于NSE,此外,文獻資料[20]顯示ProGRP的假陽性主要來自腎衰患者,排除腎功能異?;颊吆?,其假陽性率僅為2.5%,較好地彌補了NSE特異度不足的缺點。
SROC曲線顯示,ProGRP和NSE的AUC分別為0.873 7和0.785 4,Q*統計量分別為0.804 2和0.723 2,說明二者鑒別SCLC和其它肺部腫物的準確度均較高。盡管ProGRP的AUC和Q*均高于NSE,但Z檢驗無統計學差異,說明ProGRP的鑒別能力并未明顯優于NSE。
由于SROC算法復雜,在臨床實際工作中應用較少,相比之下,似然比的應用更為簡便。一般認為,PLR>10或NLR<0.1,基本可以確定或排除診斷。本研究得出的ProGRP和NSE診斷SCLC的PLR分別為11.57和5.67,提示ProGRP陽性可以輔助臨床醫師做出相應判斷,具有更高的臨床應用價值。但ProGRP和NSE的NLR分別為0.32和0.45,提示二者陰性時不能排除SCLC的可能。
本文納入的研究間存在高度異質性。經Spearman相關系數檢驗,異質性與閾值效應無關,因此我們進一步做meta回歸,試圖尋找ProGRP和NSE異質性的可能來源。結果顯示,發表年限、樣本量、研究類型、患者的選擇是否隨機、是否采用盲法均不是異質性的來源,說明試驗設計的差異不會造成研究結果的明顯變化。然后,我們將檢測方法作為協變量進行meta回歸分析。由于納入的研究ProGRP的檢測方法均為ELISA,無法在方法學上進一步分類,因此只以是否采用商品化試劑盒作為亞組分析,結果顯示這同樣不是ProGRP異質性的來源。NSE已在臨床應用多年,其檢測方法包括ELISA、電發光、化學發光等,在我們納入的10項研究中,7項采用ELISA方法檢測NSE的濃度,2項研究采用電化學發光法檢測,1項采用放射免疫分析法檢測,meta回歸顯示檢測方法的不同是造成NSE異質性的原因之一,可以解釋49.6%的異質性來源。種族或許是異質性的來源,但納入的文獻均未詳細報告納入人群的種族,因此本次研究無法進行分析。
為了判斷本研究的穩定性,我們以每次減少1篇文獻的方法進行敏感性分析。結果顯示,每次減少1篇研究后,合并DOR均未發生明顯變化,提示本次分析受單個研究的影響較小,分析結果穩定可信。
本次meta分析的局限性:①meta分析的局限性:檢索到的文獻不夠全面。檢索范圍局限在已經發表的研究,對于未公開發表的研究,如會議論文無法獲取,可能漏檢一些灰色文獻;檢索語種局限于中文和英文,可能會漏檢其它語種的相關研究;②納入研究的局限性:ProGRP和NSE作為診斷性試驗,采用盲法檢測和盲法判斷可盡量減少診斷的傾向性,而多數研究未報告是否采用盲法檢測,存在測量偏倚的可能性。多數研究的病例組均為組織學確診的病例,然而良性疾患對照組的診斷標準,有些研究并未指明,病例組和對照組診斷標準不一致,可能會導致結果的偏差。
綜上所述,ProGRP與NSE有相似的診斷效能,但ProGRP的假陽性率更低,較NSE有一定的優越性,具有臨床應用前景。