張倩 孟穎 支力強
近年來,雖然非小細胞肺癌(non-small cell lung cancer,NSCLC)的診斷和治療方式發展迅速,但其5年平均生存率仍很低,僅為16%,這可能與缺乏早期有效的NSCLC檢測方法有關[1]。證據表明長鏈非編碼RNA(Long non-coding RNAs,LncRNAs)穩定地存在于血液甚至尿液中,并顯示出作為包括NSCLC在內的各種腫瘤生物標記物的潛力[2-4]。維生素D缺乏癥與包括肺癌在內的多種癌癥的風險增加相關[5]。先前的研究表明,高維生素D受體(VDR)表達與肺癌患者更好的預后相關[6]。最近,通過生物信息學分析將SNHG6、SNHG16、LINC00346和LINC00511確定為癌癥中與VDR相關LncRNAs,并且發現這些LncRNAs在乳腺癌患者和健康人群中存在差異表達[7]。然而,VDR相關LncRNAs在肺癌中的作用尚不清楚。因此,本研究評估了NSCLC患者血清VDR相關LncRNAs的表達情況,以分析它們的診斷價值及與患者預后的關系。
在癌癥相關治療前,根據組織病理學檢查收集了126例NSCLC患者的所有血清樣本。這些患者于2014年1月至2016年1月在本院接受治療。入選標準:1)NSCLC患者,非其他類型肺癌患者;2)病理檢查確診患者;3)愿意參與的患者;4)在本院完成整個療程,并完成5年隨訪的患者。排除標準:1)合并慢性病等其他疾病的患者;2)治療期間轉院的患者;3)患者未能配合研究者;4)患者在隨訪期間死于其他原因。此外,同期從健康志愿者中隨機招募了90名健康人。從每個參與者的靜脈血中收集大約3 mL血液樣本。使用兩步離心法將所有血清分離出來,以完全去除血細胞(在4℃下2000×g持續5分鐘;在4℃下12000×g持續5分鐘)。研究經本院倫理委員會批準同意(批準文號:2013048)。
篩選階段分為訓練集和驗證集。訓練集納入20對樣本,包括20例NSCLC患者和20例健康對照;驗證集包含106例NSCLC患者和70例健康對照。根據年齡、性別、NSCLC家族史、飲酒狀況和吸煙狀況,將對照組與NSCLC患者進行匹配。
使用TRIzol試劑從血漿樣品中獲得總RNA。使用PrimeScript RT試劑盒(日本TaKaRa公司)將RNA反轉錄為cDNA。用于分析的20 μL RT反應系統包括8 μL總RNA,4 μL的5×PrimeScript Buffer,0.5 μL RT Primer Mix,0.5 μL PrimeScript RT酶混合物I和7 μL無RNase水。使用以下方案進行反應:37℃ 15 min,然后85℃ 5 s和4℃ 10 s。隨后,使用SYBR Premix Ex Taq(TaKaRa)在20 μL反應混合物中一次通過定量實時聚合酶鏈反應(qRT-PCR)檢測cDNA樣品,其中包括10 μL SYBR?Premix Ex Taq II,2 μL RT反應產物,0.8 μL正向引物,0.8 μL反向引物和6.4 μL無RNase水。設定條件如下:在95℃下進行30s一次變性,在95℃ 5s和60℃ 30s,進行40個循環。考慮到β-actin mRNA在血清中的表達相對穩定,以β-actin為內參基因。相對表達水平是使用Δ循環閾值(CT)值方法計算的,ΔCT=CT(目標基因)-CT(內參基因)。CT值>40的樣品視為陰性結果。
通過風險評分分析構建血清LncRNAs診斷模型,以區分NSCLC患者和對照組。將對照中每個LncRNA值的上限95%參考間隔設置為閾值,以將每個樣本中相應LncRNA的表達水平編碼為訓練集中的0和1。根據每個LncRNA表達水平的線性組合,定義了預測NSCLC組的風險評分函數(RSF)。來自4個LncRNA樣本信息的RSF計算如下:rsfi=∑3j-1Wj.sij。在上式中,sij是樣本i上LncRNA j的風險評分,而Wj是LncRNA j風險評分的權重。4個LncRNA的風險評分是通過每個LncRNA的單變量Logistic回歸分析得出的回歸系數的權重來計算的。用各風險評分的回歸系數作為權重來表示各LncRNA對RSF的貢獻。應用風險評分函數法建立診斷模型,ROC法確定合適的臨界值,AUC法評價模型的診斷性能,并在下一個驗證樣本集中驗證過程和截止值。
所有NSCLC患者出院后均通過電話或門診隨訪5年。每1或2個月進行一次隨訪,直至隨訪結束或患者死亡。在隨訪過程中失訪或因NSCLC以外的其他原因死亡的患者被排除在本研究之外。
采用卡方檢驗、學生t檢驗和非參數檢驗對各組的人口統計學和臨床特征進行比較。采用Fisher精確檢驗分析血清非編碼RNA診斷模型危險度評分與臨床因素構成比的差異。使用Kaplan-Meier方法繪制生存曲線并通過log rankt檢驗比較。P<0.05差異具有統計學意義。采用SPSS 17.0進行統計分析。
NSCLC組和對照組在訓練集和驗證集上的年齡和性別分布相似(P>0.05)(表1)。

表1 研究對象的人口統計學和臨床特征
訓練集中,SNHG6、SNHG16、LINC00346和LINC00511在NSCLC和對照樣品之間表現出顯著的差異表達(P<0.05)(表2)。此外,驗證集中這4種LncRNA的變化與訓練集中的變化一致。

表2 兩組血清中VDR相關LncRNAs的差異表達
當截斷值為10.429時,訓練集中四個LncRNA聯合的AUC為0.875(95%CI:0.755~0.995),最佳敏感度和特異度分別為95.0%和81.0%(表3)。當截斷值為10.429時,驗證集中四個LncRNA聯合的診斷性能更高,AUC為0.824(95%CI:0.754~0.894),靈敏度和特異度分別為93.4%和74.3%(表3,圖1A和B)。

圖1 四種VDR相關LncRNA用于區分NSCLC患者和對照的ROC分析(A)訓練集;(B)驗證集

表3 NSCLC患者和對照之間每種LncRNA的診斷性能
根據風險評分將NSCLC病例分為高風險組(≥10.429)和低風險組(<10.429),不同風險組在腫瘤分期和淋巴結轉移期之間存在明顯的差異(P<0.05)(表4)。與低風險組患者相比,高風險組患者表現出明顯較低的總體存活率(P<0.05)(圖2)。

圖2 不同風險組患者的存活曲線

表4 四種VDR相關LncRNA的風險評分與NSCLC患者的臨床因素相關性分析
維生素D具有多種生物活性,如抗增殖和促進分化,增強了其作為抗癌劑的作用。研究發現,維生素D的抗增殖作用是通過與VDR的結合介導[8]。VDR通過與許多其他中介直接或間接交互來擴展其信號傳輸。其中,LncRNA作為VDR的重要中介之一,二者通過相互作用進行交叉調控[9]。先前的研究鑒定了4種VDR相關LncRNA(SNHG16、SNHG6、LINC00346、LINC00511),并發現這些LncRNA參與了腎癌、胃癌、乳腺癌、膀胱癌的發病過程,并與不良預后相關[10-11]。本研究中,我們鑒定了NSCLC患者和健康對照者血清中的4種差異表達的VDR相關LncRNA,它們在獨立樣本中得到了驗證。更重要的是,4種LncRNA在區分NSCLC患者和健康者方面顯示出高診斷性能。這一發現進一步強調了循環中的VDR相關LncRNA可以作為NSCLC診斷的非侵入性生物標記物。
血清中的循環RNA是一個新興的快速發展的分子診斷領域,這使得循環RNA在高通量臨床篩選和監測中的應用成為可能。LncRNAs常形成高度穩定的二級結構,有利于定量檢測體液中的游離RNA。近年來,有報道表明,血清LncRNAs可作為腫瘤檢測的特異性生物標記物[12]。更重要的是,一些循環中的LncRNA已被證明是癌癥中有價值的生物標記物,例如前列腺癌中的尿MALAT-1,胃癌中的血漿H19[13]。在本研究納入的NSCLC患者中,4種VDR相關LncRNA的表達顯著升高。其中,SNHG16和LINC00511的表達水平與之前的研究相當[9]。SNHG16是SNHG的重要成員,最近研究表明SNHG16在胃癌或乳腺癌患者血漿中均有表達,并且其水平升高與預后不良和總生存期縮短有關[14]。LINC00265作為一種內源性海綿,對抗多個miRNAs,在卵巢癌、結腸癌中表達上調[15]。此外,血清SNHG6、LINC00346表達上調被發現與大腸癌、胃癌預后不良有關[16]。為了檢驗4種VDR相關LncRNA在NSCLC早期診斷中的預測能力,研究還進行了風險評分分析,以檢驗4種LncRNA的預測能力。結果發現這4個因素的聯合具有很高的敏感度和特異度,AUC為0.824,表明4種VDR相關LncRNA可能是預測NSCLC的標志。預后分析顯示,高風險組患者表現出明顯較低的總體存活率。因此,4種VDR相關LncRNAs聯合應用可能是NSCLC的一個潛在的預后標志物。
總之,本研究綜合評估了血清中VDR相關LncRNA對NSCLC的診斷價值,發現4種LncRNAs聯合應用對NSCLC的診斷具有較高的敏感度和特異度,鑒別診斷準確率較高,并且與患者的不良預后相關。