楊凱,楊明,蘇學會,溫輝,單娜
(秦皇島市第二醫院 呼吸科,河北 秦皇島 066600)
原發性肺癌(簡稱肺癌)是全世界發病率、死亡率最高的惡性腫瘤之一[1-2],占癌癥相關死亡人數近五分之一[3]。按照病理形態的不同,肺癌可以分為非小細胞肺癌(non-small Cell Lung Cancer,NSCLC)和小細胞肺癌,其中NSCLC最為常見,約占肺癌總發病率的80%,此類患者總體預后較差[4]。NSCLC的腫瘤標志物主要有癌胚抗原(carcino-embryonic antigen,CEA)、糖類抗原125、鱗狀上皮細胞癌抗原(squamous cell carcinoma antigen,SCC-Ag)等蛋白[5-6],但目前在臨床上僅對不到百分之一的腫瘤標志物進行了相關研究,絕大部分腫瘤標志物目前還未進行系統的臨床驗證。所以,進一步篩選出靈敏度高、特異性高的新型標志物,可以幫助醫生在第一時間掌握病人的病情,為盡早治療奠定良好基礎[7-10]。隨著大數據的快速發展,腫瘤相關的組學數據不斷累積、更新,為科研人員研究腫瘤發病機制、醫生臨床診治提供了數據支持[11-12]。本研究首選通過基因表達匯編(gene expression omnibus,GEO)數據庫和腫瘤基因組圖譜(the cancer genome atlas,TCGA)數據庫篩選出NSCLC中的差異表達基因,對100例NSCLC臨床樣本行進一步驗證分析,以期找到肺癌的新型預后標志物。
1.1.1數據收集及差異基因的篩選 在GEO數據庫中選擇GSE19804芯片數據,分為NSCLC組織和癌旁組織,每組各60個樣本,該數據由Lu等[13]提供。利用R語言中“limma”以及“impute”包對芯片數據進行處理分析,進行貝葉斯顯著性檢驗,以LogFC(Fold Change)絕對值>1且P<0.01作為顯著性差異表達,對差異基因進行聚類分析、制作熱圖。
1.1.2蛋白質-蛋白質相互作用(protein-protein interaction,PPI)網絡構建及核心基因篩選 利用STRING網站(http//string-db.org/),以medium confidence>0.4為條件構建差異基因的蛋白互作網絡,利用Cytoscape軟件中CentiScape和MCODE插件,對PPI網絡進行可視化處理,分析基因網絡節點的連接度,得到連接度較高的關鍵基因。
1.1.3核心基因與NSCLC患者預后的關系分析 利用TCGA數據庫,通過Firehose網站和cBioPortal腫瘤基因組網站下載數據,保留其中含有完整臨床數據和生存數據的994例NSCLC患者腫瘤組織樣本和301例NSCLC患者癌旁組織樣本所對應的臨床病理數據以及預后數據,分析核心基因與臨床NSCLC患者生存期的關系,核心基因在男性NSCLC患者和女性NSCLC患者腫瘤組織中的表達水平差異,核心基因在NSCLC患者腫瘤組織與癌旁組織中的表達水平差異,以及核心基因與腫瘤增殖、轉移相關基因[增殖標志蛋白Ki-67基因(proliferation marker protein Ki-67 gene,MKI67)、轉移標志蛋白波形蛋白基因(vimentin gene,VIM)]表達水平的關系。
1.2.1材料、主要試劑與儀器 NSCLC患者腫瘤組織和相應癌旁組織由課題組前期收集;CAV1蛋白抗體、二抗購于英國Abcam公司,石蠟包埋機、切片機為德國Leica公司產品,正置顯微鏡為日本Olympus公司產品。
1.2.2分組 收集100例NSCLC患者,分為NSCLC組織組和癌旁組織組,男53例、女47例,年齡31~75歲、平均(58.94±12.06)歲,肺腺癌64例、肺鱗癌36例。本研究獲得病人及家屬知情同意,且符合《世界醫學協會赫爾辛基宣言》相關要求。納入標準:(1)參照NSCLC的相關診斷標準;(2)首次確診;(3)經細胞學或組織病理學證實為NSCLC;(4)預計生存時間超過3個月;(5)入院前未接受過相關抗腫瘤治療;(6)無其他重要臟器功能障礙。排除標準:(1)合并腦轉移;(2)病灶無法測量者;(3)妊娠期或哺乳期女性;(4)先前有或繼發性惡性腫瘤;(5)曾接受過放化療或免疫治療;(6)有精神病史;(7)合并血液系統疾病。
1.2.3檢測Caveolin1表達 取兩組組織標本,經石蠟包埋、切片(厚度<5 μm,長度<10 μm)、固定、漂洗、脫水、透明、透蠟、包埋、整修、切片(厚度4 μm),利用免疫組織化學法檢測小窩蛋白1(Caveolin1)的表達。

利用R語言中“limma”安裝包對芯片數據進行處理分析,以|LogFC|>1且P<0.01為篩選閾值,在NSCLC組織和癌旁組織中共篩選出256個差異基因,其中上調的基因有206個,下調的基因有50個,見圖1。

注:A為差異基因火山圖;B為差異基因聚類熱圖,紅色點代表高表達的基因、藍色點代表低表達的基因。圖1 NSCLC組織和癌旁組織的差異基因分析Fig.1 Differential gene analysis of normal tissues and lung cancer tissues
PPI圖中共有102個節點,連接線198個,見圖2。通過Cytoscape軟件中的CentiScape和MCODE插件進行分析,得到其中連通度最高的14個基因,分別是白細胞介素6基因(interleukin-6 gene,IL6)、α1-Ⅰ型膠原基因(alpha-1 type Ⅰ collagen gene,COL1A1)、鳥嘌呤核苷酸結合蛋白γ11基因(guanine nucleotide-binding protein gamma-11 gene,GNG11)、富亮氨酸重復激酶2基因(leucine-rich repeat kinase 2 gene,LRRK2)、DNA拓撲異構酶2α基因(topoisomerase Ⅱ alpha gene,TOP2A)、鈣黏蛋白5基因(cadherin-5 gene,CDH5)、CXC受體2基因(CXC receptor 2 gene,CXCR2)、小窩蛋白1基因(caveolin1 gene,CAV1)、血小板堿性蛋白基因(platelet basic protein gene,PPBP)、金屬蛋白酶組織抑制因子1基因(metalloproteinase inhibitor 1 gene,TIMP1)、血小板反應蛋白受體基因(thrombospondin receptor gene,CD36)、血小板反應蛋白2基因(thrombospondin 2 gene,THBS2)、CXC配體2基因(CXC ligand 2 gene,CXCL2)、基質金屬蛋白酶1(matrix metallopeptidase 1 gene,MMP1),見表1。選擇其中核心基因CAV1進行后續研究。

注:圖中面積越大連接度越高。圖2 差異基因的PPI分析Fig.2 PPI analysis of differential genes

表1 PPI網絡中前14的核心基因Tab.1 List of 14 genes with the highest degree of connectivity
TCGA數據庫數據分析顯示,NSCLC腫瘤組織中高表達CAV1的腫瘤患者生存期短于低表達CAV1的腫瘤患者(P<0.05),見圖3。NSCLC腫瘤組織中,不同性別間CAV1基因表達量比較,差異無統計學意義(P>0.05),見圖4A;與癌旁組織比較,NSCLC 腫瘤組織中CAV1表達量明顯升高,差異有統計學意義(P<0.01),見圖4B。CAV1與MKI67、VIM的表達均呈正相關(R=0.15,P<0.05;R=0.29,P<0.05),說明CAV1與NSCLC的增殖、轉移可能存在密切相關,見圖5。

圖3 CAV1表達水平與NSCLC患者預后生存分析(TCGA數據庫數據)Fig.3 Expression level of CAV1 and prognostic survival analysis of NSCLC patients(TCGA database)

注:A為不同性別間比較,B為不同組織間比較;(1)與癌旁組織組織比較,P<0.01。圖4 不同組織及不同性別間CAV1的表達(TCGA數據庫數據)Fig.4 Expression of CAV1 in different human tissues and gender(TCGA database)

注:A為 CAV1與MKI67相關性分析;B為CAV1與VIM的相關性分析。圖5 CAV1與MKI67、VIM的相關分析(TCGA數據庫數據)Fig.5 Correlation between CAV1 and MKI67,VIM(TCGA database)
結果顯示,NSCLC組中Caveolin1蛋白表達高于癌旁組織組,差異有統計學意義(P<0.05),見圖6。

圖6 NSCLC組與癌旁組織組中 Caveolin1蛋白的表達(SP法,×200)Fig.6 Expression of Caveolin1 protein in paracancerous tissues group and NSCLS group(SP,×200)
肺癌是呼吸系統最常見的腫瘤,因缺少用于早期診斷的指標且病情進展迅速,八成以上患者就診時已經處于癌癥晚期,使得許多患者錯失最佳的治療時間,目前手術治療和放化療手段都難以從根本上解決腫瘤復發和轉移的問題[14-15]。雖然技術不斷進步,近年來又推出了如物理消融、介入和生物療法等一系列新的治療手段[16],但 NSCLC總5年生存率仍然只有約10%,其中八成患者在確診腫瘤時已經錯失最佳手術時機,只有不到2%的肺癌在發現時處于早期[17-18]。早期肺癌手術切除腫瘤后的5年生存率達超過70%。因此,從基因水平對NSCLC的發生發展機制進行分析,篩選新型的腫瘤檢測標志物對NSCLC的早期診治具有重要意義。
本研究對GEO數據庫中60例肺癌組織和相應的60例癌旁組織的表達譜芯片數據進行分析,通過對差異基因聚類、篩選、繪制互作網絡等方法篩選出14個核心基因。在14個基因中,CXCR2、CD36、CXCL2、MMP1等基因均為目前報道較多且與肺癌有較為明確關系的基因,而GNG11、LRRK2、PPBP、THBS2、CAV1五個基因與肺癌的關系目前報道較少,本研究重點對CAV1進行了研究[19-22]。本研究利用TCGA數據庫數據對CAV1在肺癌中的表達情況進行了分析,并對患者的生存期進行統計后,發現CAV1高表達的患者生存期低于低表達CAV1的患者。由于本研究分析的表達譜芯片數據均來自女性肺癌患者,為排除CAV1在不同性別人群中的表達差異,本研究利用TCGA數據庫數據對CAV1在男性和女性肺癌患者的表達情況進行了分析,結果顯示CAV1的表達與性別無顯著關系。本研究還比較了CAV1在 NSCLC癌組織和癌旁組織中的表達情況,結果顯示CAV1在 NSCLC腫瘤組織中的表達高于癌旁組織;進一步分析顯示,CAV1基因與參與肺癌增殖和轉移的MKI67和VIM基因表達呈正相關。這一系列結果與GEO數據庫中的表達譜芯片數據結果相一致。本研究檢測了100例NSCLC臨床樣本數據,結果顯示,與相應癌旁組織相比,Caveolin1在NSCLC組織中高表達。
CAV1基因所表達的蛋白Caveolin1為細胞膜窖體(Caveolae)的主要構成蛋白,細胞膜窖體是細胞膜發揮功能的重要結構基礎[23-24]。CAV1基因在細胞活動中發揮著多種重要作用,包括信號傳導、物質運輸等,參與細胞的增殖、凋亡、分化等過程[25]。CAV1在腫瘤萌芽期的表達明顯增加,這顯示CAV1可能與腫瘤的轉移和預后密切相關[26-27]。但目前對CAV1在腫瘤發生、發展中的作用研究相對較少,特別是其在肺癌增殖轉移中的作用尚不清楚。本研究結果顯示,CAV1與NSCLC患者的生存期,肺癌增殖、轉移等方面可能有著密切的關系。
本研究主要利用現有數據庫的分析和本地臨床樣本進行分析,但暫時缺少在細胞水平、動物水平的機制研究和在臨床樣本上的機制驗證工作,未來將對CAV1基因和Caveolin1在NSCLC中作用機制展開進一步研究,以期為臨床上肺癌的早期診斷和治療提供新的思路。