王維杰,趙森峰,2,曹家輝,2,李冰潔
(鄭州大學(xué)第一附屬醫(yī)院,河南 鄭州 450052,1.肝膽胰外五科,3.腫瘤科;2.鄭州大學(xué) 醫(yī)學(xué)科學(xué)院,河南 鄭州 450052)
胰腺癌是惡性程度最高的消化道惡性腫瘤之一,具有手術(shù)切除率低、轉(zhuǎn)移率高、復(fù)發(fā)率高以及對放化療不敏感的特性,預(yù)后極差[1-2]。研究表明,LAMA3(Laminin subunit alpha 3)基因編碼層粘連蛋白332(Laminin 332,LM-332)α亞基,在不同腫瘤中呈現(xiàn)不同的表達(dá)模式,低表達(dá)于胃癌、乳腺癌和前列腺癌等,但在肝癌、胰腺癌和鱗狀細(xì)胞癌中呈現(xiàn)高表達(dá)[3-6]。越來越多的證據(jù)表明,LAMA3的異常表達(dá)和甲基化與癌癥的發(fā)生和發(fā)展密切相關(guān),具有重要的靶向研究價(jià)值和生物學(xué)標(biāo)志物意義[7-9]。但是,LAMA3在胰腺癌中的信號通路和預(yù)后評估的相關(guān)研究鮮有報(bào)道,因此,本研究基于TCGA和GEO數(shù)據(jù)庫,明確LAMA3在胰腺癌中的表達(dá)情況,分析其與胰腺癌臨床病理特征的相關(guān)性及其在預(yù)后中的評價(jià)作用,通過基因富集分析(gene sets enrichment analysis,GSEA)進(jìn)一步預(yù)測其在胰腺癌中的信號通路,為研究LAMA3在胰腺癌發(fā)生、發(fā)展中的作用機(jī)制提供新的理論基礎(chǔ)。
本研究中所涉及的胰腺癌轉(zhuǎn)錄組數(shù)據(jù)和患者臨床數(shù)據(jù)來自于腫瘤基因組圖譜(the Cancer Genome Alas,TCGA)和基因表達(dá)綜合(Gene Expression Omnibus,GEO)數(shù)據(jù)庫,主要利用生物信息學(xué)的方法進(jìn)行數(shù)據(jù)處理和統(tǒng)計(jì)分析。首先在TCGA數(shù)據(jù)庫分析LAMA3的差異表達(dá),繼而采用Cox回歸分析與臨床病理特征的相關(guān)性,進(jìn)而Kaplan-Meier分析與總生存期的關(guān)系。最后,在GEO數(shù)據(jù)庫進(jìn)一步驗(yàn)證LAMA3的差異表達(dá)和生存分析。
采用limma R軟件包進(jìn)行Wilcoxon檢測,探討LAMA3在正常組織和腫瘤組織中的差異表達(dá)(|lgFC|>2且P<0.01)。本研究利用179例腫瘤組織和4例非腫瘤組織的LAMA3表達(dá)數(shù)據(jù)進(jìn)行差異表達(dá)分析,同時(shí)利用4對腫瘤組織和癌旁組織的LAMA3表達(dá)數(shù)據(jù)進(jìn)行配對差異表達(dá)分析。P<0.05認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
根據(jù)LAMA3 表達(dá)值的中位值,將患者分為高低兩組,將臨床數(shù)據(jù)和風(fēng)險(xiǎn)評分一起進(jìn)行Cox分析,計(jì)算各臨床特征的HR和95%CI,P<0.05認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
根據(jù)LAMA3 表達(dá)值的中位值,將患者分為高低兩組。使用Survival R包繪制ROC曲線,同時(shí)計(jì)算AUC值,ROC曲線下的面積值在0~1之間。在AUC>0.5的情況下,AUC越接近于1,說明診斷效果越好。AUC在0.5~0.7時(shí)有較低準(zhǔn)確性,AUC在0.7~0.9時(shí)有一定準(zhǔn)確性,AUC在0.9以上時(shí)有較高準(zhǔn)確性。使用Kaplan-Meier方法對LAMA3 高低表達(dá)組的生存期進(jìn)行分組比較,統(tǒng)計(jì)學(xué)方法選用Log-rank。在P<0.05的情況下,不同分組的生存曲線離散度越高,表示LAMA3高低表達(dá)組的生存差異越大。
從復(fù)雜調(diào)控網(wǎng)絡(luò)的角度出發(fā),通過GSEA的方法,基于京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)生物學(xué)通路數(shù)據(jù)庫,對基因集合進(jìn)行基于KEGG數(shù)據(jù)庫的生物通路富集分析,從而提取出最相關(guān)的生物通路上的差異基因,更加有利于下游實(shí)驗(yàn)的開展。
使用edgeR R包分別計(jì)算TCGA數(shù)據(jù)庫中正常胰腺組織、癌旁和胰腺癌組織的差異表達(dá),結(jié)果提示無論與正常組織還是癌旁組織相比,胰腺癌組織中LAMA3的表達(dá)均顯著增高(P<0.05)(見圖1A、B)。GEO數(shù)據(jù)庫進(jìn)一步驗(yàn)證差異表達(dá)分析,結(jié)果提示LAMA3在胰腺癌組織中的表達(dá)高于正常組織(P<0.05)(見圖1C)。

圖1 LAMA3在胰腺組織的表達(dá)情況
將TCGA數(shù)據(jù)庫胰腺癌的分級、淋巴結(jié)的侵犯轉(zhuǎn)移情況、TNM分期及腫瘤的大小等臨床性狀與LAMA3 的表達(dá)情況進(jìn)行單因素Cox回歸分析,結(jié)果提示胰腺癌的淋巴結(jié)轉(zhuǎn)移(HR2.26,P=0.003)和LAMA3 的表達(dá)(HR1.02,P=0.001)與預(yù)后生存相關(guān)(見表1)。進(jìn)一步多因素Cox回歸分析結(jié)果提示胰腺癌的淋巴結(jié)轉(zhuǎn)移(HR1.91,P=0.024)和LAMA3的表達(dá)(HR1.02,P=0.003)與預(yù)后生存相關(guān),表明LAMA3 是胰腺癌一個重要的獨(dú)立預(yù)后因子(見圖2)。

表1 應(yīng)用單因素Cox回歸分析TCGA數(shù)據(jù)中胰腺癌臨床病理特征與總體生存期的關(guān)系

圖2 多因素Cox回歸分析TCGA數(shù)據(jù)中胰腺癌臨床病理特征與總體生存期的關(guān)系
根據(jù)LAMA3 表達(dá)的中位數(shù)將患者分為高表達(dá)組和低表達(dá)組,5 年總生存率的ROC曲線下面積為0.711(見圖3A),說明我們的模型可以很好地預(yù)測患者的生存情況。針對高表達(dá)組和低表達(dá)組的Kaplan-Meier生存分析顯示,低表達(dá)組的總生存時(shí)間明顯長于高表達(dá)組(P<0.01)(見圖3B)。我們通過GEO數(shù)據(jù)集GSE21501 進(jìn)一步驗(yàn)證LAMA3 高表達(dá)與胰腺癌的預(yù)后,結(jié)果與前一致(見圖3C)。綜上可見,LAMA3高表達(dá)是胰腺癌一個獨(dú)立的不良預(yù)后因子。

圖3 LAMA3相關(guān)ROC曲線及生存曲線
基于KEGG生物學(xué)通路數(shù)據(jù)庫,對差異基因集合進(jìn)行GSEA通路富集分析表明,p53信號通路、細(xì)胞周期、DNA復(fù)制、剪接體、蛋白酶體及氧化磷酸化在LAMA3高表達(dá)表型中富集;細(xì)胞因子-細(xì)胞因子受體相互作用和細(xì)胞黏附分子在LAMA3 低表達(dá)表型中富集,提示LAMA3高表達(dá)與胰腺癌細(xì)胞的增殖、侵襲和轉(zhuǎn)移機(jī)制密切相關(guān)(見圖4)。

圖4 GSEA通路富集分析
胰腺癌是消化道惡性程度最高的腫瘤,由于缺乏早期特異性的診斷標(biāo)志物且腫瘤生物學(xué)行為進(jìn)展迅速,確診為胰腺癌的患者大部分已屬晚期,常伴有早期轉(zhuǎn)移和廣泛的局部性擴(kuò)散,僅20%的患者有外科手術(shù)根治性切除的機(jī)會,而接受系統(tǒng)性化療的晚期患者的中位生存期也只有8個月左右,因此,胰腺癌的5年總生存率在4%~5%[10-11]。此外,針對胰腺癌最常用的腫瘤標(biāo)志物是CA199,然而CA199在疾病早期并沒有明顯升高,其敏感性和特異性也僅為70%[12-13]。因此,深入研究胰腺癌進(jìn)展的分子機(jī)制并挖掘新的具有高特異性和敏感性的生物標(biāo)志物是改善胰腺癌患者生存預(yù)后的重要措施之一[14]。
LAMA3是層粘連蛋白家族主要成員LM-332的編碼基因之一,研究發(fā)現(xiàn),LAMA3在胃癌、乳腺癌、肝癌、胰腺癌等腫瘤中異常表達(dá),對腫瘤的發(fā)生發(fā)展具有重要影響[3-6];另外,LM-332家族參與了胰腺癌、乳腺癌、結(jié)腸癌、胃癌和前列腺癌等惡性腫瘤的增殖、侵襲及轉(zhuǎn)移,尤其與胰腺癌的不良預(yù)后密切相關(guān)[15-18]。然而,在胰腺癌中尚缺乏針對LAMA3的系統(tǒng)性分析和深度的機(jī)制挖掘。
本研究基于生物信息學(xué)技術(shù),系統(tǒng)性地分析了LAMA3 在胰腺癌中的差異表達(dá),并多方面評估其過表達(dá)對胰腺癌預(yù)后的診斷價(jià)值。分析結(jié)果表明,LAMA3 在胰腺癌組織中的表達(dá)顯著高于正常和癌旁組織,過表達(dá)LAMA3 的胰腺癌患者總體生存期顯著減少。進(jìn)一步單因素和多因素的Cox回歸分析證實(shí),LAMA3 高表達(dá)可能是胰腺癌一個獨(dú)立的不良預(yù)后因子。Yang等[19]對層粘連蛋白基因家族在胰腺癌中的表達(dá)進(jìn)行了全面的生物信息學(xué)分析,發(fā)現(xiàn)LAMA3 在胰腺癌中顯著高表達(dá)并與其不良預(yù)后密切相關(guān),聯(lián)合血清LAMC2和CA199水平可增加對早期胰腺癌患者的診斷效能。Kim等[20]聯(lián)合LAMA3、E2F7、IFI44、SLC12A2和LRIG1這5個功能基因構(gòu)建胰腺癌的預(yù)后模型,可有效改善胰腺癌的個體化治療策略,有望成為胰腺癌潛在的新藥物靶點(diǎn)。綜上可見,LAMA3很可能是胰腺癌的一個獨(dú)立預(yù)后因子,在胰腺癌的增殖、侵襲及轉(zhuǎn)移過程中可能發(fā)揮著重要的調(diào)控作用。
此外,DNA甲基化和RNA可變剪接等表觀遺傳修飾可調(diào)控LAMA3的表達(dá),在乳腺癌、胃癌、膀胱癌和卵巢癌等的研究中證實(shí)LAMA3發(fā)生甲基化,具有腫瘤早期診斷意義[21]。LM-332由LNα3、LNβ3和LNγ2鏈組成,LAMA3是LNα3亞基的編碼基因。一方面,LNα3 鏈與其他多肽鏈組成層粘連蛋白,通過層粘連蛋白-受體互作活化黏著斑激酶,進(jìn)而參與細(xì)胞信號傳導(dǎo);另一方面,LNα3 鏈的缺失使得細(xì)胞無法聚集半橋粒,層粘連蛋白連接不上細(xì)胞骨架,導(dǎo)致細(xì)胞的黏附性降低。研究表明,LAMA3在乳腺癌、胃癌和膀胱癌中低表達(dá)致使LM-332 無法合成,使得上皮細(xì)胞易于脫離細(xì)胞外基質(zhì),從而促進(jìn)癌細(xì)胞的侵襲和轉(zhuǎn)移[21-22]。然而,目前尚不清楚LAMA3在胰腺癌組織高表達(dá)的具體作用機(jī)制。我們基于KEGG生物學(xué)通路數(shù)據(jù)庫,對差異基因集合進(jìn)行GSEA通路富集分析表明,p53信號通路、細(xì)胞周期、DNA復(fù)制、剪接體、蛋白酶體及氧化磷酸化在LAMA3高表達(dá)表型中富集,而細(xì)胞因子-細(xì)胞因子受體相互作用和細(xì)胞黏附分子在LAMA3 低表達(dá)表型中富集,提示LAMA3在胰腺癌中過表達(dá)可能參與了癌細(xì)胞的增殖、侵襲和轉(zhuǎn)移,值得進(jìn)一步深入的研究和證實(shí)。
綜上所述,LAMA3在胰腺癌中過表達(dá)可能是胰腺癌一個獨(dú)立的不良預(yù)后因子。過表達(dá)的LAMA3可能參與了胰腺癌細(xì)胞的增殖、侵襲和轉(zhuǎn)移機(jī)制的調(diào)控,有望成為胰腺癌診治的新靶點(diǎn)和生物學(xué)標(biāo)志物。
利益沖突聲明:本研究不存在研究者、倫理委員會成員、受試者監(jiān)護(hù)人以及與公開研究成果有關(guān)的利益沖突。
作者貢獻(xiàn)聲明:王維杰負(fù)責(zé)課題設(shè)計(jì)、數(shù)據(jù)收集、資料分析、論文撰寫;趙森峰、曹家輝參與論文修改;李冰潔指導(dǎo)課題設(shè)計(jì)、論文撰寫及最后定稿。