張美晨,魏文竹,盧星宇,湯文瀛,王迪,劉躍娟
(哈爾濱醫(yī)科大學(xué)大慶校區(qū)醫(yī)學(xué)信息學(xué)院,黑龍江 大慶 163319)
胰腺癌(pancreaticcancer,PC)因其起病隱匿、早期診斷難、手術(shù)切除困難、放化療不敏感以及預(yù)后差、死亡率高等原因,成為危害最大的惡性腫瘤之一。我國(guó)胰腺癌發(fā)病率近20年來(lái)增長(zhǎng)了將近6倍,居惡性腫瘤死亡率的第5位,因此積極尋找對(duì)胰腺癌有更好診斷意義的臨床指標(biāo)尤為重要。目前,越來(lái)越多研究表明,癌癥的發(fā)生與基因突變、缺失和表達(dá)障礙有關(guān)。本研究利用胰腺癌芯片數(shù)據(jù),計(jì)算得到差異表達(dá)的mRNA和lncRNA,結(jié)合蛋白質(zhì)互作數(shù)據(jù),構(gòu)建失調(diào)的lncRNA-mRNA網(wǎng)絡(luò),通過(guò)挖掘網(wǎng)絡(luò)功能模塊,初步探索其作用機(jī)制,為揭示胰腺癌發(fā)生發(fā)展過(guò)程中l(wèi)ncRNA與其靶基因的關(guān)系和作用機(jī)制提供新線索。
我們從基因表達(dá)數(shù)據(jù)庫(kù)(Gene Expression Omnibus,GEO)中下載了編號(hào)為GSE61166的基因芯片數(shù)據(jù)。本研究從中選取4個(gè)胰腺癌患者和4個(gè)胰腺炎患者胰腺組織的lncRNA和mRNA表達(dá)譜數(shù)據(jù)作為研究對(duì)象。
利用BLAST進(jìn)行序列比對(duì),在基因芯片GPL61166平臺(tái)上下載序列信息,同時(shí)在GENECODE數(shù)據(jù)庫(kù)下載人類基因序列,利用計(jì)算機(jī)軟件比對(duì),通過(guò)BioMart數(shù)據(jù)庫(kù),將Ensembl Gene ID轉(zhuǎn)換為Gene Symbol。然后我們做了標(biāo)準(zhǔn)化和以2為底的對(duì)數(shù)轉(zhuǎn)換,若多個(gè)探針集對(duì)應(yīng)一個(gè)基因,則取其平均值作為該基因的表達(dá)量,共獲得6530個(gè)mRNA和31個(gè)lncRNA,全部數(shù)據(jù)處理流程如圖1所示。
差異基因通過(guò)基因芯片顯著性分析方法(SAM)篩選,SAM方法根據(jù)芯片數(shù)據(jù)噪音大小與表達(dá)峰度進(jìn)行修改,其優(yōu)點(diǎn)是在得到較多特征基因的同時(shí),錯(cuò)誤發(fā)現(xiàn)率(FDR)還保持在較低水平。利用SAM方法,閥值設(shè)定為P<0.05,得到差異表達(dá)的820個(gè)mRNA和16個(gè)lncRNA。

圖1 流程圖
相關(guān)分析法是對(duì)具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及程度的一種統(tǒng)計(jì)方法。本研究對(duì)差異表達(dá)的820個(gè)mRNA和16個(gè)lncRNA計(jì)算皮爾森相關(guān)系數(shù),取系數(shù)大于0.8且P<0.05的強(qiáng)相關(guān)對(duì)構(gòu)建lncRNA-mRNA共表達(dá)網(wǎng)絡(luò)。
根據(jù)上一步得到的共表達(dá)網(wǎng)絡(luò),從HPRD(Human Protein Reference Database)數(shù)據(jù)庫(kù)下載人類蛋白質(zhì)和蛋白質(zhì)相互作用(PPI)數(shù)據(jù),得到人的PPI網(wǎng)絡(luò),并將lncRNA-mRNA共表達(dá)網(wǎng)絡(luò)和PPI網(wǎng)絡(luò)取交集,然后對(duì)交集的mRNAs在PPI中選取直接鄰居結(jié)點(diǎn),和原共表達(dá)網(wǎng)絡(luò)一起形成lncRNA-mRNA互作網(wǎng)絡(luò)。
利用Cytoscape軟件中的JActiveModules插件進(jìn)行模塊挖掘,獲得5個(gè)網(wǎng)絡(luò)功能模塊。用ClusterOne和Netmine對(duì)模塊進(jìn)行聚類和進(jìn)一步挖掘,尋找p-value<0.05的顯著性lncRNA-mRNA互作對(duì)。
通過(guò)來(lái)自R/bioConductor的clusterProfiler包完成了對(duì)模塊中編碼基因的GO terms富集度統(tǒng)計(jì)學(xué)分析,計(jì)算出這些基因的GO term的p-value和p-value的FDR值,定位這些基因最可能相關(guān)的GO term。
對(duì)胰腺癌表達(dá)譜數(shù)據(jù)進(jìn)行處理,得到差異表達(dá)的mRNAs、lncRNAs數(shù)量分別為820、16個(gè)。通過(guò)比較差異mRNAs的前5%和全部的lncRNAs在不同樣本中的表達(dá)量(見(jiàn)圖2、圖3),我們發(fā)現(xiàn)這些mRNAs與lncRNAs在胰腺癌患者中低表達(dá)。

圖2 lncRNA和mRNA表達(dá)
構(gòu)建的lncRNA—mRNA共表達(dá)網(wǎng)絡(luò)共包含了826個(gè)結(jié)點(diǎn)和7176條邊,涉及到16個(gè)lncRNA和810個(gè)mRNA,利用Cytoscape可視化網(wǎng)絡(luò)(如圖4)對(duì)共表達(dá)網(wǎng)絡(luò)和PPI網(wǎng)絡(luò)整合并得到一個(gè)包含2373個(gè)結(jié)點(diǎn)和8626條邊,涉及到16個(gè)lncRNA和2357個(gè)mRNA的lncRNA—mRNA互作網(wǎng)絡(luò)。通過(guò)拓?fù)鋵傩苑治?如圖5),我們發(fā)現(xiàn)MIR7-3HG具有較大的度585,平均鄰居結(jié)點(diǎn)12,較小的聚類系數(shù)0.447,大多數(shù)的路徑長(zhǎng)度在2-5之間。

圖3 lncRNA和mRNA直方圖

圖4 lncRNA-mRNA共表達(dá)網(wǎng)絡(luò)

圖5 網(wǎng)絡(luò)度分布
對(duì)lncRNA—mRNA互作網(wǎng)絡(luò)進(jìn)行模塊挖掘,得到5個(gè)模塊。我們發(fā)現(xiàn)LINC00670與CCL2關(guān)系對(duì)在四個(gè)模塊中都出現(xiàn),LINC00670是一個(gè)存在轉(zhuǎn)錄因子CTCF綁定位點(diǎn)的長(zhǎng)鏈非編碼RNA,CTCF蛋白在印記調(diào)控區(qū)域和分化甲基化區(qū)域1和MAR3結(jié)合可抑制胰島素樣生長(zhǎng)因子2基因[14]。另外,我們對(duì)與LINC00670有互作關(guān)系的靶基因做GO功能富集分析發(fā)現(xiàn),其靶基因以最顯著的形式富集在了胰液分泌通路上。
在模塊一中,LINC00670的介數(shù)達(dá)到0.021,遠(yuǎn)高于平均介數(shù)值0.008。CCL2趨化因子及其受體可加強(qiáng)腫瘤細(xì)胞的增殖和侵襲能力,并聚集免疫細(xì)胞等機(jī)制以促進(jìn)腫瘤的發(fā)生發(fā)展,CCL2-CCR2信號(hào)通道在腫瘤細(xì)胞的轉(zhuǎn)移及增殖過(guò)程中發(fā)揮著重要的作用,尤其是在腫瘤細(xì)胞轉(zhuǎn)移的早晚期[15]。LINC00670同時(shí)還與IL6和NFASC相連。其中,IL6(白細(xì)胞介素-6),是炎癥介質(zhì)網(wǎng)絡(luò)的關(guān)鍵成分。有研究表明IL6與癌細(xì)胞增殖以及許多胰腺癌病人的惡病質(zhì)過(guò)程有關(guān)。在模塊二中受體活性修飾蛋白1(RAMP1)可以與降鈣素受體(CTR)直接作用產(chǎn)生胰淀粉樣酶(AMY)受體,在胰腺腫瘤引起的胰腺導(dǎo)管阻塞、胰腺膿腫、胰腺損傷中AMY高表達(dá)。有研究表明ADM能夠增強(qiáng)胰腺癌細(xì)胞的侵襲性。與LINC00671相聯(lián)的IAPP在II型糖尿病中會(huì)引起β細(xì)胞凋亡。用一種具有中和抗體的細(xì)胞特異性促進(jìn)劑明顯減少了病變的活性巨噬細(xì)胞積累,從而減少纖維化和病灶的生長(zhǎng)。在模塊四中CKM,DCX,IL6,IAPP都在模塊一、二、三中出現(xiàn),CKM,DCX,IL6同時(shí)連接LINC00670。有研究表明在胰腺癌中從UCM中更快地釋放出DOX,在凋亡的外圍細(xì)胞中可能會(huì)停止內(nèi)吞作用和胞吐作用,有研究表明組織和血液的MMP9增加反映了胰腺癌與糖尿病相關(guān)。
對(duì)模塊中編碼基因進(jìn)行GO功能富集分析結(jié)果見(jiàn)圖6。通過(guò)來(lái)自R/bioConductor的clusterProfiler數(shù)據(jù)包,我們完成了模塊中編碼基因的GO term富集度統(tǒng)計(jì)學(xué)分析,閥值選取為Bonferroni校正P值 <0.01。
圖6第一排從左至右分別是模塊一、三、五,第二排從左至右分別是模塊二和四。得到的五個(gè)模塊中都有與炎癥顯著性功能相關(guān)的注釋;模塊1中基因功能注釋到炎癥、增殖、凋亡;幾個(gè)模塊里還有關(guān)于侵襲轉(zhuǎn)移的功能注釋。其中多個(gè)功能有重復(fù)出現(xiàn)。如:taxis、regulation of developmental process、multi-organism cellular process。 通 過(guò)GO注釋的模塊功能與免疫反應(yīng)有關(guān)。
通過(guò)本項(xiàng)目的初步研究,找到與胰腺癌發(fā)生密切相關(guān)的的五個(gè)模塊,而這些模塊又分別與炎癥、免疫、細(xì)胞增殖和凋亡等有關(guān)。表明mRNA和lncRNA通過(guò)多種途徑參與胰腺癌的發(fā)生及發(fā)展過(guò)程,在多個(gè)模塊中發(fā)現(xiàn)lncRNA00670與胰腺癌密切相關(guān)。隨著mRNA和lncRNA研究技術(shù)的不斷發(fā)展和成熟,利用生物信息學(xué)分析將會(huì)發(fā)掘更多的功能性mRNA和lncRNA,為診斷和治療胰腺癌等惡性病疾病提供新方向。

圖6 GO功能富集注釋
[1] Liu R C, Traverso L W. Diagnostic laparoscopy improves staging of pancreatic cancer deemed locally unresectable by computed tomography[J]. Surgical Endoscopy And Other Interventional Techniques, 2005, 19(5): 638-642.
[2] Lin Q J, Yang F, Jin C, et al. Current status and progress of pancreatic cancer in China[J]. World Journal of Gastroenterology:WJG, 2015, 21(26): 7988.
[3] Li N, Yang M, Shi K, et al. Long non-coding RNA HOXA11-AS in human cancer: A meta -analysis[J]. Clinica Chimica Acta,2017,474:165-170.
[4] Bister V, Skoog T, Virolainen S, et al. Increased expression of matrix metalloproteinases-21 and-26 and TIMP-4 in pancreatic adenocarcinoma[J]. Modern Pathology, 2007, 20(11): 1128 -1140.
[5] Kayed H, Jiang X, Keleg S, et al. Regulation and functional role of the Runt-related transcription factor-2 in pancreatic cancer[J].British journal of cancer, 2007, 97(8): 1106-1115.
[6] Namkoong H, Shin S M, Kim H K, et al. The bone morphogenetic protein antagonist gremlin 1 is overexpressed in human cancers and interacts with YWHAH protein[J]. BMC cancer, 2006, 6(1): 74.
[7] Zhu Y, Xu H, Chen H, et al. Proteomic analysis of solid pseudopapillary tumor of the pancreas reveals dysfunction of the endoplasmic reticulum protein processing pathway[J]. Molecular &Cellular Proteomics, 2014, 13(10): 2593-2603.
[8] Wang Y, Yu S, Huang D, et al. Cellular Prion Protein Mediates Pancreatic Cancer Cell Survival and Invasion through Association with and Enhanced Signaling of Notch1[J]. The American journal of pathology, 2016, 186(11): 2945-2956.
[9] Qin C F, Zhao F L. Long non-coding RNA TUG1 can promote proliferation and migration of pancreatic cancer via EMT pathway[J].European Review for Medical and Pharmacological Sciences, 2017,21: 2377-2384.
[10] Tahira A C, Dazzani B, Reis E M, et al. Long noncoding intronic RNAs are differentially expressed in primary and metastatic pancreatic cancer[J]. Molecular cancer, 2011, 10(1): 141.
[11] Ma C, Nong K, Zhu H, et al. H19 promotes pancreatic cancer metastasis by derepressing let-7’s suppression on its target HMGA2-mediated EMT[J]. Tumor Biology, 2014, 35(9): 9163-9169.
[12] Saung M T, Zheng L. Current standards of chemotherapy for pancreatic cancer[J]. Clinical therapeutics, 2017.
[13] Yi X, Zai H, Long X, et al. Krüppel-like factor 8 induces epithelialto-mesenchymal transition and promotes invasion of pancreatic cancer cells through transcriptional activation of four and a half LIM-only protein 2[J]. Oncology letters, 2017, 14(4): 4883-4889.
[14] Huang X, Ta N, Zhang Y, et al. Microarray Analysis of the Expression Profile of Long Non-Coding RNAs Indicates lncRNA RP11-263F15. 1 as a Biomarker for Diagnosis and Prognostic Prediction of Pancreatic Ductal Adenocarcinoma[J]. Journal of Cancer, 2017, 8(14): 2740.
[15] Li H, Wang X, Fang Y, et al. Integrated expression profiles analysis reveals novel predictive biomarker in pancreatic ductal adenocarcinoma[J]. Oncotarget, 2017, 8(32): 52571.