瞿根義 向茂林 徐勇 陽光 王佳威 湯乘
前列腺癌(prostate cancer,PCa)是泌尿外科常見的惡性腫瘤[1]。近年來我國PCa發(fā)病率呈逐年上升趨勢,目前在泌尿系腫瘤中居第二位[2]。PCa患者易發(fā)生骨轉(zhuǎn)移,轉(zhuǎn)移后5年生存率低于29%,而且經(jīng)過內(nèi)分泌治療后,大部分患者最終會發(fā)展為去勢抵抗性PCa[3]。因此,深入研究PCa發(fā)生、發(fā)展的機(jī)制,具有重要的臨床意義。生物信息學(xué)是將計算機(jī)技術(shù)和分子生物學(xué)相結(jié)合的技術(shù),為基因的研究提供了方法。癌癥和腫瘤基因圖譜(cancer genome atlas,TCGA)和Oncomine數(shù)據(jù)庫是大型腫瘤基因芯片數(shù)據(jù)庫,具有大樣本和豐富的臨床數(shù)據(jù)。本研究利用TCGA和Oncomine數(shù)據(jù)庫深入挖掘PCa差異表達(dá)基因,然后進(jìn)行基因本體論(gene ontology,GO)和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)通路分析,建立蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò),并篩選Hub基因,最后通過Meta分析篩選影響PCa發(fā)生、發(fā)展的關(guān)鍵基因。
1.1 資料來源 通過TCGA數(shù)據(jù)庫(https://cancergenome.nih.gov/)下載公開的PCa RNA測序數(shù)據(jù),包括PCa組織499例,癌旁正常組織52例。
1.2 差異表達(dá)基因的獲取 采用R 3.5.3軟件的edgeR軟件包對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化及差異表達(dá)分析,篩選logFC絕對值>1.5,F(xiàn)DR<0.05的基因為差異表達(dá)基因。采用ggplot2軟件包對數(shù)據(jù)進(jìn)行圖形可視化。
1.3 差異表達(dá)基因的GO和KEGG通路分析 通過DAVID數(shù)據(jù)庫(https://david.ncifcrf.gov)對差異表達(dá)基因進(jìn)行GO和KEGG通路分析,P<0.05為差異有統(tǒng)計學(xué)意義;其中GO分析包括生物學(xué)過程(biological process,BP)、細(xì)胞組成(cell composition,CC)和分子功能(molecular function,MF)。采用R 3.5.3軟件及相應(yīng)的cluster Profiler包進(jìn)行注釋和可視化。
1.4 差異表達(dá)基因的PPI網(wǎng)絡(luò)分析 通過STRING數(shù)據(jù)庫(https://string-db.org/)對差異表達(dá)基因進(jìn)行分析并構(gòu)建PPI網(wǎng)絡(luò)[4]。采用 Cytoscape軟件中的Cytohubba篩選PPI網(wǎng)絡(luò)中連接程度前10位Hub基因。……