邱潔萍 孫夢雨 左瑞東 王耀群 陳 博
(安徽醫科大學第一臨床醫學院,合肥 230000)
胃癌是目前具有侵襲性和致死性的惡性腫瘤之一[1]。大多數胃癌是在晚期被診斷出來的[2]。盡管針對胃癌的療效有所改善,但晚期胃癌患者5年生存率仍低于20%,而如果早期發現胃癌,其5年生存率可高達90%,所以,胃癌的早期診斷十分重要[3,4]。研究表明,許多生化分子標志物參與腫瘤的發生發展,可用于腫瘤的早期篩查[5]。因此,有必要進一步發掘胃癌發生發展過程中新的、特異性高的診斷標志物。近年來,生物信息學已成為癌癥基因表達譜數據挖掘的一種有效工具[6]。本研究從GEO數據庫中下載原始數據,通過比較胃癌樣本與正常組織樣本的基因表達譜篩選出差異表達基因(differentially expressed genes,DEGs),對其進行生物信息學分析并結合Kaplan-Meier plotter數據庫進行預后分析,為胃癌的診斷、靶向藥物研究及預后評價提供有價值的信息。
1.1資料 基因芯片數據的獲取:根據樣本來自人胃組織標本、有病例對照組、樣本數≥20這3個條件,從NCBI的GEO數據庫(https://www.ncbi.nlm.nih.gov/geo/)中篩選出3套胃癌數據集(GSE54129、GSE29998、GSE79973),以保證數據集的代表性。其中數據集GSE79973、GSE54129基于GPL570平臺,數據集GSE29998基于GPL6947平臺。GSE54129包含癌組織21例,正常組織111例;GSE79973包含癌組織和正常組織各10例;GSE29998包含癌組織50例,正常組織49例。
1.2方法
1.2.1DEGs的篩選 利用GEO數據庫自帶的在線分析工具GEO2R處理原始數據,將數據分為胃癌組和正常組進行分析。DEGs篩選標準:①校正后P<0.05;②|logFC|>1.5。將logFC<1.5的基因作為上調差異基因(UDEGs),logFC<-1.5的基因作為下調差異基因(DDEGs)。使用在線工具Draw Venn diagram(bioinformatics.psb.ugent.be/webtools/Venn/)確定3組數據的相交部分。
1.2.2DEGs的基因本體論(gene ontology,GO)富集分析與京都基因與基因組百科全書(the kyoto encyclopedia of genes and genomes,KEGG)通路分析 GO分析……