李樹強
(中國醫科大學附屬盛京醫院普通外科,沈陽 110004)
原發性肝癌是目前我國第四位常見的惡性腫瘤,在腫瘤致死疾病中排第三位,嚴重威脅人們的生命和健康。肝細胞癌 (hepatocellular carcinoma,HCC) 占原發性肝癌的80%以上,手術切除和肝移植是根治原發性HCC的主要手段,但是由于早期發現困難,放化療效果不佳,5年生存率僅為15%[1]。因此,更好地了解HCC發生的分子機制,發現影響HCC 5年生存期的關鍵基因,為HCC治療提供新的靶點已成當務之急。
登陸TCGA數據庫 (https://cancergenome.nih.gov)網站下載公開的HCC轉錄組數據和腫瘤樣本臨床數據。其中,生存期>5年 (無論存活與否) 的癌癥樣本43例,生存期<5年 (已死亡) 的癌癥樣本107例。本研究旨在探討影響HCC 5年生存率的關鍵基因,故排除隨訪時間不到5年且存活的樣本。
使用轉錄組數據中的reads count評估基因表達水平,應用R軟件 (3.5.1版本) 中的limma及edgeR軟件包[2]對數據進行標準化及差異表達分析,gplots軟件包對數據進行圖形可視化。篩選log FC絕對值 >2,FDR <0.01的基因為差異表達基因。
DAVID (The Database for Annotation,Visualization and Integrated Discovery) 是一個在線數據庫[3](https://david.ncifcrf.gov),為研究人員提供了一套全面的功能注釋工具,以便理解大量基因背后的生物學意義。應用DAVID分別對上調和下調差異表達基因進行GO (gene ontology) 和 KEGG (Kyoto encyclopedia of genes and genomes) 富集分析,P< 0.05為差異有統計學意義。
將差異基因上傳到STRING數據庫[4](https://string-db.org),選擇置信度> 0.4構建蛋白-蛋白互作(PPI)網絡。基因在PPI網絡的連接度 (degree) ≥8且排名前10位的基因定義為候選關鍵基因。
應用在……