王加中,曹罡,劉陽(yáng),陳碩
西安交通大學(xué)第二附屬醫(yī)學(xué)普通外科,西安 710061
甲狀腺癌(thyroid carcinoma,TC)的發(fā)病率和病死率分別位居癌癥發(fā)病率和病死率的第7位和第22位[1]。甲狀腺乳頭狀癌(papillary thyroid carcinoma,PTC)是最常見的分化型TC[2],近年發(fā)病率逐漸升高。PTC主要通過(guò)頸部淋巴結(jié)進(jìn)行局部轉(zhuǎn)移,肺、骨等遠(yuǎn)處轉(zhuǎn)移發(fā)生率較低[3],腦轉(zhuǎn)移發(fā)生率僅為0.1%~5.0%。PTC 腦轉(zhuǎn)移患者的預(yù)后較差,5 年生存率僅1.3%[4]。目前PTC 腦轉(zhuǎn)移的確切發(fā)病機(jī)制尚未闡明。隨著基因芯片和高通量測(cè)序技術(shù)的發(fā)展,以GEO(Gene Expression Omnibus)、癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)為代表的高通量基因表達(dá)數(shù)據(jù)庫(kù)成為了生物信息學(xué)分析基因芯片的主要研究對(duì)象,多項(xiàng)研究成功發(fā)現(xiàn)了多種對(duì)腫瘤診斷、治療有價(jià)值的基因[5-6]。本研究從GEO 數(shù)據(jù)庫(kù)下載PTC 腦轉(zhuǎn)移患者的微針列數(shù)據(jù)集,篩選PTC腦轉(zhuǎn)移相關(guān)的差異表達(dá)基因(differentially expressed genes,DEGs),分析DEGs 的生物學(xué)功能,進(jìn)一步篩選PTC腦轉(zhuǎn)移的關(guān)鍵調(diào)控基因,現(xiàn)將結(jié)果報(bào)告如下。
1.1 PTC 腦轉(zhuǎn)移相關(guān)基因芯片的選取及預(yù)處理 以“papillary thyroid carcinoma”、“brain metastasis”為關(guān)鍵詞在GEO 數(shù)據(jù)庫(kù)中進(jìn)行檢索,基因表達(dá)數(shù)據(jù)類型為Expression profiling by array,種屬為人,選取基因芯片GSE66463 為研究對(duì)象,該基因芯片依托于GPL6244 平臺(tái),利用Affymetrix Human Gene 1.0 ST arrays 分析納入2 例PTC 腦轉(zhuǎn)移患者的轉(zhuǎn)移灶癌組織樣本、8 例PTC 患者的癌組織樣本、8 例腦膠質(zhì)瘤患者組織樣本,含有23 739 個(gè)可供分析基因。由于樣本中原始數(shù)據(jù)受基因探針、測(cè)序深度、基因長(zhǎng)度等諸多因素的影響,因此,分析前需對(duì)基因芯片數(shù)據(jù)進(jìn)行背景校正和歸一化處理,GSE66463芯片質(zhì)量控制的箱線圖中所有樣本中位數(shù)基本持平,樣本間歸一化程度高,說(shuō)明芯片質(zhì)量控制好,可用于下一步分析。
1.2 PTC 腦轉(zhuǎn)移灶癌組織差異表達(dá)基因的篩選 通過(guò)GEO 數(shù)據(jù)庫(kù)的在線分析工具GEO2R 分析并篩選差異表達(dá)基因,調(diào)用R 軟件中GEOquery、limma包,采用Benjamini&Hochberg檢驗(yàn),以Padj<0.05、|log2FC|≥2 作為差異表達(dá)基因的篩選標(biāo)準(zhǔn),篩選PTC腦轉(zhuǎn)移患者與PTC患者癌組織中的差異表達(dá)基因。
1.3 PTC 腦轉(zhuǎn)移灶差異表達(dá)基因的生物學(xué)功能分析 基于基因本體聯(lián)合會(huì)(Gene Onotology Consortium)建立的數(shù)據(jù)庫(kù)進(jìn)行的基因本體論(GO),GO 功能富集分析是對(duì)基因進(jìn)行注釋和生物學(xué)功能分析的重要工具,GO 從生物學(xué)過(guò)程、分子功能和細(xì)胞組分描述基因產(chǎn)物可能行使的分子功能,所處的細(xì)胞環(huán)境,以及參與的生物學(xué)過(guò)程。京都基因和基因組數(shù)據(jù) 庫(kù)(Kyoto Encyclopedia of Genes and Genomes,KEGG)信號(hào)通路富集分析是用于從大規(guī)模分子數(shù)據(jù)集中了解基因的富集通路。利用Metascape(https://metascape. org/)對(duì)差異表達(dá)基因進(jìn)行GO和KEGG 信號(hào)通路富集分析,對(duì)PTC 腦轉(zhuǎn)移的差異表達(dá)基因進(jìn)行功能注釋和富集分析。
1.4 PTC 腦轉(zhuǎn)移的關(guān)鍵調(diào)控基因篩選 String 數(shù)據(jù)庫(kù)(https://string-db.org/)是目前數(shù)據(jù)量最豐富、應(yīng)用最廣泛的研究蛋白質(zhì)相互作用的數(shù)據(jù)庫(kù),將差異表達(dá)基因集導(dǎo)入String 數(shù)據(jù)庫(kù)(https://string-db.org/)進(jìn)行分析,種屬限定為人,combined score 設(shè)定為0.9,構(gòu)建差異表達(dá)基因的蛋白質(zhì)相互作用網(wǎng)絡(luò)(protein protein interaction network,PPI),PPI 中每個(gè)節(jié)點(diǎn)代表1個(gè)蛋白質(zhì),節(jié)點(diǎn)內(nèi)為蛋白質(zhì)的三維結(jié)構(gòu),節(jié)點(diǎn)間的連線代表蛋白質(zhì)的相互作用,顏色越紅表明蛋白間連接度高。將PPI 輸出結(jié)果導(dǎo)入Cytoscape 3.9.1軟件,通過(guò)CytoHubba插件根據(jù)PPI網(wǎng)絡(luò)節(jié)點(diǎn)中的Degree 篩選排名前10 的Hub 基因,并利用“NetworkAnalyzer”工具進(jìn)行可視化,即為可能參與PTC腦轉(zhuǎn)移的關(guān)鍵調(diào)控基因。
1.5 PTC 腦轉(zhuǎn)移的關(guān)鍵調(diào)控基因與PTC 患者預(yù)后的關(guān)系分析 ①PTC 腦轉(zhuǎn)移的關(guān)鍵調(diào)控基因與PTC患者預(yù)后的關(guān)系:GEPIA(http://gepia. cancer-pku.cn)數(shù)據(jù)庫(kù)(gene expression profiling and interactive analyses,GEPIA)是北京大學(xué)基于TCGA 和GTEx 基因表達(dá)數(shù)據(jù)庫(kù)開發(fā)的交互式網(wǎng)站,將篩選的關(guān)鍵調(diào)控基因?qū)隚EPIA 數(shù)據(jù)庫(kù),分析條件為Datasets selection(THCA)、Methods(Overall survival)、Group cutoff 為Media,繪 制Kaplan-Meier 生 存 曲 線,Log rank檢驗(yàn)分析PTC 腦轉(zhuǎn)移的關(guān)鍵調(diào)控基因與PTC 患者預(yù)后的關(guān)系,P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。②PTC 腦轉(zhuǎn)移的關(guān)鍵調(diào)控基因表達(dá)蛋白與PTC 患者預(yù)后的關(guān)系:人類蛋白質(zhì)表達(dá)圖譜數(shù)據(jù)庫(kù)(The human protein atlas,HPA)是基于RNA 測(cè)序和蛋白免疫組化分析的轉(zhuǎn)錄組數(shù)據(jù)庫(kù)(https://www.proteinatlas.org),HPA 從染色、強(qiáng)度和數(shù) 量3 方面分 析多種腫瘤組織蛋白差異表達(dá)。利用HPA 數(shù)據(jù)庫(kù)分析關(guān)鍵調(diào)控基因的蛋白定位和表達(dá),分析PTC 腦轉(zhuǎn)移的關(guān)鍵調(diào)控基因蛋白與PTC 預(yù)后關(guān)系,兩組 間 比 較 采 用Log rank 檢 驗(yàn),P<0.05 為 差 異 有統(tǒng)計(jì)學(xué)意義。
2.1 PTC 腦轉(zhuǎn)移灶癌組織差異表達(dá)基因及生物學(xué)功能 篩選出183個(gè)差異表達(dá)基因,其中上調(diào)82個(gè),下調(diào)101 個(gè)。表達(dá)上調(diào)的有TRO、MAGEH1、PGK1、白 細(xì) 胞 介 素1α(IL1α)、IL1β、SLC6A14、ZCCHC12、LOC642980、PIM2、CSF2 等,表達(dá)下調(diào)的有有CDC20、PIFO、TARS2、CGN、S100A9、FLAD1、HSPA6、XPR1、ELF3、B3GNT7等。GO功能富集結(jié)果顯示,PTC 腦轉(zhuǎn)移患者癌組織差異表達(dá)基因主要富集在金屬離子動(dòng)態(tài)平衡、小分子轉(zhuǎn)運(yùn)、分子細(xì)胞間黏附、激素水平、細(xì)胞因子與炎癥反應(yīng)等過(guò)程上。KEEG 信號(hào)通路富集分析結(jié)果發(fā)現(xiàn),與差異表達(dá)基因相關(guān)的排名前10位的信號(hào)通路包括:風(fēng)濕性炎癥信號(hào)通路、NF-κB 信號(hào)通路、IL17 信號(hào)通路、軍團(tuán)桿菌病信號(hào)通路、沙門氏菌感染信號(hào)通路、錯(cuò)配修復(fù)信號(hào)通路、人T 細(xì)胞白血病病毒1 感染信號(hào)通路、TNF(tumor necrosis factor)信號(hào)通路、HIF-1(Hypoxia-inducible factor 1)信號(hào)通路、細(xì)胞因子受體間相互作用信號(hào)通路。
2.2 PTC 腦轉(zhuǎn)移關(guān)鍵調(diào)控基因 PTC 腦轉(zhuǎn)移患者癌組織差異表達(dá)基因編碼蛋白的PPI結(jié)構(gòu)圖見圖1。PTC腦轉(zhuǎn)移患者癌組織差異表達(dá)基因差異表達(dá)基因中IL1A-IL1B-OSM 是PPI 蛋白與蛋白之間作用的關(guān)鍵網(wǎng)絡(luò)。β-1,3-N-乙酰氨基葡萄糖氨基轉(zhuǎn)移酶(B3GNT7)、絲氨酸/蘇氨酸激酶(BUB1)、細(xì)胞分裂周期蛋白20(CDC20)、集落刺激因子2(CSF2)、趨化因子CXC 配體2(CXCL2)、IL1A、IL1B、骨誘導(dǎo)因子(OGN)、骨調(diào)蛋白(OMD)、脯氨酸/精氨酸豐富端亮氨酸豐富重復(fù)蛋白(PRELP)可能是參與PTC腦轉(zhuǎn)移的關(guān)鍵調(diào)控基因。

圖1 PTC腦轉(zhuǎn)移患者癌組織差異表達(dá)基因編碼蛋白的PPI結(jié)構(gòu)圖
2.3 PTC 腦轉(zhuǎn)移關(guān)鍵調(diào)控基因及其蛋白與PTC 預(yù)后的關(guān)系。 GEPIA 數(shù)據(jù)庫(kù)分析結(jié)果顯示,BUB1、CDC20、CSF2、CXCL2、IL1A、IL1B、OGN、OMD、PRELP 基因表達(dá)高低與PTC 患者的預(yù)后無(wú)關(guān)(P均>0.05)。與B3GNT7 低表達(dá)者比較,B3GNT7 高表達(dá)的PTC患者預(yù)后較好(P=0.044<0.05)。
HPA 數(shù)據(jù)庫(kù)分析結(jié)果顯示,B3GNT7 是一類代謝類蛋白質(zhì),主要定位于細(xì)胞內(nèi)高爾基體。利用HPA 數(shù)據(jù)庫(kù)分析B3GNT7 基因表達(dá)蛋白高低對(duì)PTC預(yù)后的影響,數(shù)據(jù)庫(kù)中共收錄501 例PTC 患者的臨床資料,其中男135 例、女366 例,存活485 例、死亡16 例,TNM 分期為Ⅰ期281 例、Ⅱ期52 例、Ⅲ期111例、Ⅳ期57 例,生存分析結(jié)果顯示B3GNT7 蛋白高、低表達(dá)的PTC 患者5 年存活率分別為96%、80%(P<0.05)。免疫組化結(jié)果顯示B3GNT7 主要表達(dá)于甲狀腺濾泡上皮細(xì)胞內(nèi)。
PTC 占甲狀腺癌的90%以上,腦轉(zhuǎn)移發(fā)生率較低,但致死率較高。PTC 腦轉(zhuǎn)移主要發(fā)生在腦實(shí)質(zhì)內(nèi),癥狀表現(xiàn)為頭痛、顱內(nèi)高壓癥狀以及顱神經(jīng)壓迫癥狀、昏迷等[7-8]。目前對(duì)PTC 腦轉(zhuǎn)移的治療方法尚存爭(zhēng)議[9]。有學(xué)者[10]建議對(duì)孤立轉(zhuǎn)移灶建議手術(shù)切除,有學(xué)者[11-13]觀察了7 例PTC 腦轉(zhuǎn)移患者,7 例患者中大多伴有肺轉(zhuǎn)移,且能夠攝取I131,可行放射性I131治療,對(duì)無(wú)攝I131功能的病灶則需行放療或化療,但以上治療方案均可能增加患者腦水腫風(fēng)險(xiǎn),病死率較高。因此需要進(jìn)一步探索PTC腦轉(zhuǎn)移的發(fā)病機(jī)制,從而尋找最佳治療方案。
隨著基因芯片技術(shù)的發(fā)展,生物信息學(xué)成為我們從基因水平揭示腫瘤發(fā)生、發(fā)展的重要研究方法[14-16],新一代的基因測(cè)序技術(shù)包括單細(xì)胞測(cè)序、空間轉(zhuǎn)錄組測(cè)序等生物技術(shù)的發(fā)展使我們能從基因水平探索腫瘤的發(fā)生發(fā)展機(jī)制。本研究采用生物信息學(xué)方法分析GSE66463 數(shù)據(jù)集中的23 739 個(gè)基因,篩選出183 個(gè)差異表達(dá)基因。其中表達(dá)上調(diào)的有TRO、MAGEH1、PGK1、IL1A、IL1B、SLC6A14、ZCCHC12、LOC642980、PIM2、CSF2 等基因,表達(dá)下調(diào)的有CDC20、PIFO、TARS2、CGN、S100A9、FLAD1、HSPA6、XPR1、ELF3、B3GNT7 等基因,通過(guò)功能注釋和富集分析顯示這些差異表達(dá)基因主要的分子功能與金屬離子動(dòng)態(tài)平衡、分子細(xì)胞間黏附等有關(guān)。
多種癌癥組織中金屬離子的含量與腫瘤細(xì)胞增殖、血管生成、凋亡有關(guān),近些年來(lái),已有多項(xiàng)研究證實(shí)鐵、銅死亡等金屬離子誘導(dǎo)的調(diào)節(jié)性凋亡的與腫瘤的發(fā)生發(fā)展有關(guān)。鐵死亡是以細(xì)胞內(nèi)鐵超載和活性氧累積導(dǎo)致脂質(zhì)過(guò)氧化為特征的一種調(diào)節(jié)性細(xì)胞死亡(regulatory cell death,RCD)過(guò)程,銅死亡也是一種金屬離子誘導(dǎo)的RCD 過(guò)程,正常情況下,細(xì)胞內(nèi)金屬離子濃度通過(guò)主動(dòng)穩(wěn)態(tài)機(jī)制保持在較低水平,當(dāng)金屬離子動(dòng)態(tài)平衡被打破后,過(guò)載的金屬離子會(huì)導(dǎo)致細(xì)胞的過(guò)度呼吸作用,產(chǎn)生細(xì)胞毒性,最終誘導(dǎo)其死亡,與腫瘤發(fā)生發(fā)展密切相關(guān)。細(xì)胞間黏附分子是介導(dǎo)細(xì)胞間或細(xì)胞與細(xì)胞外基質(zhì)間相互接觸和結(jié)合的一類細(xì)胞表面跨膜糖蛋白統(tǒng)稱。分子以受體—配體結(jié)合的形式發(fā)揮作用,參與細(xì)胞的識(shí)別、細(xì)胞的活化和信號(hào)轉(zhuǎn)導(dǎo)、細(xì)胞的增殖與分化,細(xì)胞的伸展與移動(dòng),是腫瘤轉(zhuǎn)移的分子基礎(chǔ),目前已發(fā)現(xiàn)黏附分子中的E-鈣黏蛋白、β-環(huán)連蛋白(β-catenin)以及上皮細(xì)胞黏附分子(EP-CAM)能夠促進(jìn)乳腺癌、食管癌等多種腫瘤細(xì)胞轉(zhuǎn)移。KEEG 信號(hào)通路富集分析顯示風(fēng)濕性炎癥信號(hào)通路、NF-κB信號(hào)通路、錯(cuò)配修復(fù)信號(hào)通路、TNF信號(hào)通路、HIF-1信號(hào)通路、細(xì)胞因子受體間相互作用信號(hào)通路等參與PTC腦轉(zhuǎn)移的發(fā)病機(jī)制,錯(cuò)配修復(fù)(MismatchRepair,MMR)基因的產(chǎn)物是錯(cuò)配修復(fù)蛋白,通過(guò)修復(fù)DNA 復(fù)制過(guò)程中錯(cuò)配的堿基使DNA 能精確復(fù)制,當(dāng)MMR 基因發(fā)生突變,錯(cuò)配修復(fù)蛋白的表達(dá)量下降、不表達(dá)或出現(xiàn)截短,對(duì)DNA 復(fù)制過(guò)程中發(fā)生的缺失和插入不能校正或糾錯(cuò),引起基因組DNA 不穩(wěn)定,導(dǎo)致腫瘤進(jìn)展。差異表達(dá)基因中Hub 基因有B3GNT7、BUB1、CDC20、CSF2、CXCL2、IL1A、IL1B、OGN、OMD、PRELP,但PTC 預(yù)后生存分析結(jié)果顯示Hub 基因中的9 個(gè)基因僅有統(tǒng)計(jì)學(xué)差異,對(duì)PTC 預(yù)后無(wú)明顯影響,只有B3GNT7 不僅有統(tǒng)計(jì)學(xué)差異,同時(shí)在基因和蛋白水平均與PTC預(yù)后相關(guān)。
B3GNT7 屬于β3GlcNAcT 基因家族成員之一,B3GNT7 是糖基轉(zhuǎn)移酶β3GlcNAcT 家族8 個(gè)亞族成員之一,定位于19q13.2,基因序列有由3 個(gè)外顯子和2 個(gè)內(nèi)含子組成,其主要功能是催化還原糖蛋白末端N-乙酰半乳糖胺與絲氨酸或蘇氨酸形成的α-糖苷鍵,在多種腫瘤和正常組織中均有差異表達(dá)。β3GlcNAcT是一種與組織惡變有關(guān)的Ⅱ型跨膜蛋白,其功能與細(xì)胞膜上糖蛋白的結(jié)構(gòu)變化有關(guān),參與細(xì)胞間黏附、細(xì)胞識(shí)別、免疫應(yīng)答等,研究[17-20]報(bào)道其家族成員B3GNT1 低表達(dá)與胰腺癌預(yù)后差有關(guān),B3GNT7 在卵巢癌組織和癌旁組織中呈差異表達(dá),B3GNT7 在甲狀腺乳頭狀癌的中作用機(jī)制研究較少,本研究結(jié)果發(fā)現(xiàn)B3GNT7 基因高表達(dá)PTC 患者預(yù)后好于低表達(dá)患者,提示B3GNT7 對(duì)PTC 起抑癌基因作用,從PPI蛋白網(wǎng)絡(luò)中可見B3GNT7蛋白與CCL13、OMD、PRELP 蛋白在轉(zhuǎn)錄后相互作用緊密,但具體機(jī)制不詳,仍需進(jìn)一步探索其基因和信號(hào)通路的具體調(diào)控機(jī)制。CARROLL 等[21]發(fā)現(xiàn),IL22 通過(guò)上調(diào)STAT3 信號(hào)通路,誘導(dǎo)B3GNT7 上調(diào)表達(dá),進(jìn)而誘導(dǎo)細(xì)胞發(fā)生糖蛋白巖藻糖基化,可能與抑制腫瘤發(fā)生發(fā)展有關(guān)。
綜上所述,與PTC 患者比較,PTC 腦轉(zhuǎn)移患者癌組織中有183 個(gè)差異表達(dá)基因,差異表達(dá)基因與金屬離子動(dòng)態(tài)平衡、小分子轉(zhuǎn)運(yùn)及分子細(xì)胞間黏附等有關(guān)。IL1A-IL1B-OSM 是PTC 腦轉(zhuǎn)移PPI 蛋白與蛋白之間作用的關(guān)鍵網(wǎng)絡(luò)蛋白,B3GNT7、BUB1、CDC20、CSF2、CXCL2、IL1A、IL1B、OGN、OMD、PRELP 可能是PTC 腦轉(zhuǎn)移的調(diào)控基因。B3GNT7 表達(dá)與PTC 患者的預(yù)后密切相關(guān),可能是PTC 腦轉(zhuǎn)移的關(guān)鍵調(diào)控基因。