劉海濤 戚維波 楊帆 陸超 牛牛
肉瘤(sarcoma)是來源于間葉組織的惡性腫瘤,常發生于皮膚、皮下、骨膜及長骨兩端,好發于成年人,主要有軟組織肉瘤和骨肉瘤兩種類型[1]。軟組織肉瘤有50多種亞型,最常見的是多形性未分化肉瘤,其次是脂肪肉瘤(25%~30%)、平滑肌肉瘤(12%)、滑膜肉瘤(10%)等[2]。肉瘤的治療以化療應用最為廣泛,但30%~50%的患者最終因肺轉移而死亡,5年總生存率<10%,且預后差[3]。靶向治療是近年來出現的一種新的腫瘤治療策略,通過阻斷腫瘤血管生成來抑制腫瘤的增殖、侵襲與轉移[4]。因此,探索潛在的新藥物靶標聯合化療制定個體化治療方案以改善患者預后具有重要意義。該研究通過GEO和TCGA數據庫,基于生物信息學分析EXT1在肉瘤患者中的表達水平,闡明EXT1在人類肉瘤中的不同表達模式、潛在功能機制和預后價值,現報道如下。
1.1 數據資料 GEO(http://www.ncbi.nlm.nih.gov/geo)是一個公共功能基因組學數據庫,包含高通量基因表達數據、芯片和微陣列。EXT1表達水平從GEO數據庫中的GSE2719數據集(Affymetrix GPL96 platform,Affymetrix Human Genome U133A Array)下載。根據平臺上的注釋信息,將探針轉換成相應的基因符號。GSE2719數據集包含39個人類肉瘤樣本(GSM 52571-GSM52609)和15個對照樣本(GSM52556-GSM52570)。
1.2 CCLE數據庫分析 癌癥細胞系百科全書(cancer cell line encyclopedia,CCLE)(https://portals.broadinstitute.org/ccle)[5]整合了來自大約1,100個人類癌細胞系的基因表達,染色體拷貝數和大規模平行數據,以及24種抗癌藥物在50%這些細胞系中的藥理概況。CCLE數據集驗證了EXT1在各癌細胞系中的表達。
1.3 實驗材料 高糖培養基DMEM購自Hyclone公司,DPBS(PBS粉劑)不含鈣鎂購自Boster公司,10%胎牛血清(FBS)、含EDTA 0.25%胰蛋白酶均購自Gibco公司,SYBR Premix EX Taq II、Prime ScriPt RT Master Mix均購自Takara公司,DMSO(細胞培養級別)購自MP Biomedicals 公司,β-actin/EXT1引物購自安徽通用生物公司,細胞培養用青霉素-鏈霉素、PVDF膜(0.2uM)、QuickBlockTMWestern一抗二抗稀釋液、Western轉膜液、Western電泳液、QuickBlockTMWestern封閉液、Western洗滌液、Western一抗二抗去除液(弱堿性)均購自碧云天公司,EXT1一抗購自Abcam公司,二抗:HRP 標記山羊抗兔IgG購自Servicebio公司。
1.4 細胞培養 人類肉瘤細胞系(MG-63骨肉瘤、RD橫紋肌肉瘤、HT1080纖維肉瘤)和相應的正常細胞(hFOB1.19人類成骨細胞細胞、HSMC人類骨骼肌細胞、WI38人類成纖維細胞)均購自賽百慷(上海)生物科學公司。所有的細胞系培養含4.5 g/L葡萄糖Dulbecco’s Modified Eagle Medium(DMEM,Gibco BRL,USA)含10%胎牛血清(FBS,Gibco BRL,USA)和1%的抗生素。所有細胞均置于37 ℃、5% CO2培養箱培養。
1.5 RNA提取、逆轉錄和實時熒光定量PCR 使用Trizol試劑(Sangon Biotech,China)按照說明書從細胞中提取總RNA。2021年1月,于深圳市瑞科生物科技有限公司實驗室將樣本總RNA逆轉錄成 cDNA,使用PrimeScriptTM RT reagent Kit with gDNA Eraser(Takara,China)進行逆轉錄反應,采用Takara Bio’s SYBR Premix Ex TaqTM II在Bio - rad CFX96 real-time PCR系統中進行實時定量PCR。PCR反應條件為95 ℃ 10 min,95 ℃ 5 s,60 ℃ 30 s,72℃ 30 s,共40個循環。反應結束后,根據內參校正各個樣本,計算△Ct值,以2-ΔΔCt表示目的基因的相對表達量[6]。采用以下引物:β-actin正向引物5'-AAC AGGGTGGTGGACCTCAT-3',反向 引 物5'-GGAGGGGAGATTCAGTGTGG-3';EXT1正向引物GCTCTTGTCTCGCCCTTTTGT;反向引物GTGGTGCAAGCCATTCCTAC。
1.6 蛋白質免疫印跡 以anti-EXT1(A-7)(Santa Cruz,USA,1∶2,000)、anti-Actin(Santa Cruz,USA,1∶4,000)作為一抗。以1∶3,000~1∶5,000比例稀釋的HRP-linked anti-IgG(Santa Cruz)作為二抗。選取β-actin為內參蛋白。采用ECL化學發光自顯影,利用Image J軟件將目的條帶灰度數值化,并與內參的灰度值作歸一化處理,制作直方圖。
1.7 UALCAN數據庫分析 UALCAN數據庫(http://ualcan.path.uab.edu/index.html)使用TCGA RNA-seq和來自31種癌癥類型的臨床數據,對TCGA基因表達數據進行深入分析[7]。使用該數據庫對EXT1表達情況與臨床病理特征的相關性進行分析。
1.8 Kaplan-Meier plottor數據庫分析 Kaplan-Meier plotter(http://www.kmplot.com)分析了肉瘤患者(n=259)的總生存期(overall survival,OS)和無進展生存期(progression free survival,PFS)。患者樣本根據基因的中位表達(高表達vs.低表達)分為兩組,計算95%置信區間和對數等級P值的危險比(HR),并在圖上顯示。1.9 LinkedOmics數據庫 LinkedOmics(http://www.linkedomics.orglogin.php)包含了來自TCGA的32種癌癥的多組數據[8]。使用LinkedOmics的LinkFinder模塊研究TCGA肉瘤隊列中與EXT1相關的差異表達基因(n=259)。EXT1共表達采用Pearson相關系數進行統計分析,并在火山圖、熱圖或散點圖中呈現。
1.10 GeneMANIA GeneMANIA(http://www.genemania.org)是用于構建蛋白質相互作用(proteinprotein interaction,PPI)的網絡,闡明基因和數據集之間的關系[9]。該研究使用GeneMANIA從物理相互作用、共表達、預測、共定位和遺傳相互作用等方面可視化EXT1的基因網絡,并進行功能評估。
1.11 String和DAVID數據庫 String數據庫(https://string-db.org/)(11.0版)是分析生物學基因或蛋白相互作用的檢索工具,包含已證實以及可預測蛋白質-蛋白質相互作用的生物數據庫和網絡資源[10]。打開數據庫輸入多個差異基因,物種類型選擇人類,構建靶基因的PPI網絡。DAVID(http://david.abcc.ncifcrf.gov/)是一個用于注釋、可視化和綜合發現的在線數據庫,是了解多基因背后生物學意義的綜合性工具[11]。使用DAVID中的基因本體論(gene ontology,GO)和《京都基因與基因組百科全書》(kyoto encyclopedia of genes and genomes,KEGG)進行功能和通路富集分析。
1.12 統計學方法 使用GraphPad Prism(version 6.01)軟件(GraphPad software,Inc.,La Jolla,CA,USA)進行統計分析。實驗重復≥3次,計量資料以(±s)表示,組間比較采用t檢驗。以P<0.05為差異有統計學意義。
2.1 肉瘤患者EXT1的轉錄水平 根據GEO數據庫GSE2719數據集,EXT1 mRNA在人類肉瘤組織中表達水平為(7.696±0.153),高于癌旁組織的(5.580±0.255)(P<0.001,95% CI:1.529~2.704),見圖1A。進一步將肉瘤患者中EXT1表達水平繪制 ROC 曲線并計算曲線下面積(AUC)值,結果顯示EXT1的AUC值(P<0.001,AUC=0.9350,95% CI:0.873~0.997)對人類肉瘤具有較高的診斷價值,見圖1B。

圖1 EXT1基因在人類肉瘤中的表達水平及其診斷價值(GEO)
2.2 EXT1在人類不同類型腫瘤和各腫瘤細胞系中的轉錄水平 利用UALCAN和CCLE數據庫,EXT1在人類多種腫瘤和各腫瘤細胞系中的表達水平均顯著上調。在一組人類癌癥中,EXT1在人類肉瘤細胞系中的表達顯著升高,尤其是軟骨肉瘤、骨肉瘤和尤文肉瘤。見圖2和圖3。

圖2 EXT1在人類不同類型腫瘤中的轉錄水平(UALCAN)

圖3 EXT1在人類各種類型腫瘤細胞系中的表達水平(CCLE)
2.3 EXT1在人類肉瘤細胞系中的表達 為驗證基于微陣列數據集分析的結果,分別采用qRT-PCR和Western Blot方法檢測了3個人類肉瘤細胞系(MG-63、RD、HT1080)及其對應的正常細胞(hFOB1.19、HSMC、WI38)中EXT1基因mRNA和蛋白表達情況(圖4A-4B),結果證實EXT1在人類肉瘤細胞系中的表達水平明顯高于正常細胞(P<0.05),見圖4C。

圖4 EXT1在人類肉瘤細胞系的表達水平
2.4 EXT1表達水平與人類肉瘤患者臨床病理特征的關系 使用UALCAN數據庫進一步驗證TCGA中260個人類肉瘤樣本中EXT1表達水平與多種臨床病理特征之間的相關性。結果顯示,EXT1的轉錄水平與種族、年齡及TP53突變狀態顯著相關(P<0.05),與性別無關。見圖5和表1。

表1 EXT1的表達水平與肉瘤患者臨床病理特征之間的相關性

表1 (續)

圖5 EXT1 mRNA表達與肉瘤患者臨床病理特征的關系(UALCAN)
2.5 EXT1在人類肉瘤中的預后評估價值 使用cBioPortal數據庫在線數據,采用Kaplan-Meier生存曲線分析患者生存情況,高表達的EXT1在OS和PFS均有所降低,差異有統計學意義(P<0.001,P=0.016),見圖6。因此,EXT1的高表達可作為人類肉瘤患者預后不良的潛在指標。

圖6 高表達的EXT1在人類肉瘤患者中的預后評估
2.6 EXT1在人類肉瘤中的共表達基因及網絡分析 利用LinkedOmics的功能模塊對259例TCGA 肉瘤患者的mRNA測序數據進行分析。Pearson相關檢驗分析EXT1與在人類肉瘤中差異表達的基因之間的相關性,有3,246個基因(暗紅點)與EXT1呈顯著正相關,有3,408個基因(暗綠點)與EXT1呈顯著負相關([FDR] <0.01),見圖7A。分別選取前50個與EXT1正相關和負相關的共表達基因繪制熱圖,見圖7B。結果表明,這些基因在人類肉瘤中具有重要研究價值,其在人類肉瘤中的生物學功能和分子機制有待進一步探索。

圖7 肉瘤患者中與EXT1相關的共表達基因
2.7 EXT1及其共表達基因分析和PPI網絡 進一步預測EXT1與人類肉瘤共表達基因的相互作用,利用GeneMANIA數據庫構建了共表達網絡,見圖8A。該網絡中共表達最顯著的9個基因為EXT2、EXTL1、EXTL2、CPT1A、EXTL3、ANXA5、B4GALT1、B4GALT4和OSTF1。結果表明,該模塊的基因主要富集于硫酸乙酰肝素蛋白聚糖生物合成過程、糖胺聚糖生物合成過程和氨基聚糖生物合成過程。通過String對人類肉瘤中與EXT1相關的50個基因構建了蛋白相互作用網絡,見圖8B.

圖8 EXT1的基因相互作用網絡和蛋白相互作用網絡
2.8 EXT1及其共表達基因的功能富集分析 利用DAVID數據庫中的GO和KEGG對共表達基因的功能和通路富集分析。GO富集分析表明,生物過程(biological process,BP)主要是由糖胺聚糖生物合成過程、細胞分化、硫酸肝素蛋白聚糖代謝過程、細胞遷移、細胞或亞細胞成分的移動、細胞過程的調節、信號轉導、細胞代謝過程引起的。分子功能(molecular function,MF)主要集中在層粘連蛋白結合、整合素結合、硫酸乙酰肝素N-乙酰氨基轉移酶活性、膠原結合、蛋白結合、信號受體結合等方面。細胞成分主要集中在細胞外區域、細胞器膜和內質網膜上,見圖9。KEGG通路分析表明,主要富集于細胞外基質及其受體相互作用,硫酸乙酰肝素生物合成,Rap1信號通路,Wnt信號通路,PI3K-Akt信號通路以及Ras信號通路等,見圖10。

圖9 EXT1及其50個共表達基因在肉瘤患者中的生物學功能富集分析

圖10 EXT1及其50個共表達基因在肉瘤患者中的KEGG分析
目前,EXT1已經證實與多發性骨軟骨瘤的發生相關,是一種常染色體顯性遺傳疾病,處于人類染色體8q23-24.1上的基因發生突變,所編碼的蛋白質分別含有746個氨基酸,可形成異種寡聚物復合體,參與調節細胞表面硫酸乙酞肝素蛋白聚糖(HSPGs),HSPGs是生物學上最重要的糖結合物,在分子水平的各種事件中起著至關重要的作用[12]。有研究表明,HSPG參與細胞黏附、遷移、增殖和信號通路,影響腫瘤不同階段的進展[13]。目前,相關文獻報道EXT1已被確定為惡性腫瘤發生、發展及預后的分子生物標志物[14]。近年來,EXT1突變在諸多腫瘤發生發展中的表現均有所報道,如肝癌[15]、急性淋巴細胞白血病[16]、多發性骨質疏松癥[17]、星形細胞瘤[18]和骨肉瘤[19]等。迄今為止,EXT1在不同類型人類肉瘤中的作用及其分子機制仍不清楚。為了更深入地了解EXT1在人類肉瘤中的表達、預后以及潛在功能,筆者對公共測序數據進行了生物信息學分析,以指導肉瘤的未來研究,主要通過GEO和TCGA的轉錄數據庫進行研究,EXT1在人類肉瘤組織樣本和細胞系中表達水平明顯升高。高表達的EXT1與臨床病理特征(種族、年齡和TP53突變狀態)顯著相關,與性別無關。與相應的正常細胞(hFOB1.19、HSMC、WI38)比較,EXT1在3種人類肉瘤細胞系(MG-63、SW872、HT1080)中基因mRNA和蛋白表達情況均呈顯著過表達。此外,肉瘤患者中EXT1的高表達與不良的OS和PFS相關,提示預后不良。還利用GeneMANIA數據庫構建了EXT1及其共表達基因相互作用網絡,使用String數據庫構建EXT1及其共同表達基因蛋白相互作用網絡以獲得這些基因的相互作用,利用DAVID數據庫中的GO和KEGG對共表達基因的功能和通路富集分析,表明主要參與細胞分化、硫酸肝素蛋白聚糖代謝過程、細胞遷移、ECM受體相互作用,Rap1信號通路、Wnt信號通路、PI3K-Akt信號通路以及Ras信號通路等參與調控。
綜上所述,EXT1在人類肉瘤中的高表達水平與腫瘤的發生發展以及對患者的預后影響有著舉足輕重的作用,是非常有前途的潛在分子靶點和生物標志物,有望成為早期診斷、治療和評估預后的生物標志物。EXT1基因在人類肉瘤中可能是一個潛在的致癌基因,有必要對該基因在肉瘤中的作用機制及生物學功能進行深入探討,全面了解其在惡性腫瘤中的作用,為肉瘤的診治提供更多診斷依據。該研究為EXT1在人類肉瘤發生發展中的重要性及其作為人類肉瘤標志物的潛力提供了理論依據,對人類肉瘤分子生物學特性的異質性和復雜性進行了較為全面的認識。