李曉晗 曹國磊 牛海文 何麗麗 王清鶴 曹嘉芮 袁夢 阿麗亞·奧斯曼 李蕊 羅琴
肺癌是目前全世界死亡率最高的惡性腫瘤[1],其中肺腺癌約占肺癌50%,五年存活率低至20%[2]。DNA甲基化為DNA化學修飾的一種形式,能夠在不改變DNA序列的前提下改變遺傳表現[3]。研究表明甲基化在正常人群中一直趨于穩定,但是在腫瘤細胞中卻呈現出異常表達的征象[4]。差異甲基化區域(DMR)是指基因組上不同組間甲基化值有顯著差異的一個片段。目前關于肺腺癌患者差異甲基化區域分析的研究鮮有報道。本研究擬通過850K芯片甲基化檢測平臺于全基因組水平檢測肺腺癌組與正常對照組甲基化區域,利用Bump hunter的方法尋找兩組差異甲基化區域,并利用Gene Ontology數據庫和KOBAS軟件對差異甲基化區域所對應目的基因行進一步GO分析和KEEG分析,旨在探討差異甲基化區域在肺腺癌發病中的作用機制,為肺腺癌的診治提供新的理論依據。
納入與排除標準:收取新疆醫科大學附屬腫瘤醫院2019年1月至2019年12月肺腺癌患者與正常對照人群外周血標本各4例,并對其進行DNA提取。肺腺癌患者的診斷標準為:經組織病理學明確診斷為肺腺癌,不患有其他病理學類型腫瘤,無慢性阻塞性疾病,無其他心血管疾病,無栓塞的患者。對照組選取標準:同時期就診我院的無惡性腫瘤疾病,無慢性阻塞性肺疾病,無心血管疾病,無栓塞等的正常人群作為對照組。所有入組人員均簽署相關知情同意書,并經新疆醫科大學附屬腫瘤醫院倫理委員會批準(倫理審批號為:2019BC007)。
1 提取DNA以及樣品質檢 使用試劑盒(TIANGEN BIOTECH,BEIJING)提取外周血中的基因組DNA。對于DNA,先用分光光度計定量,并將樣品調到標準濃度50 ng/μL,20 μL,然后用0.8%的瓊脂糖凝膠電泳。樣品電泳主帶清晰,通常不小于10 kb,沒有明顯降解,總量5 μg以上,可進行下游的甲基化芯片實驗。
2 亞硫酸鹽轉化 根據ILLumina官方推薦的Zymo EZ DNA Methylation Kit優化方法進行亞硫酸鹽轉化。
3 DNA擴增 制備MSA3板 在樣本中加入0.1N NaOH使DNA變性為單鏈,經中和后加入全基因組擴增試劑,在37℃恒溫條件下過夜孵育。
4 DNA的片段化、重懸 DNA片段化 擴增后產物,經過酶解處理,得到片段化DNA。DNA沉淀:加入異丙醇在4℃下離心沉淀DNA片段。DNA重懸:沉淀后的DNA在空氣中干燥后,加入雜交緩沖試劑使DNA沉淀重新溶解。
5 DNA與芯片的雜交 將重懸后的DNA樣本與準備好的芯片雜交,置于雜交爐內過夜。在雜交過程中,片段化的DNA經過變性,與特異位點的50個堿基退火。
6 芯片清洗、單堿基延伸、染色 洗去未雜交和非特異雜交的DNA,以捕獲到的DNA為模板,在芯片上加入可檢測的熒光基團,從而區分樣本的甲基化狀況。包被芯片:將反應完成的芯片放入XC4試劑中,使其表面包裹上一層粘性透明液體,再將其放入真空環境下干燥1小時,從而將芯片包被,保護其信號穩定較長的時間。
7 芯片掃描和數據提取 提前下載相應的manifest文件,將處理好的芯片放入掃描儀,利用激光激發芯片上單堿基延伸產物的熒光基團,掃描儀獲取由熒光基團發出的熒光,并生成原始數據,記錄掃描結果存放的位置。由此所得的數據直接導入R包ChAMP軟件進行分析,從而就得到每個樣本每個位點的甲基化水平數據。
1 將掃描得到的原始數據,通過R包ChAMP,獲得每個位點的原始信號值和DetectionP等信息,然后對數據進行質控,再對探針類型偏倚校正后得到最終可用于差異分析的甲基化水平(Beta值)。
2 差異甲基化區域分析 采用Bumphunter的方法尋找差異甲基化區域,該方法首先根據位點距離信息來聚簇cluster,然后再在每個cluster中篩選出甲基化水平一致的連續候選區段,Bumphunter根據候選區段構建線性統計模型,篩選出明顯差異的區段(P<0.05)。
3 功能富集分析 將篩選出來的差異甲基化區域進行GO功能和KEGG途徑分析,了解該區域的功能和可能參與的通路。
肺腺癌患者與正常對照組對比,發現七個差異基因甲基化區域,分別為DMR-1,DMR-2,DMR-3,DMR-4,DMR-5,DMR-6,DMR-7;其中DMR-1、DMR-2、DMR-3 、DMR-4、DMR-6位于6號染色體上,DMR-5位于11號染色體上,DMR-7位于20號染色體上(P<0.05)(表1)。DMR-1(33048254-33048879)寬度為625bp;DMR-2(31148332-31148666)寬度334bp;DMR-3(28557047-28557765)寬度718bp;DMR-4(29648452-29649084)寬度632bp;DMR-5(18433500-18434354)寬度854bp;DMR-6(31539539-31540121)寬度582bp; DMR-7(3051954-3052345)寬度391bp。(P<0.05)。 肺腺癌組DMR-1,DMR-2,DMR-4,DMR-5,DMR-7其CPG位點甲基化水平均高于正常對照組,其目的基因分別是HLA-DPB1、HLA-DPA1,POU5F1,2FP57,LDHC,OXT,差異具有統計學意義(P<0.05)(表2)。而肺腺癌組DMR-3,DMR-6其CPG位點甲基化水平位點低于正常對照組,其目的基因分別是RP5-1186N24.3、SCAND3,LTA,差異具有統計學意義(P<0.05)。

表1 肺癌組與正常對照組差異甲基化區域對比

表2 肺癌組與正常對照組差異甲基化區域所含甲基化位點及目的基因
1 GO功能富集分析 GO富集分析(Gene Ontology,GO)主要包括三個部分,即生物學途徑(Biological process),細胞成分(cellular component)和分子功能(Molecular Function)。本課題組以P<0.05為標準,根據這三個部分分別篩選出差異甲基化可能參與的30個GO功能,結果顯示肺腺癌差異甲基化基因在多種不同的功能領域中表達,功能富集最顯著的有生物學途徑中的正向調節干擾素-γ|GO:0032729,乳酸氧化|GO:0019516,丙酮酸的乳酸生物合成過程|GO:0019244,后腸收縮的積極調節|GO:0060450,慢性炎癥反應對抗原刺激的正向調節|GO:0002876等途徑;細胞成分中的MHCⅡ類蛋白復合物|GO:0042613,內質網膜腔側的積分成分|GO:0071556,膜的管腔側|GO:0098576,clathrin-包膜內細胞囊泡膜|GO:0030669,ER至高爾基轉運囊泡膜|GO:0012507等成分;分子功能中的催產素受體結合|GO:0031855,神經垂體激素活性|GO:0005185,升-乳酸脫氫酶活性|GO:0004459,肽抗原結合|GO:0042605,腫瘤壞死因子受體結合|GO:0005164等功能;其中在生物學途徑方面,主要在正向調節干擾素-γ|GO:0032729中;在細胞成分方面,主要在MHCⅡ類蛋白復合物|GO:0042613中;在分子功能中,主要與催產素受體|GO:0031855等有著一定的關系。
2 KEGG信號通路分析 根據篩選出來的肺腺癌差異甲基化區域進行KEGG分析,以P<0.05為標準篩選出統計學上最顯著的30條通路,然后發現肺腺癌差異甲基化區域參與多種疾病中,其中在l型糖尿病|hsa04940、NF-κB信號通路|hsa04064等中與腫瘤的發生有著緊密的聯系(圖1)。

圖1 差異甲基化區域在KEGG中的通路圖注:上述為差異甲基化區域在KEGG Pathway中所表達的最顯著的通路,縱坐標為通路名稱,坐標為-log10(P值)。
大量研究表明,在表觀遺傳學上研究最深入的就是DNA甲基化[4],差異甲基化區域是指基因組上不同組間甲基化值明顯不同的一個片段。DNA的異常甲基化與癌癥等相關疾病有著緊密的聯系,它能同時調控原癌基因和抑癌基因的表達,如果原癌基因啟動子區域的DNA低甲基化,那么它可以激活原癌基因的表達,而如果抑癌基因啟動子區域的高甲基化則使其轉錄受到抑制作用[5],這樣就對腫瘤的產生、發展、治療以及預后起著至關重要的作用[3]。表觀遺傳學改變可能不適當地激活或抑制了各種信號通路,從而導致癌癥[6]。例如Yang Zhaoyang等學者研究表明PAK1等基因的甲基化在LUAD的發展過程中起著重要的作用,主要通過將多種細胞外信號對癌細胞的侵襲和轉移進行一定的影響[7]。
本研究利用高通量甲基化檢驗平臺對肺腺癌組患者及正常組人群全基因組水平檢測其目的基因甲基化水平,并對其差異甲基化區域進行進一步的研究,共篩選出了七組差異甲基化區域DMR-1、DMR-2、DMR-3、DMR-4、DMR-5、DMR-6、DMR-7。本研究發現的七組差異甲基化的區域DMR-1的目的基因是HLA-DPB1、HLA-DPA1,DMR-2的目的基因是POU5F1,DMR-3的目的基因是RP5-1186N24.3、SCAND3,DMR-4的目的基因是2FP57,DMR-5的目的基因是LDHC,DMR-6的目的基因是LTA,DMR-7的目的基因是OXT。現已有研究表明HLA-DPB1與EGFR陽性肺腺癌顯著相關[8],HLA-DPB1、HLA-DPA1高甲基化與糖尿病有關[9],這與我們課題組在KEGG中的研究相符合,所以我們猜測HLA-DP基因的高甲基化可能導致糖尿病的產生,進而增加了腫瘤的發病率。既往研究表明HLA-DPA1在肝癌中呈現低甲基化狀態[10],SCAND3基因在肝癌中甲基化異常增高,這與我們課題組的實驗結果不同,但這兩個基因都在肺腺癌中有高表達現象,所以還有待我們課題組進一步研究驗證,或者其甲基化的狀態對腫瘤的產生也有雙面效應。已有研究表明POU5F1其啟動子高甲基化,可使其在體細胞中表達沉默[11],POU5F1與腫瘤微血管密度呈正相關,腫瘤微血管密度與腫瘤的生物學行為密切相關,POU5F1在肺腺癌中高表達,其表達上調可預測肺癌的發生[12]。現已有研究表明LDHC是癌癥患者典型的炎癥標記物[13],Koslowski等人進行的一項研究中,也表明NSCLC細胞系可由LDHC高甲基化所介導。曾有研究表明LTA低甲基化在某些炎癥中表達,眾所周知,炎癥反應可以促進腫瘤的發生,而且DNA低甲基化被認為通過誘導基因組不穩定性和原癌基因的活化而促進了腫瘤的發生[3]。關于OXT基因目前僅發現該基因的高甲基化在精神性疾病中呈現高表達趨勢,2FP57目前尚無文獻報道,但在本研究中卻發現2FP57、OXT基因的不同甲基化狀態與肺腺癌相關,為廣大學者提供了新的探討方向。
在本研究中,我們為了進一步研究目的基因甲基化的作用機制,為此對其進行了GO分析和KEGG分析。分析表明,這些基因在IFN-γ、MHC Ⅱ類蛋白復合體、催產素及NF-κB信號通路中呈現高度富集狀態。有研究表明MHCⅡ類在NSCLC中的腫瘤浸潤免疫細胞和腫瘤細胞上表達,并通過免疫系統在腫瘤的進化、抗腫瘤以及促進炎癥因子的產生中發揮著重要作用,IFN-γ可以誘導不同的癌細胞系表達MHC-Ⅱ類[14],也在炎癥、抗感染、腫瘤免疫檢測以及抗腫瘤中發揮重要作用,并限制其清除腫瘤細胞的能力[15],這些與我們的研究一致。眾所周知,神經內分泌激素包括催產素,曾有報道與神經內分泌腫瘤有關,如小細胞肺癌,同時還調節著人類的情緒、社會認知、社會行為和壓力相關疾病[16];但關于肺腺癌尚未見報道,課題組擬進一步研究。目的基因的各種甲基化狀態還主要參與了NF-κB信號通路,NF-κB轉錄因子調節與炎癥、增殖、致癌和凋亡相關的基因有關[17],我們知道癌癥的產生、發展等都取決于細胞的生存狀況與死亡信號之間的平衡,以上的研究都表明NF-κB參與了癌變過程中的多個步驟,也已經有相關動物模型和細胞培養的研究表明NF-κB與肺癌發生之間的聯系,這也證實了本課題組的實驗結果。關于通路中富集首位的Ⅰ型糖尿病,有研究表明糖尿病患者的癌癥發生率比無糖尿病的人高20~25倍[18]。關于HAS和HTLV-1的感染,目前研究只局限于炎癥、某些腫瘤有關,與肺腺癌的關系尚無報道,所以我們考慮由于HAS和HTLV-1都屬于病毒感染,而有研究表明長期的炎癥感染可能是導致腫瘤發生的一個重要條件,那這兩種病毒的感染與肺腺癌的關系值得我們進一步探討。
綜上所述,肺腺癌患者DNA甲基化的狀態可能是引起肺腺癌發生的關鍵因素,第一,HLA-DP,POU5F,以及LDHC的甲基化狀態在肺腺癌的發生中起著重要的作用;第二,在GO功能和KEGG通路中,也表明DNA甲基化異常參與了疾病發展的作用機制。總之,這些差異甲基化區域、基因以及信號可能參與了肺腺癌的發生,本課題組擬進行擴大樣本含量,同時獲取肺腺癌及癌旁的組織學標本,進一步對此進行驗證,為肺腺癌的診治提供新的、深入的理論依據。