呂慧 閆惠琴 王岷 李永文 萬海粟 劉紅雨 吳蘅 周清華
肺癌是我國發病率和死亡率增長最快的惡性腫瘤之一,也是人類腫瘤中最容易發生侵襲轉移的惡性腫瘤之一。影響肺癌患者預后和生存的最主要原因是肺癌的遠處轉移[1]。因此,研究和闡明調控肺癌侵襲轉移的分子機制具有重要意義。
我們前期的研究[2]從人大細胞肺癌細胞株WCQH29801分離構建不同轉移潛能的人大細胞肺癌細胞系NL9980和L9981。L9981細胞在體外具有較強的克隆形成能力和侵襲力,在裸鼠體內的自發性肺轉移能力為100%,均顯著高于NL9980細胞[2-5]。因此我們推測二者之間差異表達基因可能與L9981的侵襲及克隆能力強有關。表觀遺傳學是研究無DNA序列變化、可遺傳的基因表達(活性)的改變的一門學科[6]。DNA甲基化是表觀遺傳的主要方式,它是由DNA甲基轉移酶介導,在胞嘧啶的第5位碳原子上加上一甲基基團,使之變成5-甲基胞嘧啶(5 mC)的化學修飾過程,當基因啟動子高甲基化時使基因失活,去(低)甲基化則使基因重新開放[7]。因此我們采用甲基化芯片雜交技術[8,9]對這兩個細胞株的差異甲基化基因進行比較,從而進一步探討甲基化在肺癌轉移中的作用。該技術主要是利用特定抗體對甲基化的胞嘧啶進行免疫沉淀反應(immunoprecipitation)使甲基化和非甲基化的胞嘧啶分離,并對分離出的甲基化DNA片段進行基因芯片雜交,實現高通量的檢測。該方法對任意序列背景下的甲基化胞嘧啶均能實現免疫沉淀,分辨率相對較高,信息量較大,有助于發現兩者的差異甲基化基因及新基因[10]。
1.1 細胞株 NL9980(低轉移大細胞肺癌細胞株)、L9981(高轉移大細胞肺癌細胞株)均由天津市肺癌研究所提供。
1.2 常用試劑及設備 精制小牛血清和RPMI-1640培養基均購自Gibco公司;使用120 mmol/L的NaOH溶液配成1 mmol/L的貯備液,4oC 貯存;TIANamp Genomic DNA Kit血液/細胞/組織基因組DNA提取試劑盒(Tiangen,Cat. No. DP304-03);Resi: MBD2b蛋白-sepharose-4B柱(上海生物芯片公司);QIAquick PCR purification kit(Qiagen, Cat. No. 28106);Cy3、Cy5 9mer Wobble(50,200 O.D.)(TriLink Bio-technologies, Cat. No. N46-0010)Linker(15P)oligo JW102(40 μM);oligo JW103(40 μM);CPK6 48mer oligos(上海生工生物工程技術服務有限公司合成);NimbleGen Hybridization Kit 40 Refill(Nimblegen, Cat. No. KIT005-2);雜交爐(HB-1000 HYBRIDIZER)美國UVP LAB-ORATORY公司;掃描儀(AXON INSTRUMENTS GENE PIX 4000B)美國AXON公司;NimbleScanTM2.2:購自NimbleGen公司。
1.3 基因芯片 項目所用芯片SBC human CHIP:定制于上海生物芯片有限公司。探針為Nimblegen設計,設計原則是:一段DNA序列>250 bp,GC含量>57%時,認為這一段為CpG島。探針一共有3 678 702條,每個島所含的探針個數,從10多到30多不等,大小均為50 nt在芯片中平均分布。
1.4 提取L9981、NL9980細胞株的基因組DNA 用TIANamp Genomic DNA Kit提取基因組DNA,詳細操作方法和原理見TIANamp Genomic DNA Kit protocol。并用分光光度計定量及普通凝膠電泳檢測質量。
1.5 對L9981、NL9980細胞株的基因組DNA進行超聲破碎用超聲破碎儀將L9981、NL9980細胞的基因組DNA破碎成DNA片段。并用分光光度計定量及普通凝膠電泳檢測質量。
1.6 甲基化免疫沉淀方法富集甲基化DNA 通過Resi:MBD2b蛋白-sepharose-4B柱富集甲基化片斷。然后用連接介導PCR(ligation-mediated PCR, LM-PCR)的方法[11]進行2次擴增。并用分光光度計定量及普通凝膠電泳檢測質量。
1.7 芯片雜交及分析 應用寡核苷酸直接摻入法分別將Cy3和Cy5標記擴增的L9981及NL9980細胞株的DNA片段,然后NimbleGen Array Hybridization Kit與高通量甲基化芯片進行雜交產生2張芯片。使用NimbleScanTM2.2(NimbleGen)分析結果。用SignalMapTM對所得數據進行分析。對芯片進行標準化,將2張芯片的數據調至同一個水平。
1.8 生物信息學分析 用GenBank注釋基因,并將甲基化差異基因分別上傳至DAVID數據庫(http://david.abcc. ncifcrf.gov/home.jsp)進行基因類型(GENE ONTOLOGY, GO)分類,KEGG數據庫進行信號傳導通路的分類,以及MILANO網站(http://milano.md.huji.ac.il)進行文獻檢索。
2.1 L9981、NL9980細胞株的基因組DNA 兩組細胞抽取提純后,瓊脂糖凝膠電泳結果顯示,基因組DNA條帶清晰完整,長度約20 kDa,無降解,無蛋白質雜帶(圖1)。分光光度計結果顯示L9981及NL9980 DNA的OD260/OD280的比值均在1.7-2.0之間,提示所提的DNA純度高。
2.2 超聲破碎后的L9981、NL9980細胞株的基因組DNA片段 對基因組DNA進行超聲破碎后行凝膠電泳檢測,L9981及NL9980 DNA電泳條帶呈彌散狀,片段長度在500 bp-1 300 bp之間(圖2),當DNA片段長度在300 bp-1 300 bp之間時便于與Resi:MBD2b蛋白-sepharose-4B柱結合。
2.3 甲基化DNA 在普通凝膠電泳結果示L9981及NL9980 DNA電泳條帶呈彌散條帶,與基因破碎后的彌散條帶大致相同,在300 bp-1 000 bp之間,在500 bp附近亮度最高(圖3)。
2.4 芯片雜交及分析結果 圖4所示芯片完整,無高信號和低信號的團塊和劃痕,芯片的中央、四個角及中線與四個邊交點處的紅色十字架及平均分布的紅點顯示完全且清楚,說明芯片的雜交、洗滌、掃描步驟質量良好。Cy3通常顯示綠色,Cy5顯示紅色,當某位點在芯片上呈綠色,則表示Cy3信號強,提示該位點在L9981中表現為高甲基化;反之,當位點呈紅色,則表示Cy5信號強,提示該位點在L9981中表現為低甲基化;而位點呈黃色則表示該位點在兩個細胞株內無甲基化差異。由圖4可見芯片整體呈黃色,意味著大部分的位點無差別,符合小部分位點甲基化程度變化的假設。

表 1 L9981中高甲基化和低甲基化基因數目Tab 1 The number of hypermethylated and hypomethylated genes in L9981

表 2 甲基化差異基因分類Tab 2 The gene ontology of the hypermethylated and hypomethylated genes in L9981
圖5所示為標準化前后的M-A圖,豎坐標0水平以上為上調基因,0水平以下為下調基因。根據文獻[12],我們取Cy3/Cy5>2,即豎坐標log2(Cy3/Cy5)>1表示在L9981中高甲基化的基因;Cy3/Cy5<0.5,即豎坐標log2(Cy3/Cy5)<-1表示在L9981中低甲基化的基因;而當Cy3/Cy5在0.5-2或log2(Cy3/Cy5)在-1-1之間時,表明該基因在L9981及NL9980中無甲基化差異。通過分析,芯片中共顯示29 369個甲基化位點,其中19 369個為已知基因CpG島。其中大部分基因的Cy3/Cy5比值在0.5-2之間,我們認為這些基因在L9981和NL9980之間無甲基化差異,這與芯片掃描圖及M-A plot的結果一致。這些無甲基化差異的基因包括nm23-H1基因。只有少量的基因出現了甲基化的差異(表1)。在L9981細胞株中有1 552個高甲基化DNA片斷,涉及735個基因,其中包括656個已知基因及79個未知基因。低甲基化DNA片段1 787個,涉及809個基因,其中698個已知基因片段及111個未知基因。
2.5 基因篩選結果 在這些差異基因中無nm23,表示nm23基因在這兩個細胞株中無甲基化狀態差異。通過GO分類我們發現:這些差異甲基化基因主要集中在細胞生物進程及其調節、代謝及其調節、基因表達、信號傳導、細胞通訊、細胞運動、細胞粘附及血管生成等相關的基因,其中基因分類及基因數目的部分結果見表2。通過MILANO對這些差異基因進行文獻檢索,選出我們感興趣的基因。高轉移潛能細胞株L9981抑癌基因CDKN2A(p16)、RUNX3、HOXA5、PPP2CA、APC2等呈高甲基化,而癌基因Bcl-2、BMI1呈低甲基化。

圖 1 L9981和NL9980細胞株基因組DNA凝膠電泳圖Fig 1 Gel electrophoresis of genome DNA of L9981 and NL9980

圖 2 L9981和NL9980細胞基因組DNA超聲破碎后凝膠電泳圖Fig 2 Gel electrophoresis of DNA frangments of L9981 and NL9980 by sonication

圖 3 甲基化DNA的PCR擴增Fig 3 PCR amplification of methylated DNA

圖 4 芯片圖片。A:芯片掃描的全景圖;B:質控部分的放大圖,可以清晰看到中央十字及四角紅點。Fig 4 The picture of chip. A: The scanning picture of chip; B: The enlarged picture of quality parts, in which red cross in center and red pots in corner are clear.

圖 5 標準化前后的M-A圖Fig 5 The M-A plot before and after the normalization
表2所示,大部分甲基化差異基因參與了信號通路的傳導,經KEGG進行信號途徑的分析,結果發現這些信號途徑主要包括:細胞粘附因子、MAPK信號通路、WNT信號通路、TGF-β信號通路等。細胞粘附因子在L9981中主要呈低甲基化,而涉及MAPK、WNT、Notch、Hedgehog通路的基因在L9981中主要呈現高甲基化(表3)。
異常甲基化是腫瘤的發生發展的重要原因,主要表現在抑癌基因的高甲基化及全基因組、癌基因的低甲基化[13,14]。我們的研究發現在L9981細胞株中有1 552個高甲基化DNA片斷,涉及735個基因,其中包括656個已知基因及79個未知基因。低甲基化DNA片段1 787個,涉及809個基因,其中698個已知基因片段及111個未知基因。通過DAVID對這些已知基因進行分析,發現它們主要涉及細胞生物進程及其調節、基因表達、信號傳導、細胞通訊、細胞運動、細胞粘附及血管生成等,與腫瘤轉移關系密切。其中抑癌基因CDKN2A(p16)、RUNX3、HOXA5、PPP2CA、APC2在L9981中為高甲基化,提示他們可能在L9981中表達缺失或下降。而癌基因Bcl-2、BMI1則在L9981中呈低甲基化,提示他們可能在L9981中過表達。因此我們推測,抑癌基因的高甲基化及癌基因的低甲基化可能是L9981具有更強侵襲及克隆能力的原因。并推測,在L9981中呈高甲基化的基因功能未明或未知基因可能為潛在的腫瘤抑制基因或腫瘤轉移抑制基因,但尚需進一步證實。

表 3 高轉移大細胞肺癌細胞株L9981中甲基化差異基因參與的信號傳導通路Tab 3 The signal transduction of the hypermethylated and hypomethylated genes in L9981 lung cancer cell line
信號傳導通路的激活與腫瘤的發生發展密切相關[15]。通過GO分類我們發現兩株細胞間大部分的差異甲基化基因參與了信號傳導通路,其中與信號通路有關的高甲基化的基因為153個,低甲基化的基因為172個。將這些基因上傳至KEGG進行分析發現這些基因涉及細胞粘附因子、MAPK信號通路、WNT信號通路、TGF-β信號通路、p53信號通路。在L9981中,大部分通路的負向調節基因呈現高甲基化,而正向調節基因呈低甲基化。其中WNT通路中負向調節基因SFRP2、SFRP4、SOX17及RUNX3、APC2、PPP2CA等在高轉移潛能的細胞株L9981中表現為高甲基化,而正向調節基因LRP5、TBL1X則為低甲基化。通過GO分類及MILANO文獻檢索,我們發現在L9981中MAPK信號通路、TGF-β信號通路、p53信號通路均存在負向調節基因的高甲基化及正向調節基因的低甲基化,而Hedgehog及Notch信號通路主要表現為負向調節基因的高甲基化。同時值得一提的是,參與細胞粘附分子通路的基因則以低甲基化為主,其中CDH2、ICOSLG、MAG、MPZL1、NLGN1、NRCAM、NRXN2、SDC2在L9981細胞株中表現為低甲基化,而CDH4、CNTNAP2表現為高甲基化,這些基因參與上皮間質轉化(epithelial-mesenchymal transitions, EMT)過程[16,17]。而后者為腫瘤浸潤轉移的重要環節。甲基化在EMT中扮演的作用尚需進一步研究。
腫瘤的侵襲和轉移是多因素、多步驟共同作用的結果,DNA甲基化是其中一個因素。運用高通量的基因芯片,我們發現在不同轉移潛能的人大細胞肺癌株中甲基化差異基因涉及細胞生物進程及其調節、基因表達、信號傳導、細胞通訊、細胞運動、細胞粘附及血管生成等。同時我們注意到在L9981中信號通路負向調節基因的高甲基化及正向調節基因的低甲基化可能促使信號傳導通路的開放而促進轉移。由于芯片信息量大且受方法學限制,我們尚需對結果進行進一步的挖掘及驗證。