夏萬松,夏英,韋四喜,周春歡,杜洪,袁婷,金泳,黃海*
(1.貴州醫科大學 醫學檢驗學院,貴州 貴陽 550004;2.貴州中醫藥大學第一附屬醫院 檢驗科,貴州 貴陽 550001;3.貴州醫科大學附屬醫院 臨床檢驗中心,貴州 貴陽 550004;4.貴航貴陽醫院 檢驗科,貴州 貴陽 550009)
人類基因組中超過90%的基因轉錄后發生可變剪接[1-3]。在可變剪接的過程中,剪接復合體選擇不同的5′ 端或3′ 端剪接位點,導致外顯子的包含或跳躍[4-5],同一基因產生多種成熟的RNA變異體[6-7],并翻譯出多種蛋白質亞型[8-9],導致這些蛋白質亞型的功能差異甚至完全相反[10-11],例如人類線粒體核糖體蛋白L33(mitochondrial ribosomal protein L33,MRPL33)基因在胃癌中通過可變剪接產生MRPL33-L和MRPL33-S兩個轉錄本,MRPL33-S通過抑制PI3K/AKT/CREB信號通路誘導細胞凋亡,而MRPL33-L功能則相反[12]。由此可見,可變剪接在機體生理病理的過程中都發揮非常重要的作用。人類乙醛脫氫酶2(aldehyde dehydrogenase 2,ALDH2)是19種乙醛脫氫酶同工酶之一,在催化有毒醛方面起著關鍵的作用[13-15]。ALDH2對乙醛的Km值約為0.2 μmol,是19 種同工酶中最低的,是對醛類親和力最高的同工酶[16-17]。因此,在人類不同的ALDH同工酶中,ALDH2是清除體內有毒醛最為有效的酶[18-19]。在美國國家生物技術信息(national center for biotechnology information,NCBI)數據庫中,ALDH2被報道位于染色體12q24.12,存在兩個變異體(variant,V),ALDH2 V1共13個外顯子,編碼的蛋白質為517氨基酸(amino acid,aa);ALDH2 V2共12 個外顯子,編碼的蛋白質為470 aa。與ALDH2 V1相比,ALDH2 V2缺少外顯子3,長度為141核苷酸(nucleotide,nt)(https://www.ncbi.nlm.nih.gov/gene/217),見圖1。然而,ALDH2在可變剪接方面的研究未見報道,因此,本研究采用胃癌細胞作為模型研究ALDH2基因發生可變剪接的現象。為了確定人類ALDH2基因發生可變剪接的情況,本研究在正常胃黏膜上皮細胞GES-1、胃癌細胞(AGS、HGC-27、MKN45)及正常人外周血中,通過逆轉錄-聚合酶鏈反應(reverse transcription-polymerase chain reaction,RT-PCR)檢測ALDH2基因發生可變剪接的情況,以期為ALDH2基因在可變剪接方面的研究提供實驗基礎。

圖1 在NCBI數據庫中ALDH2存在兩個變異體
1.1.1材料 GES-1、AGS、HGC-27、MKN45細胞購買于中國科學院上海生命科學院,正常人外周抗凝全血收集于貴州醫科大學附屬醫院,于-80 ℃冰箱保存。本實驗經貴州醫科大學附屬醫院倫理委員會批準。
1.1.2主要試劑及儀器 1640培養基、DMEM培養基購于美國Gibco公司,胎牛血清(fetal bovine serum,FBS)購于烏拉圭Lonsera公司,紅細胞裂解液購于北京索萊寶科技有限公司,總RNA提取試劑盒、TRIZOL reagent、T載體PCR產物快速連接試劑盒、DNA純化試劑盒購于生工生物工程(上海)股份有限公司,實驗所需引物由生工生物工程(上海)股份有限公司合成,克隆質粒測序由生工生物工程(上海)股份有限公司完成,RT試劑盒購于TaKaRa公司,Taq DNA聚合酶購于美國Vazyme公司,ABI Pro FlexTM梯度PCR擴增儀(美國Thermo Scientific公司)、瓊脂糖水平電泳儀(北京六一生物科技有限公司)、GeneGnome凝膠成像分析儀(美國Bio-Rad公司)。
1.2.1細胞培養 GES-1、AGS、HGC-27細胞在含有10% FBS的1 640培養基中培養,MKN45細胞在含有10% FBS的DMEM培養基中培養,所有細胞在37 ℃,5% CO2濕化培養箱中培養,當細胞生長融合率為80%左右時收獲細胞。
1.2.2引物設計 在NCBI數據庫下載ALDH2基因的基本信息。設計正向引物F46(位于外顯子1)、正向引物F80(位于外顯子1)、反向引物R441(位于外顯子3)、反向引物R493(位于外顯子4)用于ALDH2基因的可變剪接分析。引物序列見表1。

表1 ALDH2引物序列
1.2.3外周血白細胞(WBC)、細胞總RNA提取及RT為互補脫氧核糖核酸(complementary DNA,cDNA) 根據索萊寶紅細胞裂解液產品說明書裂解人外周抗凝全血紅細胞,用于提取WBC總RNA。根據生工總RNA提取試劑盒說明書提取WBC和細胞總RNA用于RT為cDNA。取5 μg總RNA按照TaKaRa RT試劑盒制造說明書進行RT反應獲得第一鏈cDNA。
1.2.4PCR擴增及測序 以WBC和細胞的cDNA為模板,用表1相應的引物進行PCR擴增分析ALDH2基因發生可變剪接的情況。PCR體系(25 μL):2×Green Taq Mix 12.5 μL,正反向引物各1 μL,模板1 μL,ddH2O 9.5 μL。PCR反應程序:94 ℃預變性4 min,94 ℃變性30 s,58 ℃退火30 s,72 ℃延伸30 s,共40 個循環后72 ℃延伸4 min。PCR產物經2%瓊脂糖凝膠分離,根據生工DNA純化試劑盒說明書回收目的DNA片段。目的DNA片段根據生工T載體PCR產物快速連接試劑盒說明書連接至T載體,然后進行TA克隆后送生工測序。
1.2.5生物信息學分析 使用BLAST工具進行核苷酸序列比對分析。使用DNAStar軟件分析ALDH2變異體的開放閱讀框(open reading frame,ORF)。
NCBI數據庫中ALDH2基因mRNA的示意圖見圖2A。在外顯子1設計兩個正向引物,在外顯子3和4各設計1個反向引物,引物示意圖見圖2A。用正向引物F80和反向引物R493進行PCR擴增WBC的cDNA,在瓊脂糖凝膠中意外地發現3個條帶,見圖2B。位于頂部分子量最大的帶經TA克隆測序證實為V1。最底部的帶經TA克隆測序證實為一個新的變異體(命名為V1-1),與V1相比缺少191 nt。通過TA克隆測序證實中間的帶為V1和V1-1形成的異二聚體(heterodimer,HD)。用正向引物F46和反向引物R441進行PCR擴增人類胃癌細胞(AGS、HGC-27、MKN45)、人胃黏膜上皮細胞GES-1和WBC的cDNA,在瓊脂糖凝膠中發現4個條帶,見圖2C。位于頂部的帶經TA克隆測序證實為V1。底部的3條帶通過TA克隆測序證實為3個新的變異體(分別命名為V1-2、V1-3、V1-4),這3個新的變異體都缺少V1的部分序列,分別是226 nt、240 nt及289 nt。利用圖解展示V1與新發現的變異體之間的差異。見圖2D。

注:A為ALDH2基因mRNA及引物示意圖(僅展示V1和V2的5′端的幾個外顯子),B為RT-PCR擴增WBC的瓊脂糖凝膠結果,C為RT-PCR擴增胃癌細胞(AGS、HGC-27、MKN45)、GES-1、WBC的瓊脂糖凝膠結果,D為ALDH2 mRNA變異體示意圖。
在NCBI數據庫中,V1(NM_000690.4)僅1個翻譯起始密碼子ATG(mRNA為AUG),位于51~53位核苷酸,V1的翻譯終止密碼子TAA(mRNA為UAA)位于1 602~1 604位核苷酸。使用DNAStar軟件分析V1的ORF,確定了V1總共存在8個ORF,每個ORF長度都超過100個氨基酸,但是末端翻譯終止密碼子TAA都在1 602~1 604位核苷酸,見圖3A。使用DNAStar軟件分析出V1-1最長的ORF,其翻譯起始密碼子ATG位于外顯子2。這是由于V1-1缺少的核苷酸數目非3的倍數,相當于導致移碼突變。因此,V1-1的蛋白質N末端的20氨基酸與其他所有蛋白質都不同,而C末端的391氨基酸與V1是相同的,見圖3B。使用DNAStar軟件分析出V1-2、V1-4最長的ORF是相同的。與V1相比,V1-2和V1-4的蛋白質氨基酸缺少N端的95氨基酸,示意圖見圖2B。使用DNAStar軟件分析出V1-3最長的ORF,其翻譯起始密碼子ATG與V1一致,翻譯終止密碼子TAA在1 362-1 364位核苷酸。因此V1-3的蛋白質氨基酸與V1相比,缺少7~86位氨基酸,見圖2B。

注:A示對ALDH2變異體1的ORF進行生物信息學分析,“start nt”表示ATG的核苷酸“A”在cDNA序列中的位置(僅展示長度超過100氨基酸的ORF),B示對ALDH2變異體蛋白質氨基酸進行生物信息學分析(垂直對齊在同一位置的方框表示相同的氨基酸序列,黑色方框表示的氨基酸序列不存在于其他任何蛋白質中,方框中的數字表示蛋白質的氨基酸數目)。
真核生物的生命活動是一個極其復雜的過程,需要依賴機體內的各種蛋白質在正確的時間或者空間發揮正確的生理功能,如此才能保證機體生命活動的完成;真核生物復雜的生命活動最終還是靠蛋白質精細的完成[20]。組成一個哺乳動物大約需要10萬個基因,而實際數字不到這個數字的四分之一[21]。現在的研究已證實,由于Pre-mRNA轉錄后發生可變剪接,通過這一過程,可以從單個基因產生多種不同功能的mRNA,從而翻譯出功能不同的蛋白質[22-24]。本研究發現ALDH2的4個變異體都是V1通過可變剪接形成的。V1-3缺少的核苷酸數目是3的倍數,并且位于V1的翻譯起始密碼子ATG之后。V1-3以V1對應的翻譯起始密碼子ATG作為其翻譯起始密碼子,翻譯出蛋白質的N末端會缺少V1的部分氨基酸序列。本研究認為V1-3表達出蛋白質的可能較大。相反的是,V1-1、V1-2、V1-4缺少的核苷酸數目均不是3的倍數。V1-1和V1-2缺少的核苷酸位于V1的翻譯起始密碼子ATG之后,V1-1和V1-2以V1對應的翻譯起始密碼子ATG作為其翻譯起始密碼子,翻譯出的蛋白質除N末端很小部分與V1相同外,C末端與V1完全不一致。因為V1-1和V1-2被翻譯出的蛋白質相當于移碼突變,大部分氨基酸序列與V1不一致,這也許可當作一種新的蛋白質。因此,V1-1和V1-2是否真正被翻譯出蛋白質,本研究并不明確,并未做進一步的研究。有趣的是,V1-4缺少的核苷酸包含了V1對應的翻譯起始密碼子ATG。如果V1-4翻譯出蛋白質,顯然,其翻譯起始密碼子ATG將不再是V1對應的翻譯起始密碼子ATG,將會是靠近3′末端的ATG。無論V1-4以3′末端的任何ATG作為翻譯起始密碼子,翻譯出的蛋白質始終缺少V1 N末端的部分氨基酸。然而,V1編碼的蛋白質N末端的17 個氨基酸是它進入線粒體基質發揮功能的信號肽[25]。V1-4翻譯出的蛋白質在沒有N末端信號肽存在的情況下,其是否還能進入線粒體發揮催化乙醛的功能,這是未知的。
綜上,ALDH2通過可變剪接可以產生多個mRNA變異體,并很可能產生多種蛋白質。這些蛋白質的氨基酸序列可能與V1相同,也可能不相同。提示ALDH2存在復雜的蛋白表達功能,在機體內扮演非常重要的角色,也為ALDH2在不同個體酶活力不同,在可變剪接方面的研究奠定了基礎。