??∑鎱浅d楊麗濤,2李楊瑞,2
(1. 廣西大學農學院 亞熱帶農業生物資源保護與利用國家重點實驗室,南寧 530005;2. 中國農業科學院甘蔗研究中心 廣西農業科學院甘蔗研究所 農業部廣西甘蔗生物技術與遺傳改良重點實驗室 廣西甘蔗遺傳改良重點實驗室
廣西作物遺傳改良生物技術重點開放實驗室,南寧 530007)
甘蔗SoNIN1基因結構及其內含子信息分析
牛俊奇1吳朝興1楊麗濤1,2李楊瑞1,2
(1. 廣西大學農學院 亞熱帶農業生物資源保護與利用國家重點實驗室,南寧 530005;2. 中國農業科學院甘蔗研究中心 廣西農業科學院甘蔗研究所 農業部廣西甘蔗生物技術與遺傳改良重點實驗室 廣西甘蔗遺傳改良重點實驗室
廣西作物遺傳改良生物技術重點開放實驗室,南寧 530007)
根據前期克隆得到的SoNIN1基因的全長cDNA和部分啟動子序列設計引物,應用PCR技術從甘蔗葉片gDNA中克隆SoNIN1基因,并利用生物信息學方法分析基因的結構。結果表明,SoNIN1基因的DNA序列長4 938 bp,包含6個外顯子和5個內含子,GenBank登錄號KF563902。在該基因5'非翻譯區存在一個268 bp 內含子序列,同時5個內含子序列中含有與低溫、干旱和激素等脅迫響應相關的作用元件,這些可能對SoNIN1基因轉錄表達起調控作用。依據SoNIN1蛋白聚類和外顯子-內含子基因結構可以將植物NINs分為兩類。
甘蔗 中性/堿性轉化酶 外顯子 內含子 信息分析
中性/堿性轉化酶(Alkaline/Neutral Invertase)是轉化酶家族成員之一,在調節植物的生長發育過程中起作用。它是一種胞質酶,最適pH值在7.0-8.0左右,以蔗糖為底物,能不可逆地把蔗糖分解為葡萄糖和果糖,用于細胞能量代謝[1]。而在酸性轉化酶和蔗糖合成酶(分解方向)活性較低的植物組織中,中性/堿性轉化酶能分解蔗糖,為三羧酸循環提供底物,因此被視為“維持酶”[2]。其酶活性極不穩定,在提取過程中容易喪失活力,導致純化該類酶存在很大難度。已經純化出來的中性或堿性轉
化酶主要以八聚體和四聚體兩種形式存在[3]。
內含子是真核生物基因的重要組成部分,它在基因剪接過程中可以區分外顯子起標點符號作用,而外顯子-內含子連接區高度保守性和特異性的堿基序列是真核生物基因斷裂的重要特征 。通過選擇剪接,一個基因可以產生不同的成熟mRNA,再翻譯成功能各異的蛋白質。這種調控機制可使某些基因在不同細胞組織中或是在發育的不同階段產生特定的蛋白質,以滿足生物體代謝的需求[4-6]。近年來,內含子對真核生物基因和植物基因表達影響越來越受到人們的重視[7,8]。因此,本研究在前期克隆得到SoNIN1基因的全長cDNA和部分啟動子序列,并分析了該基因在不同組織和環境脅迫下基因表達情況的基礎上,利用PCR克隆獲得SoNIN1基因的全長DNA序列,通過生物信息學分析該基因結構和內含子序列,旨在為進一步闡述甘蔗SoNIN1基因參與植物生長發育和對逆境脅迫下的響應機制提供參考。
1.1 材料
新型植物基因組DNA提取試劑盒(康為試劑Nuclean PlantGen DNA Kit);λ-Hind III digest DNA Marker、LA Taq酶、pMD18-T vector和T4 DNA連接酶購自TaKaRa寶生物工程(大連)公司有限公司。引物由上海生工生物工程技術服務有限公司合成。
1.2 方法
1.2.1 RNA和DNA提取 以甘蔗品種GT28葉片為材料提取總RNA,RNA提取采用天根Trizol-A+提取液,提取過程參照TRIzol試劑盒說明書。甘蔗基因組DNA提取過程參照DNA提取試劑盒說明書進行。利用瓊脂糖凝膠電泳檢測總RNA和DNA完整性,利用Thermo Scientific NaNoDrop 2000c檢測總RNA濃度及純度。反轉錄按照ReverAid First Strand cDNA Synthesis Kit試劑盒說明書反轉錄成cDNA第一鏈。
1.2.2 甘蔗SoNIN1編碼區DNA序列克隆 參照SoNIN1的cDNA序列(GenBank登錄號:JX109944)和啟動子序列(GenBank登錄號:KC854419)[9]在基因編碼區序列兩側分別設計兩條上游引物NIF71:5'-ACTCCGGTTTTGCCCTCCATTG-3'、NIF81:5'-TTCTTGCTGGGTTGCTCTGATTAG-3'。以及兩條下游引物NIR71:5'-TTGATGGAACTTGCTGCGAGAAC-3'和NIR81:5'-CCATAATAACAGCATCCCACAGCA-3'。以甘蔗基因組DNA為模板,擴增體系為25 μL:LA Taq酶0.25 μL、10×LA Taq Buffer II 2.5 μL、10 mmol/L dNTPs 1.5 μL、10 mmol/L上下游引物各1 μL,模板DNA 1 μL、ddH2O 17.75 μL。PCR反應程序為:94℃預變性1 min;98℃變性10 s,68℃退火5 min,30個循環;最后72℃延伸10 min。PCR產物經膠回收純化后,經T4 DNA連接酶連接到pMD18-T上,轉入感受態細胞E. coli DH5α,經M13通用引物PCR菌液檢測和質粒檢測后,把含有目的片段的菌液送深圳華大基因研究院測序。SoNIN1基因編碼區引物設計和擴增體系參照??∑娴龋?]方法。
1.2.3 序列分析 利用MEGA6構建NIN蛋白的系統進化樹;利用Gene Structure Draw(www.compgen. uni-muenster.de/tools/strdraw)分析外顯子-內含子基因結構;利用Alignment Exon Intron Structure(www. compgen.uni-muenster.de/tools/alignexin)分析基因外顯子進化關系;利用http://hits.isb-sib.ch/cgibin/motif_scan分析SoNIN1蛋白的活性位點;利用 PlantCARE(http://bioinformatics.psb.ugent.be/ webtools/plantcare/html)和PLACE(http://www.dna. affrc.go.jp/PLACE/signalup.html)分析SoNIN1基因內含子順式作用元件。
2.1 DNA和RNA瓊脂糖凝膠電泳檢測
利用DNA試劑盒提取的甘蔗基因組DNA經0.8%瓊脂糖凝膠電泳檢測,結果(圖1-A)顯示電泳條帶單一,平直,清晰,點樣孔干凈。經紫外分光光度計檢測其OD260/OD230為1.92,濃度為900 ng/μL,說明所提取的DNA質量和濃度均符合試驗的要求。利用試劑盒提取的RNA經1%瓊脂糖凝膠電泳檢測圖,產生3條清晰的條帶:28S、18S和5S RNA,無DNA污染,OD260/OD230為1.92,說明所提取的RNA完整性好、純度高、完全可滿足cDNA逆轉錄的要求(圖1-B)。
2.2 SoNIN1基因 DNA序列克隆與序列分析
對設計的6條引物(兩條上、下游引物和一對編碼區引物)隨機組合,分別進行PCR擴增,結果(圖
2-A)顯示只有引物對NIF71和NIR71 PCR擴增產物在5 000 bp左右處有單一、清晰的電泳條帶。以cDNA為模板,用編碼區引物擴增結果如圖2-B所示。測序結果顯示擴增出來DNA序列長4 938 bp,編碼603 aa,與SoNIN1編碼區cDNA推導氨基酸序列同源性為100%,說明克隆的序列是SoNIN1基因的DNA序列。該基因已在 DDBJ/EMBL/GenBank 基因數據庫注冊,注冊號為KF563902。

圖1 DNA(A)和RNA(B)瓊脂糖凝膠電泳檢測結果

圖2 SoNIN1 基因的DNA序列(A)和編碼區cDNA(B)擴增結果
將SoNIN1基因DNA序列與其cDNA(編碼區)序列進行比對分析,結果顯示該基因含有6個外顯子和5個內含子,外顯子大小分別為582、164、212、494、49和256 bp,內含子大小分別為1 374、89、1 146、90和214 bp,外顯子與內含子的交界符合GT-AG法則(即內含子具有5'-GT...AG-3'特征)?;?'UTR(Untranslated Regions)有192 bp,3' UTR有23 bp,序列中A+T含量58.46%,G+C含量為占41.54%。利用Vector NTI 11.0 里的conting 軟件將SoNIN1基因DNA序列與其啟動子(KC854419)序列進行拼接,拼接結果長5 920 bp。該拼接結果與基因的全長cDNA進行比對,并利用Gene Structure Draw程序構建內含子-外顯子基因結構圖(圖3)。結果顯示在起始密碼子ATG之前49 bp之前有一個268 bp的非轉錄區,該區域含有干旱脅迫響應元件(MBS)、赤霉素響應元件(P-box)、胚乳特異性響應元件(Skn-1_motif)以及2個CAAT-box,該序列可能在增強基因轉錄方面起作用。
2.3 內含子作用元件預測
用PlantCARE和PLACE在線預測SoNIN1基因內含子順式作用元件,結果顯示基因內含子1具有ABA響應元件(ABRE)、厭氧響應元件(ARE)、ABA和VP1響應元件(CE3)、茉莉酸響應元件(CGTCA-motif),低溫誘導響應元件(LTR)、干旱脅迫響應元件(MBS)、4個分生組織特異性響應元件、脅迫防御響應元件(TC-rich repeats)、光誘導根特異性表達響應元件和光響應元件。此外還具有14個CAAT-box 和27個TATA-box。同時,在內含子1中有一段233 bp(位于868-1 101 bp之間)的核苷酸序列,該序列與玉米、高粱、薏米和甘蔗葉綠體基因組中的細胞色素B(petB)基因的反向互補序列同源性達98%,而該序列能否抑制petB基因的表達,還有待于進一步的研究。內含子3具有4個CAAT-box、ABA響應元件、厭氧誘導響應元件、分生組織特異性響應元件和光響應元件。內含子5具有厭氧響應元件、干旱誘導的MBY結合位點,胚乳特異表達響應元件,脅迫防御響應元件。而內含子2和4都具有TATA-box和CAAT-box。
2.4 構建植物NIN蛋白系統進化樹
根據在基因數據庫中搜索到的擬南芥(3個)、水稻(8個)和玉米(6個)NIN基因相應DNA、cDNA和氨基酸序列,利用MEGA6.0軟件構建NIN蛋白的系統進化樹,并利用Gene Structure Draw分析基因外顯子-內含子結構。結果(圖4)表明,植物NIN蛋白可以分為兩類:I 類和II類。其中,I類中基因結構主要有4個外顯子和3個內含子組成,只有擬南芥(AT4G09510)有5個外顯子和4個內含子組成,甘蔗SoNIIN2[10]屬于I 類。II類中基因結構都有6個外顯子和5個內含子組成。SoNIN1蛋白首先與玉米(GRMZM2G040843)聚類,其次與黑
麥草(CAM32308)和水稻(Os02g32730)聚類,再次與擬南芥(AT5G22510和AT1G56560)聚類,最后與水稻(Os01g22900)聚類。雖然甘蔗SoNIN1蛋白與玉米(GRMZM2G040843)NIN親緣關系很近,但二者內含子序列大小相差很大,尤其是第3個內含子,甘蔗的為1 146 bp,而玉米的達6 235 bp。

圖3 SoNIN1基因結構圖

圖4 SoNIN1蛋白質與其他20個不同來源的中性/堿性轉化酶的進化關系分析
2.5 II類NIN基因內含子-外顯子結構分析
甘蔗NIN1蛋白與玉米(GRMZM2G040843)、水 稻(Os02g32730)、 黑 麥 草(AM489692)、 水稻(Os04g33490)、擬南芥(AT5G22510)和擬南芥(AT1G56560)氨基酸序列的同源性分別為96%、90%、86%、79%、67%和62%。利用Alignment Exon Intron Structure分析植物II 類NIN基因內含子-外顯子結構,結果(圖5)表明進化距離較近的基因之間外顯子-內含子結構差異小,內含子插入位置僅在外顯子末端個別氨基酸序列處不同。而在進化距離相對較遠的NIN基因結構中,內含子插入位置變化較大,如水稻的Os02g32730和Os04g33490。
本研究采用98℃變性10 s,68℃退火-延伸5 min,30個循環進行PCR擴增,即二溫式PCR技術。該方法優點是退火溫度比常規PCR高,擴增產物的特異性強,目的條帶清晰。同時擴增程序簡單,耗時短[11]。缺點是對引物要求高,不但要求G+C含量在40%-60%之間,而且引物退火溫度要在65-70℃之間,而利用Taq酶最佳溫度為68℃。從甘蔗
中克隆到的SoNIN1 DNA序列,外顯子和內含子之間的交界完全符合的GT-AG法則,且在SoNINI蛋白與其他來原的進化關系中所示植物的NIN基因內含子都符合這一特征。甘蔗SoNIN1基因結構含有6個外顯子,5個內含子,第2個為164 bp,而植物酸性轉化酶基因第2個內含子大部分都是9 bp,編碼DPN 3個氨基酸,它是呋喃果糖酶基序(NDPNG/A)的一部分[12],而SoNIN1推導的這3個多肽位于第1個內含子內。而在小麥(CAL26914)、木薯(AFH77958)和水稻(BAG89564)的NINI基因中已經不含DPN序列,因此推測DPN并不是某些植物中性/堿性轉化酶必需酶活性位點。

圖5 NINs基因內含子-外顯子結構圖
啟動子是基因表達所必需的重要的DNA信號序列,是細胞內控制基因轉錄與表達的時空特異性的重要因子,是基因轉錄調控的中心[13]。基因表達不僅需要5'側翼啟動子序列,而且也需要內含子的參與[14,15]?;蛑胁煌膬群釉趩踊蜣D錄中發揮的作用不同,通常第一個內含子對基因啟動表達貢獻最大[16]。內含子能誘導啟動子啟動活性和啟動內含子含有的響應作用元件[17]。內含子中存在一些類似增強子或其他順式作用調控元件,能提高基因表達,但內含子在基因表達中具有位置效應和方向依賴性[18]。有研究表明內含子中部序列在基因表達調控中起重要作用[19]。高轉錄基因內含子中存在一些潛在的正調控位點,這些內含子非??拷蛏嫌螀^,甚至位于5'-UTR區,其中內含子可能參與轉錄調控,并可能與上游轉錄調控有協同調節作用[20,21]。在甘蔗SoNIN1基因5'-UTR含有一個的內含子,而有研究表明基因5'-UTR中存在的內含子能誘導基因的表達模式[22]。而有些內含子序列對基因表達起負調控作用,如內含子中的NRSE 序列參與介導了其對CART基因的轉錄負調控作用[23]。剪切后的內含子與相應編碼序列也存在相互作用,在mRNA輸出和基因表達調控過程中也起到非常重要的作用[24]。
從NIN蛋白系統進化樹和外顯子-內含子基因結構上,本研究將植物中性/堿性轉化酶分為兩個亞類群,在同一亞群內部不同物種間內含子序列的長度存在極大差異。內含子序列中的各類可移動單元,可以加速蛋白質結構的進化及加大蛋白質的變異性,內含子已經成為提高轉基因生物基因表達的重要元件[25]。本研究從甘蔗中克隆到SoNIN1基因的全長DNA序列,并利用生物學方法分析了SoNIN1基因的系統進化、外顯子-內含子基因結構,這不僅有利于從分子層面了解NIN基因的進化和基因結構,而且為今后分離、純化甘蔗NIN蛋白和進行功能研究提供理論基礎。
克隆獲得SoNIN1基因的DNA序列,全長4 938 bp,由6個外顯子和5個內含子組成。在翻譯起始密碼子ATG前49 bp存在一個268 bp的內含子
序列,內含子1和內含子3含有多個順式作用元件,可能在啟動或誘導SoNIN1基因表達中起作用。植物中性/堿性轉化酶可以分為兩個亞類,I類基因結構主要是4個外顯子和3個內含子組成,少數為5個外顯子和4個內含子組成,而II類是6個外顯子和5個內含子組成。
[1]Chandra A, Jain R, Solomon S. Complexities of intvertases controlling sucrose accumulation and retention in sugarcane[J]. Current Science, 2012, 102(6):857-866.
[2]Gallagher JA, Pollock CJ. Isolation and characterization of a cDNA clone from Lolium temulentum L. encoding for a sucrose hydrolytic enzyme which shows alkaline/neutral invertase activity[J]. Journal of Experimental Botany, 1998, 49(322):789-795.
[3]潘秋紅, 張大鵬.植物轉化酶的種類、特性與功能[J]. 植物生理學通訊, 2004, 40(3):275-280.
[4]Morello L, Breviario D. Plant spliceosomal introns:Not only cut and paste[J]. Current Genomics, 2008, 9(4):227-238.
[5]Lorkovic ZJ, Kirk DAW, Lambermon MHL, Filipowicz W. PremRNA splicing in higher plants[J]. Trends in Plant Science, 2000, 5(4):160-167.
[6]Blencowe BJ. Alternative splicing:new insights from global analyses[J]. Cell, 2006, 23(10):37-47.
[7]Nott A, Muslin SH, Moore MJ. A quantitative analysis of intron effects on mammalian gene expression[J]. RNA, 2003, 9(5):607-617.
[8]Emami S, Arumainayagam D, Korf L, Rose AB. The effects of a stimulating intron on the expression of heterologous genes in Arabidopsis thaliana[J]. Plant Biotechnol J, 2013(11):555-563.
[9]??∑? 王愛勤, 黃靜麗, 等.甘蔗中性/堿性轉化酶基因(SoNIN1)的克隆和表達分析[J].作物學報, 2014, 40(2):253-263.
[10]Bosch S, Grof CPL, Botha FC. Expression of neutral invertase in sugarcane[J]. Plant Sci, 2000(166):1125-1133.
[11]董倩, 黃國強, 葉冰瑩, 等.二溫式PCR 在特異短核酸探針合成中的應用[J].花生學報, 2008, 37(3):5-10.
[12]劉慧英, 朱祝軍.轉化酶在高等植物蔗糖代謝中的作用研究進展[J].植物學通報, 2002, 19(6):666-674.
[13]聶麗娜, 夏蘭琴, 徐兆師, 等.植物基因啟動子的克隆及其功能研究進展[J].植物遺傳資源學報, 2008, 9(3):385-391.
[14]陳俊, 王宗陽.水稻OsBP-73基因表達需要其內含子參與[J].植物生理與分子生物學學報, 2004, 30(1):81-86.
[15]Chorev M, Carmel L. The function of introns[J]. Frontiers in Genetics, 2012(3):1-15.
[16]Wang YD, Joh K, Masuko S, et al. The mouse murrl gene is imprinted in the adult brain, presumably due to transcriptional interference by the antisense-oriented U2af1-rs1 gene[J]. Molecular and Cellular Biology, 2004(24):270-279.
[17]李江濤, 楊世湖, 陳苗苗, 萬建民.內含子1, 2對水稻pib基因啟動子活性影響的轉基因分析[J].江蘇農業科學, 2012, 40(3):15-19.
[18]Chung BYW, Simons C, Firth AE, et al. Effect of 5’UTR introns on gene expression in Arabidopsis thaliana[J]. BMC Genomics, 2006, 7(1):120.
[19]張強, 李宏, 趙小慶, 等.基因外顯子連接序列與相應內含子序列的相互作用[J].生物信息學, 2013, 11(3):172-180.
[20]張昆林, 張靜, 羅靜初.酵母基因上游與內含子可能存在的轉錄協同作用[J].生物化學與生物物理進展, 2005, 32(1):46-52.
[21]Parra G, Bradnam K, Rose AB, Korf L. Comparative and functional analysis of intron-mediated enhancement signals reveals conserved features among plants[J]. Nucleic Acids Research, 2011, 39(13):5328-5337.
[22]Fu H, Kim SY, Park WD. High-level tuber expression and sucrose inducibility of a potato Sus4 sucrose synthase gene require 5’ and 3’flanking sequences and the leader intron[J]. The Plant Cell Online, 1995, 7(9):1387-1394.
[23]張靜, 王思涵, 楊印祥, 等.內含子序列對CART基因轉錄調控作用的初步研究[J].軍事醫學, 2011, 35(4):272-277.
[24]Zhao XQ, Li H, Bao T. Analysis on the interaction between postspliced introns and corresponding protein coding sequences in ribosomal protein genes[J]. Journal of Theoretical Biology, 2013(328):33-42.
[25]Kamo K, Kim AY, Park SH, Joung YH. The 5'UTR-intron of the Gladiolus polyubiquitin promoter GUBQ1 enhances translation efficiency in Gladiolus and Arabidopsis[J]. BMC Plant Biology, 2012(12):79-89.
(責任編輯 馬鑫)
Analysis of Genomic Structure and Introns of SoNIN1 Gene from Sugarcane
Niu Junqi1Wu Chaoxing1Yang Litao1,2Li Yangrui1,2
(1. Agricultural College,Guangxi University / State Key Laoratory of Conservation and Utilization of Subtropical Agro-bioresources,Nanning 530005;2. Sugarcane Research Center,Chinese Academy of Agricultural Sciences / Sugarcane Research Center,Guangxi Academy of Agricltural Sciences / Key Laboratory of Sugarcane Biotechnology and Genetic Improvement(Guangxi),Ministry of Agriculture / Guangxi Key Laboratory of Sugarcane Genetic Improvement / Guangxi Crop Genetic Improvement and Biotechnology Lab,Nanning 530007)
According to the full length cDNA and part of the promoter sequences of the SoNIN1 gene we designed primers,amplified the SoNIN1 gene form gDNA of sugarcane leaves by PCR, and analyzed the gene structure of SoNIN1 by using bioinformatics methods. The results showed that the DNA sequence of the SoNIN1 gene is 4 938 bp, containing six exons and five introns, GenBank accession number KF563902. 5’UTRs of the SoNIN1 gene contain 268 bp introns, and five introns contain low temperature, drought, and hormonal stress response related cisacting elements, which may play a role in transcription and expression regulation of SoNIN1 gene. According to phylogenetic analysis and exonintron gene structure, the NIN proteins can be classified into 2 classes’ type I and type II.
Sugarcane Alkaline/neutral invertase Exon Intron Information analysis
10.13560/j.cnki.biotech.bull.1985.2014.12.024
2014-05-26
國家“863”計劃課題(2013AA102604),廣西自然科學基金項目(2011GXNSFF018002,2013NXNSFAA019073),國家國際合作項目(2009DFA30820,2013DFA31600),廣西八桂學者和特聘專家專項經費
??∑妫校┦垦芯可?,研究方向:甘蔗生理和分子生物學;E-mail:niujunqi3218@163.com
楊麗濤,女,博士,教授,研究方向:甘蔗生理生化和病蟲害;E-mail:liyr@gxu.edu.cn
李楊瑞,男,博士,教授,研究方向:甘蔗育種和生物固氮;E-mail:liyr@gxaas.net