任偉超 李相全 董上 王淥 高金輝 馬偉



摘要:? 以栓皮櫟醇脫氫酶基因序列為探針,運用電子克隆技術進行蒙古櫟醇脫氫酶基因預測和生物學分析。研究結果表明:蒙古櫟醇脫氫酶基因全長594 bp,包含516 bp的開放閱讀框,編碼171個氨基酸;蛋白為親水性的非分泌蛋白,不存在跨膜區;二級結構主要為無規則卷曲、延伸鏈和α螺旋;存在4個絲氨酸、10個蘇氨酸、1個酪氨酸,可能成為蛋白激酶磷酸化位點。
關鍵詞:? 蒙古櫟;? 醇脫氫酶;? 電子克隆;? 生物信息學
中圖分類號:? ?S 792. 186? ? ? ? ? ? ? ? ? 文獻標識碼:? ?A
蒙古櫟(Quercus mongolica),又稱柞木、柞樹,在我國主要分布于東北和華北地區,是我國溫帶地區落葉闊葉林及針闊混交林的主要樹種[ 1 ],對維持地域生態平衡和生態系統恢復重建有重要作用[ 2 , 3 ]。醇脫氫酶(ADH)是生物體內一類非常重要的對醇或醛有解毒作用的酶,可有效抵御外源或內源有毒化合物的攻擊。研究表明,醇脫氫酶是改善植物對缺氧反應適應性的關鍵酶,是植物提高水淹耐受性的重要基因調控手段之一[ 4 ]。當前,國內針對醇脫氫酶的研究主要集中于大豆、玉米、水稻等農作物,對森林植物研究較少,對于蒙古櫟醇脫氫酶的研究更未見報道。本研究運用電子克隆及生物信息學方法,開展蒙古櫟醇脫氫酶基因研究,有助于探明蒙古櫟的抗逆機理,進而改善蒙古櫟在極端環境下的生長狀況。
1 試驗材料與方法
1. 1 試驗材料
本次試驗的探針材料為栓皮櫟(Quercus suber)醇脫氫酶基因(來源:GenBank;序列號:KF704745),以及多款電子克隆及生物信息學在線分析軟件,具體如下:
(1)Blastn(http://blast.ncbi.nlm.nih.gov/);
(2)CAP3(http://doua.prabi.fr/software/cap3);
(3)ORF finder(http://www.ncbi.nlm.nih.gov/gorf/orfig.cgi);
(4)ProtParam(http://web.expasy.org/protparam/);
(5)SignalP 4.1(http://www.cbs.dtu.dk/services/SignalP/);
(6)ProtScale(http://web.expasy.org/protscale/);
(7)TMpred(http://www.ch.embnet.org/software/TMPRED_form.html);
(8)Psort(http://www.genscript.com/psort.html);
(9)SOPM(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html);
(10)NetPhos(http://www.cbs.dtu.dk/services/NetPhos/)
1. 2 試驗方法
電子克?。↖n silico cloning)是利用計算機技術,依托EST數據庫、基因數據庫等網絡資源,采用生物信息學方法延伸已知EST序列,以期獲得部分或全部cDNA的方法 [ 5 - 7 ]本試驗主要圍繞電子克隆和生物信息學分析技術開展。
1. 2. 1 基因序列獲取
在GenBank中選取序列號為KF704745的栓皮櫟醇脫氫酶基因,作為本次試驗的基因探針。使用Blastn在蒙古櫟EST數據庫中進行同源檢索,得到與探針序列同源性較高的蒙古櫟EST序列。使用在線工具CAP3[ 8 ]進行拼接,以拼接好的重疊群Contig為探針,再次進行Blastn檢索,直至不出現新EST序列且Contig不延續時,獲取到蒙古櫟醇脫氫酶的基因序列。
1. 2. 2 基因結構和蛋白特征分析
對基因序列結構和蛋白特征進行分析,具體步驟如下:(1)采用ORF finder對蒙古櫟醇脫氫酶預測基因進行開放閱讀框分析;(2)采用ProtParam分析蒙古櫟醇脫氫酶一級結構;(3)采用SignalP 4.1對蒙古櫟醇脫氫酶的信號肽進行預測;(4)采用ProtScale分析蒙古櫟醇脫氫酶的親/疏水性;(5)采用TMpred分析蒙古櫟醇脫氫酶的跨膜結構;(6)采用Psort對蒙古櫟醇脫氫酶在細胞中可能存在的位置進行定位;(7)采用SOPMA預測蒙古櫟醇脫氫酶的二級結構;(8)采用NetPhos對預測的蒙古櫟醇脫氫酶的磷酸化位點進行分析。
2 結果與分析
2. 1 蒙古櫟醇脫氫酶基因序列預測
經過同源檢索、序列拼接等電子克隆過程,獲取到全長為594 bp的蒙古櫟醇脫氫酶基因序列(圖1)。開放閱讀框是DNA序列中具有編碼蛋白質潛能的堿基序列,采用ORF Finder對該基因進行分析,發現其開放閱讀框長度為516 bp,據此編碼171個氨基酸。
2. 2 蛋白質一級結構預測
蛋白質是結構復雜的有機大分子物質,蛋白質一級結構是氨基酸殘基在蛋白質肽鏈中的排列順序,對其進行分析可以探明蛋白質的理化性質?;诘鞍踪|數據庫和在線軟件ProtParam[ 9 ],對蒙古櫟醇脫氫酶基因編碼的蛋白質一級結構進行預測,結果表明:氨基酸171個,等電點6.15,相對分子質量18 852.47,正電荷殘基(Arg+Lys)17,負電荷殘基(Asp+Glu)20,分子式為C821H1289N235O249S13,不穩定系數34.24,平均疏水性-0.27,脂肪系數71.75。一般而言,當蛋白不穩定系數(II)< 40時,可能是穩定蛋白。由此可見,蒙古櫟醇脫氫酶基因編碼的蛋白質可能是穩定蛋白。
2. 3 信號肽預測及親/疏水性分析
采用SignaIP4.1Server[ 10 ]在線軟件,對蒙古櫟醇脫氫酶基因所編碼蛋白質信號肽進行預測的結果(圖2)表明,蒙古櫟醇脫氫酶不存在信號肽,為非分泌蛋白,不參與蛋白質在細胞內轉運。采用ProScale[ 11 ]對蒙古櫟醇脫氫酶編碼的氨基酸進行親/疏水性分析,從分析結果(圖3)可以看出,最小值為-2.211,最大值為1.767。按照氨基酸位點判定規律,正值越大,蛋白質疏水性越強;負值越大,蛋白質親水性越強;介于-0.5~0.5之間的主要為兩性氨基酸。據此推測,蒙古櫟醇脫氫酶編碼的蛋白質為親水性蛋白,此結果與一級結構預測結果一致。
2. 4 跨膜結構預測及亞細胞定位
膜蛋白不溶于水,分離純化困難,不容易生長晶體,很難明確其結構。因此,如何對膜蛋白的跨膜螺旋進行預測是生物信息學的重要問題。采用在線跨膜蛋白結構預測軟件Tmpred[ 12 ],對該蛋白質的跨膜結構域進行預測。一般認為,當縱坐標分值大于500時,會存在跨膜結構域。由預測結果(圖4)可以看出,蒙古櫟醇脫氫酶不存在跨膜結構。亞細胞定位與蛋白質功能存在著非常緊密的聯系,由于各細胞器中理化性質存在差異,因此其對內部所容納的蛋白也具有選擇性。采用Psort[ 13 ]在線軟件,基于蛋白質數據庫,對蒙古櫟醇脫氫酶進行亞細胞定位,結果顯示:細胞質占43.5%,線粒體占30.4%,細胞核占21.7%,囊泡分泌系統占4.3%,這表明蒙古櫟醇脫氫酶主要分布于細胞質、線粒體和細胞核中,少量分布于囊泡分泌系統。
2. 5 蛋白質二級結構預測
采用SOPMA[ 14 ]對蒙古櫟醇脫氫酶進行蛋白質二級結構預測,由預測結果(圖5)可以看出,該蛋白質的二級結構主要由四種折疊方式構成,無規則卷曲結構占比52.05%,延伸鏈占比28.07%,α螺旋占比14%,β轉角占比5.85%。據此推測,無卷曲結構、延伸鏈、α螺旋三種結構是蒙古櫟醇脫氫酶二級結構的主體。
2. 6 蛋白質磷酸化位點分析
蛋白質磷酸化是蛋白質翻譯后修飾的重要方式之一,蛋白質發生磷酸化后會改變蛋白質活力或形成蛋白復合體,從而促進信號在細胞內的傳遞。采用NetPhos3.1Server[ 15 ]進行蛋白磷酸化位點分析(閾值為0.5)的結果(圖6)表明,該蛋白有4個絲氨酸(Ser)、10個蘇氨酸(Thr)、1個酪氨酸(Tyr)可能成為蛋白激酶磷酸化位點。
3 結 論
本研究運用電子克隆技術對蒙古櫟醇脫氫酶基因序列進行預測,采用生物信息學軟件分析其基因結構和蛋白特征,得到以下結論:(1)蒙古櫟醇脫氫酶基因序列全長為594 bp, 開放閱讀框長度為516 bp,編碼171個氨基酸。(2)蒙古櫟醇脫氫酶基因不穩定系數為34.24,可能是穩定蛋白。(3)蛋白為親水性的非分泌蛋白,且不存在跨膜區。(4)蛋白二級結構主要由無卷曲結構、延伸鏈、α螺旋構成,在細胞質、線粒體和細胞核中分布的可能性較大。(5)有4個絲氨酸(Ser)、10個蘇氨酸(Thr)、
1個酪氨酸(Tyr),可能成為蛋白激酶磷酸化位點。通過本次試驗,基本探明了蒙古櫟醇脫氫酶基因結構和性狀,這有助于提高蒙古櫟在極端生境中尤其是水淹環境中的抗逆性,并為下一步開展基因克隆、表達、結構、分布及生理功能等方面的研究提供有益參考。
參考文獻
[1] 殷曉潔,? 周廣勝,? 隋興華,? 等.? 蒙古櫟地理分布的主導氣候因子及其閾值[J].? 生態學報,? 2013,? 33(1):? 103 - 109.
[2] 張桂芹,? 劉德江,? 姚盛智,? 等.? ?蒙古櫟林經營技術綜述[J]. 林業勘查設計,? 2017(3):? 92 - 94.
[3] 李文英,? 顧萬春.? 蒙古櫟天然群體表型多樣性研究[J].? 林業科學,? 2005,? 41(1):? 49 - 56.
[4] 劉威,? 陳昊,? 靳亞忠,? 等.? 高等植物醇脫氫酶及其基因家族研究進展[J].? 植物生理學報,? 2014(10):? 1 479-1 493.
[5] 胡皝,? 蕭浪濤.? 生物信息學在新基因全長 cDNA 電子克隆中的應用[J].? 生物技術通報,? 2007,? 2007(4):? 93 - 96.
[6] Gill R W, Sanseau P. Rapid in silico cloning of genes using expressed sequence tags (ESTs)[J]. Biotechnology annual review, 2000, 5: 25 - 44.
[7] 王冬冬,? 朱延明,? 李勇,? 等.? 電子克隆技術及其在植物基因工程中的應用[J].? 東北農業大學學報,? 2006,? 37(3):? 403 - 408.
[8] PHuang X, Madan A. CAP3: A DNA sequence assembly?program[J]. Genome research, 1999, 9(9): 868 - 877.
[9] Gasteiger E, Hoogland C, Gattiker A, et al. Protein identification and analysis tools on the ExPASy server[M]. Humana Press, 2005.
[10] Petersen T N, Brunak S, von Heijne G, et al. SignalP 4.0:discriminating signal peptides from transmembrane regions[J]. Nature methods, 2011, 8(10): 785 - 786.
[11] Kyte J, Doolittle R F. A simple method for displaying the? ?hydropathic character of a protein[J]. Journal of molecular biology, 1982, 157(1): 105 - 132.
[12] Hofmann K, Stoffel W. TMbase-A database of membrane spanning protein segments[J]. 1993.
[13] PSORT I I. PSORT: a program for detecting sorting signals in? proteins and predicting their subcellular localization[J]. J. Mol. Biol, 1997, 266: 594 - 600.
[14] Geourjon C, Deleage G. SOPMA: significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments[J]. Computer applications in the biosciences: CABIOS, 1995, 11(6): 681 - 684.
[15] Blom N, Gammeltoft S, Brunak S. Sequence and structure-based prediction of eukaryotic protein phosphorylation sites[J]. Journal of molecular biology, 1999, 294(5): 1 351 - 1 362.
In Silico Cloning and Bioinformatics Analysis of Alcohol
Dehydrogenase Gene from Quercus mongolica
REN Weichao
(Yichun Academy of Forestry,? Heilongjiang Yichun 153000)
Abstract In Quercus suber alcohol dehydrogenase sequence as the probe sequenc,using in silico cloning technology to prediction alcohol dehydrogenase gene of Quercus mongolica and Protein analysis. The results showed that the full length of alcohol dehydrogenase gene obtained 594 bp and contained a 516 bp ORF with 171 amino acid. The protein was predicted a hydrophilic non-secretory protein and no transmembrane region. Random coil, Extended strand and Alpha helix were the main secondary structure. There were 4 serine, 10 threonine and 1 tyrosine kinase phosphorylation site.
Key words Quercus mongolica;? Alcohol dehydrogenase;? In silico cloning;? Bioinformatics