郭書巧, 束紅梅, 鞏元勇, 蔣 璐, 朱靜雯, 倪萬潮
(江蘇省農業科學院經濟作物研究所,江蘇 南京 210095)
細胞色素P450(P450)廣泛存在于各種形式的生命體中,它是自然界中最大且最古老的家族[1-2]。在植物中,P450主要參與植物體內初級和次級代謝反應,并發揮重要的催化作用。其催化反應的底物包括內源性物質,如脂類、黃酮類、萜類、生物堿類等以及外源性物質,如農藥、除草劑等[3]。P450底物與功能的多樣性是為了適應各種組織中不同的代謝途徑和環境脅迫而進化的結果[4]。
菊科中含有多種芳香族植物,其中青蒿屬(Artemisiaannua)植物能產生一種倍半萜內酯過氧化物—青蒿素,青蒿素是目前世界公認的抗瘧疾首選藥物。紫穗槐-4,11-二烯(Amorphadiene)合酶是一種來源于青蒿的細胞色素P450單加氧CYP71AV1,它是一種多功能倍半萜內酯環化酶,能將萜類前體法尼基焦磷酸(FPP)氧化成紫穗槐-4,11-二烯(Amorpha-4,11-diene),并進一步氧化成青蒿素合成的前體青蒿酸(Artemisinic acid)[5]。同時青蒿中還含有大量其他萜類化合物,青蒿植物精油主要成分包括單萜和倍半萜[6-7]。因此,了解青蒿P450,對于進一步了解P450在植物初生代謝和次生代謝中的作用具有一定的指導意義。
本研究所采用的青蒿(A.annua)P450氨基酸序列下載自NCBI(http://www.ncbi.nlm.nih.gov/ protein/?term=Artemisia+P450)蛋白質數據庫,水稻(Oryzas ativa)和擬南芥(Arabidopsis thaliana) P450氨基酸序列下載自P450蛋白質數據庫 (http://drnelson.uthsc.edu/CytochromeP450.html)。
1.2.1 菊科植物青蒿P450基因的鑒定 從NCBI蛋白質數據庫中下載菊科植物青蒿中所有的P450全長序列,對其逐一進行氨基酸的一致性鑒定。對還沒有進行家族分類的P450進行NCBI blast(http://blast.ncbi.nlm.nih.gov/Blast.cgi),結合下載的擬南芥和水稻序列尋找與其一致性較高序列。根據國際命名標準對其進行分類:氨基酸序列一致性(Identity)在40%至55%之間的序列為同一家族(Family),一致性為55%~97%的序列歸入同一亞家族(Subfamily),氨基酸序列的一致性大于97%的序列是由同一基因的不同位點即等位基因編碼[8]。
1.2.2 菊科植物青蒿P450系統進化樹的構建 根據青蒿P450的氨基酸序列,通過MUSCLE[9]對所鑒定的P450氨基酸序列進行比對,采用MEGA 6.0軟件Neighbor joining法構建進化樹,重復次數為1 000次[10]。
1.2.3 青蒿和擬南芥、水稻P450系統進化樹對比
在水稻和擬南芥P450中選擇在青蒿中存在的11個家族所有P450全長氨基酸序列,采用MEGA 6.0軟件中Neighbor joining法對已鑒定的青蒿中氨基酸序列一起構建系統發育樹,重復次數為1 000次[10]。
1.2.4 青蒿P450蛋白質結構分析
1.2.4.1 青蒿P450蛋白質一級結構理化特性分析
利用在線軟件Protparam(http://web.expasy.org/ protparam)對氨基酸數目、相對分子質量、理論等電點、分子式、脂肪族氨基酸、蛋白質疏水性、不穩定系數等蛋白質一級結構理化特性進行分析。
1.2.4.2 青蒿P450蛋白質亞細胞定位和信號肽預測 使用 TargetP在線程序(http://www.cbs.dtu.dk/services/TargetP/)對青蒿 P450蛋白質進行亞細胞定位[11]。信號肽預測使用在線軟件SingaIP4.1(http://www.cbs.dtu.dk/services/SignalP/)進行[12]。
1.2.4.3 青蒿P450蛋白質的二級結構分析 利用ExPaSy在線程序SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)預測分析α-螺旋、β-折疊、轉角等;蛋白質晶體結構信息來源于 RCSB PBD(http://www.rcsb.org),共 4個細菌 P450[P450cam(CYP101)、P450BM3(CYP102)、P450eryF(CYP107A1)和P450terP(CYP108)],1 個 哺 乳 動 物 P450 (CYP2C5),1個擬南芥丙二烯氧化合酶(CYP74A,)1個灰白銀膠菊(Parthenium argentatum)丙二烯氧化合酶AOS(CYP74A2)[13]。將6個氨基酸序列與青蒿的P450用ClustalW軟件進行同源比對,選擇一致性較高的P450(CYP2C5)為模板[14],應用在線ESPript程序(http://espript.ibcp.fr/ESPript/ESPript/)進行二級結構及基質結合位點的的預測[15]。
從NCBI蛋白質數據庫中共下載76條青蒿P450蛋白質氨基酸序列。其中具有全長的氨基酸序列57條,包含8條P450還原酶蛋白質氨基酸序列。將剩余的49條序列進行氨基酸的一致性鑒定,最后獲得41個編碼細胞色素P450單加氧酶的基因(表1),其中有14個基因目前沒有經過正式的家族分類。對沒有分類的P450進行NCBI blast(http://blast.ncbi.nlm.nih.gov/Blast.cgi),并結合下載的擬南芥和水稻P450氨基酸序列找到與其一致性較高的序列,對其進行進一步確認,鑒定結果見表2。
從青蒿P450系統進化樹(圖1)可以看出,青蒿的41個基因分布相對集中,共分布在3個基因簇的11個家族中。其中 Clan72中的 CYP72有2個,Clan85中的CYP90有1個,CYP716有4個。其余全部分布于Clan 71中,且大多集中在CYP71家族中。來源于青蒿中的16個基因,除AaABG49366.1外,都在一個分支中,一致性在97%~99%,在分類上被視為同一基因的等位基因[8]。來源于青蒿屬的其他物種的P450一致性為82%~86%。

表1 預測的青蒿細胞色素P450基因分布Table 1 Distribution of the P450 genes from Artemisia annua

表2 預測的青蒿細胞色素P450與其同源序列的一致性Table 2 Similarity of P450 amino acid sequence from A.annua and other species
從青蒿和擬南芥和水稻的P450系統進化樹(圖2)中可以看出,雙子葉植物擬南芥中所特有的[21],水稻中不存在的CYP82、CYP83和CYP716 3個家族在青蒿中都出現了。有趣的是在擬南芥中不存在,而在單子葉植物中特有的CYP92家族居然在青蒿中出現。而Nelson等[21]提到的菊科中出現的8個家族 CYP73、CYP75、CYP76、CYP81、CYP93、CYP701、CYP74、CYP87,在青蒿中只有 CYP73和CYP81 2個家族出現。
選擇代表不同家族和亞家族的19個青蒿P450分析其特征特性。代表性P450氨基酸數為473~528,平均為500;相對分子量在53 977.9至61 127.3之間,平均為56 882.1(表3)。根據理論等電點(pI)將青蒿P450蛋白質分為2類:一類呈酸性,pI值介于6.00和6.69之間,包括CYP706、CYP83和 CYP82共3個家族中的5個蛋白質;另一類呈堿性,pI值介于8.03和9.25之間,包括CYP90、CYP716、CYP73、CYP72、CYP92、CYP71、CYP81、CYP98共8個家族中的14個蛋白質。不穩定指數介于32.19和42.58之間,平均值為39.64,總體上青蒿P450穩定性不太好。脂溶性指數在89.75和102.11之間,平均值也高達96.37,而其親水性指數皆為負值,故青蒿P450都是親脂性蛋白質。從表3可以看出,青蒿 P450中除 ADO16185.1(CYP92A)、ABC94480.1(CYP706)、ADO16181.1(CYP73A)外,其余都是分泌途徑中的蛋白質。信號肽分析結果表明,除ADO16181.1(CYP73A)外,其余都含有跨膜區,為跨膜蛋白質。

圖1 青蒿P450基因系統進化樹Fig.1 The phylogenetic tree of P450 from A.annua
利用在線程序SOPMA進行二級結構預測。結果(表3)表明,本研究所涉及的P450家族蛋白質二級結構以α-螺旋為主要構成元件,平均所占比例達39.64%,其次是無規則卷曲、β-折疊和轉角,平均所占比例分別為28.48%、16.57%和8.28%。以編號為BAM68808.1的蛋白質為例,繪制蛋白質二級結構(圖3)。從圖3中可見,α-螺旋為主要構成元件,無規則卷曲、β-折疊和轉角分散在整個蛋白質中。

表3 青蒿P450家族蛋白質的生物信息Table 3 The biological information of P450 protein from A.annua
利用ESPript在線程序對青蒿P450進行同源比對和二級結構預測,發現青蒿P450一級結構同源性不高,但它們卻有著非常類似的二級結構(圖3)。將這些序列與CYP2C5(1DT6)的X-射線晶體結構圖比對,發現有6個基質識別位點(SRSs),且所有基質結合位點都分布在不同結構元件中,識別特異的底物。所有青蒿P450都含有典型的保守結構域: PERF結構域(PxRx)、K螺旋(ExxR)、C末端的血紅素結合域(FxxGxxxCxG)以及N端的跨膜區(圖4)。血紅素結合域是P450蛋白的特征結構,該結構域中存在與鐵元素形成硫醇鹽離子鍵的絕對保守的半胱氨酸殘基。二級結構預測結果表明,青蒿中不同P450氨基酸序列間存在嚴格的保守基序,這些保守的基序通常分散于P450氨基酸序列中的5個區域,它們與血紅素結合區(FXXGXXXCXG),共同組成保守的P450結構中心[14]。

圖2 青蒿、擬南芥和水稻的P450系統進化樹Fig.2 The phylogenetic tree ofP450 from A.annua,Arabidopsis and rice

圖3 利用程序SOPMA進行青蒿P450蛋白質(BAM68808.1)二級結構預測Fig.3 Prediction of secondary structure of P450(BAM68808.1)from A.annua by SOPMA

圖4 利用程序ESPript進行青蒿P450蛋白質二級結構預測Fig.4 Prediction of secondary structure of P450 from A.annua using ESPript
P450 是生物界無處不在的超級大家族,植物P450 超家族被歸為10個基因簇,127個家族,其中水稻中有48個家族,擬南芥中有45個家族[21-22],有9個家族是雙子葉植物擬南芥所特有的,10個家族是單子葉植物水稻所特有。本研究共鑒定了41個青蒿P450,分布在3個基因簇的11個家族中。有趣的是,作為雙子葉植物的青蒿,目前鑒定的僅有的11個家族中,既包括了擬南芥所特有的3個家族CYP82、CYP83和CYP716,又包括了水稻特有的1個家族CYP92。而Nelson等提到的菊科中出現的8個家族中[21],只有CYP73和CYP81 2個家族出現。造成這種現象的原因,主要是由于擬南芥和水稻的基因組測序已經完成,其P450的鑒定已趨于飽和,而菊科基因組的研究還遠遠落后于擬南芥和水稻,故還會有新的P450不斷補充。另一方面,也提示我們菊科植物作為一個古老的物種,有著更為豐富的P450家族蛋白質有待開發、鑒定。
所有的P450蛋白質都呈現相似的二級結構,盡管它們的序列一致性不高(低于20%)[23]。為了更好地理解P450結構和功能之間的關系,我們以CYP2C5(1DT6)的X-射線晶體結構圖為模板[14],對青蒿P450進行了氨基酸序列聯配和次級結構元件的預測。發現所有的青蒿P450都含有典型的保守結構域,包括PERF結構域(PxRx)、K螺旋(ExxR)和C末端的血紅素結合域(FxxGxxxCxG),另外某些氨基酸殘基也具有高度的保守性,這些保守結構域在蛋白質的折疊、組裝中起著關鍵性作用[14]。而可變區主要出現在基質結合區。P450是最大的酶家族之一,能催化多種底物,這就需要該蛋白質能結合多種底物,行使各自的功能。
[1] OMURA T,SATO R.A new cytochrome in liver microsomes[J].J Biol Chem,1962,237:1375-1376.
[2] ESTABROOK R W,COOPER D Y,ROSENTHAL O.The light reversible carbon monoxide inhibitionof the steroid C21-hydroxylase system of the adrenal cortex[J].Biochem Z,1963,338: 741-755.
[3] WERCK-REICHHART D,FEYEREISEN R.CytochromesP450: a success story[J].Genome Biol,2000,1(6):30031-30039.
[4] FU C,XIONG J,MIAO W.Genome-wide identification and characterization of cytochrome P450 monooxygenase genes in the ciliate Tetrahymena thermophila[J].BMC Genomi,2009,10(208): 1-21.
[5] BOSMAN A,MENDIS K N.A major transition in malaria treatment:theadoption and deployment of artemisinin-based combination therapies[J].Am J Trop Med Hyg,2007,77:193-197.
[6] MISRA A,CHANOTIYA C S,GUPTA M M,et al.Characterization of cytochrome P450 monooxygenases isolated fromtrichome enriched fraction of Artemisia annua L.leaf[J].Gene,2012,510 (2):193-201.
[7] KOMORI A,SUZUKI M,SEKI H,et al.Comparative functional analysis of CYP71AV1 natural variants reveals an important residue for the successive oxidation of amorpha-4,11-diene[J].FEBS Lett,2013,587(3):278-284.
[8] NELSON D R.Cytochrome P450 nomenclature,2004[J].Methods Mol Biol,2006,320:1-10.
[9] EDGAR R C.MUSCLE:a multiple sequence alignment method with reduced time and space complexity[J].BMC Bioinf,2004,5:113-131
[10]HALL B G.Building phylogenetic trees from molecular data with MEGA[J].Mol Biol Evol,2013,30(5):1229-1235.
[11]EMANUELSSON O,NIELSEN H,BRUNAK S,et al.Predicting subcellular localization of proteins based on their N-terminal amino acid sequence[J].J Mol Biol,2000,300:1005-1016.
[12]PETERSEN T N,BRUNAK S,VON HEIJNE G,et al.SignalP 4.0:discriminating signal peptides from transmembraneregions[J].Nature Methods,2011,8:785-786.
[13]LI L,CHANG Z,PAN Z,et al.Modes of heme binding and substrate access for cytochrome P450CYP74A revealed by crystal structures of allene oxide synthase[J].PNAS,2008,105(37): 13883-13888.
[14]WILLIAMS P A,COSME J,SRIDHAR V,et al.Mammalian microsomal cytochrome P450 monooxygenase:structural adaptations formembrane binding and functional diversity[J].Mol Cell,2000,5(1):121-131.
[15]GOUET P,ROBERT X,COURCELLE E.ESPript/ENDscript: Extracting and rendering sequence and 3D information from atomic structures of proteins[J].Nucleic Acids Res,2003,31(13): 3320-3323.
[16]RO D K,PARADISE E M,OUELLET M,et al.Production of the antimalarial drug precursor artemisinic acid in engineered yeast[J].Nature,2006,440(7086):940-943.
[17]TEOH K H,POLICHUK D R,REED D W,et al.Artemisia annua L. (Asteraceae) trichome-specific cDNAs reveal CYP71AV1,a cytochrome P450 with a key role in the biosynthesis of the antimalarial sesquiterpene lactone artemisinin[J].FEBS Lett,2006,580(5):1411-1416.
[18]OLSSON M E,OLOFSSON L M,LINDAHL A L,et al.Localization of enzymes of artemisinin biosynthesis to the apical cells of glandular secretory trichomes of Artemisia annua L.[J].Phytochemistry,2009,70(9):1123-1128.
[19]TING H M,WANG B,RYDEN A M,et al.The metabolite chemotype of Nicotianaben thamiana transiently expressing artemisinin biosynthetic pathway genes is a function ofCYP71AV1 type and relative gene dosage[J].New Phytol,2013,199(2):352-366.
[20]NAIR P,MISRA A,SINGH A,et al.Differentially expressed genes during contrasting growth stages of Artemisia annua for artemisinincontent[J]. PLoS ONE, 2013, 8 (4): 6037510-6037512.
[21]NELSON D R,SCHULER M A,PAQUETTE S M,et al.Comparative genomics of rice and Arabidopsis.Analysis of 727 cytochrome P450 genes and pseudogenes from a monocot and a dicot[J].Plant Physiol,2004,135(2):756-772.
[22]NELSON D R,WERCK-REICHHART D.A P450-centric view of plant evolution[J].Plant J,2011,66(1):194-211.
[23]GRAHAM S E,PETERSON J A.How similar are P450s and what can their differences teach us?[J].Arch Biochem Biophys,1999,369(1):24-29.