夏承東 方大偉



摘要?FAR-RED IMPAIRED RESPONSE 1(FAR1)?基因在植物生長(zhǎng)發(fā)育中起著重要的調(diào)控作用。該研究采用生物信息學(xué)的方法,從辣椒基因組中鑒定得到20個(gè)CaFAR1轉(zhuǎn)錄因子家族成員,系統(tǒng)進(jìn)化分析表明,20個(gè)?CaFAR1基?因分為6個(gè)亞家族,其中18個(gè)?CaFAR1?基因分布在8條染色體上,8 號(hào)染色體上有3個(gè),2號(hào)、6號(hào)、7號(hào)、12號(hào)染色體各分布1個(gè),6號(hào)和10號(hào)染色體上各分布2個(gè),3號(hào)染色體上有6個(gè)。GO功能注釋表明,20個(gè)CaFAR1蛋白序列基于氨基酸的相似性被分為三大類:生物過(guò)程(BP)、細(xì)胞成分(CC)和分子功能(MF)。
關(guān)鍵詞?辣椒;?FAR?基因家族;生物信息學(xué);全基因組分析
中圖分類號(hào)?Q943.2?文獻(xiàn)標(biāo)識(shí)碼?A
文章編號(hào)?0517-6611(2020)14-0097-06
doi:10.3969/j.issn.0517-6611.2020.14.027
Abstract?FAR-RED IMPAIRED RESPONSE 1 (FAR1)?gene plays an important regulatory role in plant growth and development.In this study,bioinformatics was used to identify 20 CaFAR1 transcription factor family members from the pepper genome.Phylogenetic analysis showed that 20?CaFAR1?genes were divided into 6 subfamilies.Of all 20?CaFAR1?genes,18 genes were mapped to the 8 chromosomes.Three genes were mapped to chromosome 3,four genes were mapped to chromosome 2,6,7 and 12 with one for each.Two genes were mapped to the chromosome 6 and 10.There are 6 genes were mapped to the chromosome 3.GO analysis showed that the functions of 20?CaFAR1?genes were enriched in biological process,cell component and molecular function.
Key words?Pepper;?FAR?gene family;Bioinformatics;Whole genome analysis
FAR-RED IMPAIRED RESPONSE 1(FAR1)是轉(zhuǎn)座酶衍生的一類轉(zhuǎn)錄因子,是能夠在遠(yuǎn)紅光下直接激活FHY1/FHL的基因表達(dá),其在植物淀粉合成代謝和碳饑餓引發(fā)的能量匱乏過(guò)程中起著重要調(diào)控作用[1-2]。目前,已在擬南芥中分離得到了14個(gè)FAR1家族成員被鑒定,編碼的蛋白長(zhǎng)度為531~851個(gè)氨基酸[3]。而在棉花中鑒定出88個(gè)?FAR1?基因,其中亞洲棉27個(gè)、雷蒙氏棉35個(gè)、陸地棉26個(gè),編碼的蛋白長(zhǎng)度為158~1 134個(gè)氨基酸[4]。辣椒是我國(guó)一種重要的蔬菜作物,光照時(shí)間、光照強(qiáng)度以及不同光質(zhì)對(duì)辣椒產(chǎn)量和品質(zhì)都有很大的影響。然而關(guān)于辣椒光敏色素調(diào)控相關(guān)基因的報(bào)道鮮見(jiàn)。該研究利用生物信息學(xué)方法,篩選、鑒定辣椒?FAR1?基因家族成員,通過(guò)分析其系統(tǒng)進(jìn)化關(guān)系、基因結(jié)構(gòu),以及染色體定位,探索辣?椒FAR1?基因功能及其應(yīng)用。
1?材料與方法
1.1?植物序列來(lái)源
辣椒?(Capsicum annuum?L.)FAR1轉(zhuǎn)錄因子家族數(shù)據(jù)來(lái)源于NCBI(https:∥www.ncbi.nlm.nih.gov/genome/?term=Capsicum+annuum)與PlantTFDB(http:∥planttfdb.cbi.pku.edu.cn)等數(shù)據(jù)庫(kù)。擬南芥?(Arabidopsis thaliana)與番茄(Solanum lycopersicum)?FAR1轉(zhuǎn)錄因子氨基酸序列來(lái)源于PlantTFDB數(shù)據(jù)庫(kù)。
1.2?辣椒FAR1轉(zhuǎn)錄因子家族基因的篩選
從TAIR(https:∥www.arabidopsis.org)數(shù)據(jù)庫(kù)中下載擬南芥FAR1轉(zhuǎn)錄因子序列,利用BlastP篩選出辣椒的FAR1轉(zhuǎn)錄因子,得到候選CaFAR1蛋白序列。將這些序列導(dǎo)入CD-HIT Suite(http:∥weizhongli-lab.org/cdhit_suite/cgi-bin/index.cgi)在線網(wǎng)站中去除冗余序列,再經(jīng)過(guò)SMART(http:∥smart.embl-heidelberg.de/opennewwindow)在線預(yù)測(cè),得到具有FAR1保守結(jié)構(gòu)域的蛋白序列。參考Lin等[5]的分類方法,將辣椒FAR1蛋白序列歸為6類。
1.3?辣椒FAR1轉(zhuǎn)錄因子家族理化分析與進(jìn)化樹(shù)構(gòu)建
利用在線ProtParam網(wǎng)站(https:∥web.expasy.org/protparam/)對(duì)鑒定出的辣椒FAR1蛋白進(jìn)行理化性質(zhì)分析。 使用MEGA 7.0軟件內(nèi)置的 Clustal W程序?qū)﹁b定出的FAR1類蛋白序列和擬南芥FAR1家族、番茄FAR1家族蛋白序列進(jìn)行序列比對(duì),采用鄰接(neighbor-joining,N)法構(gòu)建系統(tǒng)發(fā)育樹(shù),選用Poisson模型并設(shè)置Bootstrap value為1 000,缺失值處理方式為配對(duì)刪除(pairwise deletion),其他參數(shù)使用默認(rèn)值[5]。
1.4?辣椒FAR1轉(zhuǎn)錄因子家族氨基酸序列比對(duì)、保守結(jié)構(gòu)域分析?將辣椒FAR1轉(zhuǎn)錄因子家族的氨基酸序列上傳至DNAMAN8.0中進(jìn)行比對(duì),得到氨基酸序列比對(duì)結(jié)果。利用MEME在線軟件(http:∥meme suit.org)對(duì)辣椒FAR1轉(zhuǎn)錄因子保守元件進(jìn)行預(yù)測(cè)分析,將motif數(shù)量設(shè)為10。對(duì)辣椒FAR1轉(zhuǎn)錄因子保守元件進(jìn)行圖形化顯示。
1.5?辣椒FAR1轉(zhuǎn)錄因子家族基因結(jié)構(gòu)與染色體定位分析
利用本地軟件UltraEdit得到辣椒FAR1轉(zhuǎn)錄因子家族基因結(jié)構(gòu)信息與染色體信息,將辣椒FAR1轉(zhuǎn)錄因子家族基因結(jié)構(gòu)信息上傳至在線軟件GSDS(http:∥gsds.cbi.pku.edu.cn/)中得到基因結(jié)構(gòu)示意圖。用在線軟件MG2C(http:∥mg2c.iask.in/mg2c_v2.0/)對(duì)辣椒FAR1轉(zhuǎn)錄因子家族的染色體信息進(jìn)行圖形化顯示。
1.6?辣椒FAR1轉(zhuǎn)錄因子家族基因GO注釋分析
使用Blast2GO的非冗余蛋白質(zhì)數(shù)據(jù)庫(kù)軟件與默認(rèn)參數(shù),首先將CaFAR1氨基酸序列與NCBI進(jìn)行BlastP比對(duì)。然后對(duì)每一個(gè)CaFAR1都獲取GO注釋,得到GO注釋的ID,導(dǎo)出數(shù)據(jù)之后使用GraphPad作圖。
2?結(jié)果與分析
2.1?CaFAR1轉(zhuǎn)錄因子家族的鑒定及特征?利用本地 Blast 軟件對(duì)辣椒全基因組蛋白序列進(jìn)行檢索,同時(shí)手動(dòng)剔除重復(fù)序列,只保留一個(gè)FAR1結(jié)構(gòu)域的蛋白序列。最后得到20個(gè)只具有一個(gè)FAR1結(jié)構(gòu)域的轉(zhuǎn)錄因子家族成員[6],利用ExPASy(https:∥web.expasy.org/cgi-bin/protparam/protparam)在線軟件對(duì)CaFAR1轉(zhuǎn)錄因子家族進(jìn)行分析,得到CaFAR1轉(zhuǎn)錄因子的氨基酸大小、分子量和等電點(diǎn)等信息(表1)。辣椒FAR1轉(zhuǎn)錄因子家族成員蛋白序列含有氨基酸數(shù)目為220(XP_016567405.1)~877(XP_016580413.1),利用 Expasy 軟件預(yù)測(cè)CaFAR1分子量大小為 25 546.68(XP_016567405.1)~100 799.3 Da (XP_016580413.1),等電點(diǎn)為 5.12(XP_016553207.1)~9.39 (XP_016567405.1),除CaFAR1-14之外,其余CaFAR1蛋白都不穩(wěn)定。從以上理化性質(zhì)來(lái)分析,辣椒FAR1轉(zhuǎn)錄因子家族成員之間的各項(xiàng)指標(biāo)跨度較大,具有差異性,在篩選出的20個(gè)轉(zhuǎn)錄因子家族成員中,有13個(gè)轉(zhuǎn)錄因子的等電點(diǎn)小于7,占 65%,呈弱酸性。
2.2?CaFAR1轉(zhuǎn)錄因子家族系統(tǒng)進(jìn)化樹(shù)?PlantTFDB v5.0(http:∥planttfdb.cbi.pku.edu.cn)在線軟件中下載擬南芥與番茄的FAR1轉(zhuǎn)錄因子家族,利用MEGA7系統(tǒng)進(jìn)化樹(shù)構(gòu)建軟件構(gòu)建擬南芥、番茄與辣椒的系統(tǒng)進(jìn)化樹(shù)。系統(tǒng)進(jìn)化樹(shù)的構(gòu)建使用最大近似然法,MEGA7參數(shù)采用系統(tǒng)默認(rèn)值,最終得到圖1所示的進(jìn)化樹(shù)。根據(jù)Lin等[5]對(duì)擬南芥的分類方法對(duì)得到的系統(tǒng)進(jìn)化樹(shù)進(jìn)行亞家族分類,共分為6個(gè)亞家族,命名為I~VI。
2.3?氨基酸序列比對(duì)
使用DANMAN8.0 序列分析軟件對(duì)辣椒?FAR1?基因保守結(jié)構(gòu)域進(jìn)行分析,結(jié)果表明,20個(gè)蛋白序列均含有FAR1 保守結(jié)構(gòu)域(圖2、3)。所有FRS亞組的大多數(shù)成員都具有N末端C2H2鋅指結(jié)構(gòu)域,N末端FAR1 DNA結(jié)合結(jié)構(gòu)域是WRKY-神經(jīng)膠質(zhì)細(xì)胞缺失(WRKY-GCM1)超家族中的一種C2H2鋅指結(jié)構(gòu)域,它與多種靶標(biāo)的啟動(dòng)子區(qū)域中的特定順式元件結(jié)合。
2.4?CaFAR1保守結(jié)構(gòu)域與基因結(jié)構(gòu)分析
將CaFAR1氨基酸序列上傳至在線軟件MEME(http:∥meme suit.org)對(duì)辣椒FAR1序列的保守元件進(jìn)行預(yù)測(cè)分析,將motif數(shù)量設(shè)為10,分析結(jié)果如圖4B所示。發(fā)現(xiàn),IV亞家族中除CaFAR1-10與CaFAR1-20外均含有10個(gè)motif;亞家族Ⅰ中所有CaFAR1都含有10個(gè)motif,亞家族Ⅲ中缺少motif 9;亞家族V中均含有motif 3;亞家族VI中均含有motif 1與motif 8。
通過(guò)辣椒GFF注釋文件中獲得CaFAR1的內(nèi)含子外顯子的數(shù)據(jù),上傳至在線軟件GSDS(http:∥gsds.cbi.pku.edu.cn/)對(duì)辣椒?FAR1?基因家族的基因結(jié)構(gòu)進(jìn)行分析。由圖4C可知,不同亞組成員的內(nèi)含子數(shù)量存在差異。亞家族I中基因內(nèi)含子較為相似,內(nèi)含子數(shù)量較多,CaFAR1-16內(nèi)含子有10個(gè),在所有CaFAR1中數(shù)量最多;亞家族Ⅱ的成員含有1~3個(gè)內(nèi)含子;亞家族Ⅲ的CaFAR1-5內(nèi)含子有1個(gè),CaFAR1-8有2個(gè)內(nèi)含子;亞家族Ⅳ成員含有2~5個(gè)內(nèi)含子;亞家族Ⅴ成員含有2~5個(gè)內(nèi)含子;亞家族Ⅵ成員含有2~6個(gè)內(nèi)含子。
2.5?染色體定位
通過(guò)辣椒GFF注釋文件中獲得?CaFAR1的?位置信息,上傳至在線軟件mg2c(http:∥mg2c.iask.in/mg2c_v2.0/)中,將18?個(gè) CaFAR1?基因定位到辣椒染色體上,有2?個(gè)CaFAR1基?因未被定位到染色體上。 如圖5所示,辣椒的18個(gè)?CaFAR1?基因分布在8條染色體上,8 號(hào)染色體上有3個(gè),2號(hào)、6號(hào)、7號(hào)、12號(hào)染色體各分布1個(gè),6號(hào)和10號(hào)染色體上各分布2個(gè),3號(hào)染色體上有6個(gè)。
2.6?GO分析?使用Blast2GO的非冗余蛋白質(zhì)數(shù)據(jù)庫(kù)軟件與默認(rèn)參數(shù),首先將CaFAR1氨基酸序列與NCBI進(jìn)行BlastP比對(duì)。然后對(duì)每一個(gè)CaFAR1都獲取GO注釋,得到GO注釋的ID,導(dǎo)出數(shù)據(jù)之后使用GraphPad作圖(圖6)。可以發(fā)現(xiàn),20個(gè)CaFAR1蛋白序列基于氨基酸的相似性被分為三大類:生物過(guò)程(BP)、細(xì)胞成分(CC)和分子功能(MF),大部分CaFAR1與離子結(jié)合相關(guān),顯然與CaFAR1的鋅指結(jié)構(gòu)域功能吻合。CaFAR1在細(xì)胞成分(CC)和分子功能(MF)這兩方面發(fā)揮了很大的作用,由此可以推斷CaFAR1在辣椒的生長(zhǎng)發(fā)育與信號(hào)傳遞中發(fā)揮了很大的作用。
3?討論與小結(jié)
光是植物生長(zhǎng)和發(fā)育的能量來(lái)源,光敏色素(phytochromes)是高等植物光受體網(wǎng)絡(luò)中不可或缺的一個(gè),其通過(guò)感受紅光和遠(yuǎn)紅光,直接或間接調(diào)控下游的轉(zhuǎn)錄因子,從而控制下游基因表達(dá),影響植物的種子萌發(fā)、幼苗去黃化、葉綠體運(yùn)動(dòng)等生長(zhǎng)發(fā)育進(jìn)程[4,7-10]。FAR1是phyA信號(hào)通路中重要的正向調(diào)控因子之一。已在擬南芥、棉花中分離得到了多個(gè)FAR1家族成員[3-4]。該研究通過(guò)對(duì)辣椒全基因組掃描,從中鑒定得到了20個(gè)CaFAR1轉(zhuǎn)錄因子家族成員,結(jié)合基因結(jié)構(gòu)分析與系統(tǒng)進(jìn)化分析,20個(gè)?CaFAR1基?因分為6個(gè)亞家族。其中,18個(gè)?CaFAR1基?因分布在8條染色體上。而對(duì)其功能注釋表明,20個(gè)CaFAR1蛋白序列基于氨基酸的相似性被分為三大類:生物過(guò)程(BP)、細(xì)胞成分(CC)和分子功能(MF)。
參考文獻(xiàn)
[1]陳芳,鄧興旺.遠(yuǎn)紅光受體伴侶蛋白FHY1在介導(dǎo)基因表達(dá)和植物生長(zhǎng)發(fā)育過(guò)程中的獨(dú)特作用[J].遺傳,2014,36(9):958.
[2]CASAL J J.Phytochromes,cryptochromes,phototropin:Photoreceptor interactions in plants[J].Photochemistry & photobiology,2000,71(1):1-11.
[3]LIN R C,WANG H Y.Arabidopsis?FHY3/FAR1?gene family and distinct roles of its members in light control of Arabidopsis development[J].Plant physiology,2004,136(4):4010-4022.
[4]袁娜,王彤,劉廷利,等.棉花FAR1/FHY3基因家族的全基因組分析[J].棉花學(xué)報(bào),2018,30(1):1-11.
[5]LIN M ,GANG L.FAR1-RELATED SEQUENCE (FRS) and FRS-RELATED FACTOR (FRF) family proteins in arabidopsis growth and development[J].Frontiers in plant science,2018, 9:692.
[6]惠甜,沈兵琪,王連春,等.桑樹(shù)bHLH轉(zhuǎn)錄因子家族全基因組鑒定與分析[J].分子植物育種,2019,17(17):5624-5637.
[7]HEIJDE M,ULM R.UV-B photoreceptor-mediated signalling in plants[J].Trends in plant science,2012,17(4):230-237.
[8]劉圈煒,何云,齊勝利,等.光敏色素研究進(jìn)展[J].中國(guó)農(nóng)學(xué)通報(bào),2005,21(5):237-241.
[9]FURUYA M.Phytochromes:Their molecular species,gene families,and functions[J].Annual review of plant physiology and plant molecular biology,1993,44(1):617-645.
[10]TEPPERMAN J M,ZHU T,CHANG H S,et al.Multiple transcription-factor genes are early targets of phytochrome A signaling[J].Proceedings of the national academy of sciences of the United States of America,2001,98(16):9437-9442.