唐文武,吳秀蘭,鐘佩橋
(1.肇慶學院 生命科學學院,廣東 肇慶 526061;2.肇慶學院 食品與藥品工程學院,廣東 肇慶 526061)
bHLH (basic helix-loop-helix)轉錄因子是一類含有bHLH結構域,在真核生物中廣泛存在的轉錄因子超家族[1]。bHLH結構域一般由50~60個氨基酸組成,包括N端由10~15個堿性氨基酸組成的DNA結合區域,以及C端由約40個氨基酸組成的α螺旋-環-α螺旋區域(HLH)[2]。高等植物具有數目較多的各類bHLH轉錄因子,目前已在擬南芥中發現21個亞家族的147個bHLH轉錄因子[3,4],在水稻中鑒定出了22個亞家族的167個bHLH轉錄因子[5],它們在植物生長發育、形態建成、花器官形成、激素應答、次生產物代謝和抗逆性等方面發揮重要作用[6-8]。
白菜是重要的蔬菜作物,與擬南芥有著共同的祖先,是研究多倍體事件的經典材料[9]。bHLH是植物重要的轉錄因子,能通過調控花器官相關基因的表達而影響小孢子發育,與植物雄性不育發生密切相關。目前已在擬南芥、水稻、玉米等模式植物中發現bHLH轉錄因子在花藥絨氈層發育、小孢子母細胞減數分裂,以及雄蕊發育等過程中起到重要作用,其基因突變或功能異常會引起植物雄性不育[10]。目前已在擬南芥、水稻中鑒定了AMS[11]、DYT1[12]、JAM[13]、UDT1[14]、TDR1[15]等與雄性不育相關的 bHLH基因,但在白菜中開展 bHLH轉錄因子的研究較少。為了深入挖掘與白菜細胞核雄性不育相關的bHLH轉錄因子,本研究利用生物信息學方法,對白菜bHLH轉錄因子家族的成員進行了全基因鑒定,對其bHLH結構域、進化關系進行了分析,并利用轉錄組數據對bHLH轉錄因子家族基因在可育和不育花蕾中的表達差異進行了分析,篩選了與雄性不育相關的bHLH基因,以期為進一步揭示白菜bHLH家族基因在雄蕊發育中的生物學功能和雄性不育應用提供參考。
從蕓薹屬BRAD基因組數據庫(http://brassicadb.org/brad/)中下載白菜(B.rapa)全基因組序列(V1.5版),在Pfam數據庫(http://pfam.xfam.org/)下載bHLH結構域(PF00010)的隱馬爾可夫模型序列譜,并利用HMMEMIT軟件獲取其蛋白保守序列,用此序列檢索白菜BRAD(http://brassicadb.org/brad/)和NCBI(http://www.ncbi.nlm.nih.gov/)中的蛋白質數據庫;然后利用SMART(http://smart.embl-heidelberg.de/)進行保守結構域預測,并去除假陽性序列,獲得白菜bHLH轉錄因子家族候選基因,用于后續分析。
利用ExPASy(http://web.expasy.org/)在線預測bHLH轉錄因子的氨基酸數量、分子量、等電點等基本理化特征。從PGDD數據庫(http://chibba.agtec.uga.edu/duplication)獲取基因復制及共線性分析數據,利用Circos軟件對bHLH家族基因的染色體位置和共線性關系進行可視化分析[16]。利用clustal X對白菜bHLH轉錄因子的保守結構域進行比對,并利用Web Logo 3(http://weblogo.threeplusone.com/)進行可視化作圖[17]。最后利用MEGA 7程序的鄰接法構建白菜bHLH轉錄因子的系統進化樹,其Bootstrap值設為1000。
白菜基因的表達數據來源于NCBI中的GEO數據庫,利用白菜細胞核雄性不育兩用系中可育及不育花蕾的轉錄組數據[18],以FPKM 值作為衡量基因表達水平的指標,篩選bHLH轉錄因子家族基因在可育和不育花蕾中的差異表達序列,以log2倍數絕對值大于2為依據篩選差異表達的bHLH基因。
根據bHLH結構域PF00010的特征文件,在NCBI、BRAD的白菜數據庫中鑒定到249個bHLH轉錄因子家族蛋白,按照其在BRAD數據庫中的基因序號,分別命名為BraHLH001~BraHLH249。理化性質預測顯示白菜bHLH轉錄因子家族成員的基因長度為1134~13231 bp,蛋白質氨基酸數目介于84~1201,分子量為9.80~132.38 kDa,理論等電點分布在4.69~9.81范圍內。
進一步對249個白菜bHLH轉錄因子家族成員的bHLH結構域序列進行分析,發現bHLH結構域基序長度為41~66,平均氨基酸數目為49.8。用clustal X對所有的bHLH結構域進行多序列比對,然后采用WebLogo作圖,結果(圖1)顯示白菜的bHLH結構域由50個氨基酸組成,其N端的Basic區含有植物中高度保守的His5-Glu9-Arg13序列,該序列對靶基因啟動子上游的E-box識別結合必不可少;在C端的HLH區域,第23、49位的Leu高度保守,第39、43、46位的Leu/Ile/Val也非常保守,這些氨基酸殘基對于二聚體的形成和功能非常重要。

圖1 白菜bHLH轉錄因子家族的保守結構域
白菜bHLH轉錄因子家族基因的染色體定位結果(圖2)顯示,除BraHLH240、BraHLH247、BraHLH248、BraHLH249定位在scaffold上外,其余的245個基因不均勻地分布于白菜的10條染色體上,其中在A9染色體上的bHLH轉錄因子家族基因最多,達39個;其次是在A3染色體上,有33個基因;而在A8、A10染色體上分布的基因較少,分別僅含有16、14個基因;在其它6條染色體上分布有22~27個bHLH轉錄因子家族基因。
為了進一步確定白菜bHLH基因之間的關系,以及進化中潛在的重復事件,對249個白菜bHLH基因的旁系同源基因對進行共線性分析。結果(圖2)表明,除了49個白菜bHLH基因沒有同源重復外,其余200個bHLH基因均有對應的旁系同源基因,但多數旁系同源基因分布在不同染色體上,該結果可能是由白菜全基因組三倍化事件引起的。

圖2 白菜bHLH轉錄因子基因家族的共線性關系及其在染色體上的分布
利用MEGA 7軟件對鑒定出的249個白菜bHLH轉錄因子家族蛋白的bHLH結構域序列構建系統進化樹,并以擬南芥的bHLH轉錄因子亞家族分類方法作為參考。系統進化分析結果(圖3)表明,白菜中249個bHLH蛋白可被分為24個亞家族,其中XⅡ、Ⅰb (2)、Ⅰa三個亞族的bHLH成員最多,分別包含29、25、23個bHLH蛋白;第Ⅲ(a+c)、Ⅲb、Ⅲ(d+e)、Ⅶ(a+b)、Ⅷa、Ⅷc、Ⅴb、X、XV共9個亞族的bHLH蛋白成員為10~19個;第Ⅱ、Ⅲf、Ⅰb(1)、Ⅳa、Ⅳb、Ⅳc、Ⅴa、Ⅷb、IX、XI共10個亞族的bHLH成員為3~9個;而Ⅳd和Orphans亞族的成員最少,均只含有1個bHLH蛋白。

圖3 白菜bHLH轉錄因子家族的系統發育進化樹
基于白菜核不育兩用系中可育及不育花蕾的轉錄組數據,對249個bHLH轉錄因子家族基因在可育、不育花蕾中的表達差異性進行了分析,結果如表1所示,共有12個白菜bHLH轉錄因子基因在不育與可育花蕾中的表達量log2倍數值大于2。相較于可育花蕾,不育花蕾中有10個基因的表達量顯著下調,另2個基因BraHLH191、BraHLH200的表達量顯著上升。這12個表達差異的bHLH轉錄因子基因,可能與雄蕊不育性狀相關。其中BraHLH034是擬南芥AMS的直系同源基因,可能參與花藥絨氈層發育以及小孢子母細胞減數分裂的調控過程[11,19],而BraHLH106、BraHLH125與擬南芥的bHLH89、bHLH91為直系同源基因,通過與DYT1相互作用調控花藥發育并引起雄性不育現象[20]。

表1 白菜可育和不育花蕾中表達差異顯著的bHLH轉錄因子基因
bHLH轉錄因子是植物中數量最多的一類轉錄因子,在植物生長發育的各環節均發揮重要的調控作用。目前對擬南芥、水稻等模式植物的bHLH轉錄因子的研究比較深入,但對蔬菜類bHLH基因家族的研究較少。本研究利用生物信息學方法從白菜基因組中鑒定出249個bHLH轉錄因子,并發現其bHLH結構域由約50個氨基酸組成,其N端的Basic區含有高度保守的H5-G9-A13序列,可與啟動子區的E-box結合;而C端第23、49位的亮氨酸高度保守,第43、46位的亮氨酸/異亮氨酸/纈氨酸也非常保守,這些保守位點與bHLH轉錄因子的功能密切相關。染色體定位分析結果顯示245個白菜bHLH轉錄因子基因不均勻地分布于10條染色體上,多數基因有對應的旁系同源基因。根據bHLH結構域的特征,可將白菜的249個bHLH蛋白分為24個亞家族,比擬南芥和水稻的亞家族數目多,其中XⅡ是最大類的亞家族,包含29個bHLH成員。
在模式植物中發現bHLH轉錄因子與雄性不育的形成密切相關,bHLH轉錄因子會參與花藥絨氈層的發育或小孢子發育,其功能異常會引起絨氈層細胞提前或延遲降解,致使花粉形成受阻而敗育[10]。目前已在擬南芥中發現DYT1[12]、AMS[11]、MYC[21]等bHLH轉錄因子在花藥絨氈層發育和小孢子母細胞減數分裂中起到重要作用,發現3個JAM基因參與茉莉酸信號的轉導,并在雄蕊發育中起到負調控作用[13]。在水稻中發現了UDT1[22]、TDR1[23]、EAT1[24]、TIP2[25]等bHLH轉錄因子在絨氈層細胞發育和程序性死亡中發揮重要作用,其功能異常也會引起雄性不育。本研究對白菜可育、不育花蕾中的bHLH轉錄因子家族基因的表達差異進行了分析,結果顯示,12個白菜bHLH轉錄因子基因在不育與可育花蕾中的表達量差異顯著。其中BraHLH034是擬南芥AMS基因的直系同源基因,可能參與花藥絨氈層發育以及小孢子母細胞減數分裂的調控過程[11,19];而BraHLH106、BraHLH125與擬南芥的bHLH89、bHLH91為直系同源基因,與DYT1相互作用從而調控花藥的發育,兩個或以上的突變體會導致雄性不育現象[20]。我們分析認為BraHLH034、BraHLH106、BraHLH125等bHLH轉錄因子基因參與雄蕊的發育過程。本研究結果為探索植物雄蕊發育的調控機理,以及探討bHLH轉錄因子參與植物雄性不育的發生機理奠定了基礎。