呂 赟,丘日光,楊仕梅,吳佳海,宋 莉
(1.貴州大學 生命科學學院/農業生物工程研究院/山地植物資源保護與種質創新教育部重點實驗室/貴州省農業生物工程重點實驗室,貴州 貴陽 550025; 2.貴州省草業研究所,貴州 貴陽 550006)
植物對外界環境變化的適應性生長發育與激素調控密切相關[1-2],生長素(Auxin,IAA)是調控該過程的關鍵激素之一[3-5],在植物生長發育過程中呈濃度梯度的時空不對稱分布[6],這與其極性運輸方式有關[7]。植物生長素極性運輸由生長素輸出載體蛋白PIN-formed (PIN)家族、AUXIN RESISTANT1/LIKE AUX1家族(AUX1/LAX)和 ATP-Binding Cassette subfamily B/P-glycoprotein家族(PGP/ABCB)3類蛋白質介導[8],其中PIN和PGP/ABCB屬于外向型運輸蛋白質,AUX1/LAX屬于內向型運輸蛋白質。PIN基因結構及其編碼的蛋白質特性是其實現生物學功能的基本前提,PIN基因家族的跨膜蛋白是植物特有的生長素輸出載體蛋白,幾乎存在于所有的植物中,在生長素極性運輸中發揮關鍵作用[9-10]。
百脈根(Lotuscorniculatus)為豆科百脈根屬多年生草本植物,其營養豐富、皂素含量低、適口性好、采食率高,是一種優質牧草[11-12]。同時,因其匍匐生長、覆蓋度好,根系較為發達,自繁能力強,在改造小流域、保持水土和提高經濟效益中也有著重要價值[13-14]。此外,百脈根還具有再生力強、自交結實、遺傳轉化效率高、易得到穩定遺傳的后代等優點,常用作豆科模式植物進行生物學及基因組學研究[15-17]。PIN基因在擬南芥和水稻等模式植物中研究得較為清楚,但在百脈根中鮮見報道,鑒于此,利用擬南芥PIN蛋白家族信息,在百脈根全基因組數據中對其PIN基因家族成員(LjPIN)進行鑒定,并分析該基因家族成員的進化關系、編碼的蛋白質理化性質、順式作用元件組成及組織差異表達等,旨在為百脈根LjPIN的功能研究奠定基礎。
百脈根PIN基因及編碼蛋白質序列來自百脈根全基因組數據庫(http://www.kazusa.or.jp/lotus/),擬南芥PIN蛋白家族序列來自KEGG數據庫(http://www.kegg.jp/),水稻PIN蛋白家族序列來自Pfam數據庫(http://pfam.xfam.org/family/PF03547/),大豆PIN蛋白家族序列參考WANG等[18]的報道。
通過構建隱馬爾科夫模型,用Pfam數據庫(http://pfam.xfam.org/)含Mem_trans domain(PF03547)的模型與百脈根全基因組序列構建比對庫,篩選鑒定百脈根PIN基因;通過在線軟件MG2C(http://mg2c.iask.in/mg2c_v2.0/)對獲得的PIN基因進行染色體定位,基因命名根據所在染色體位置進行。
從數據庫(http://www.kazusa.or.jp/lotus/)獲得百脈根PIN基因的外顯子和內含子數據并進行分析,用GSDS 2.0基因結構顯示系統(http//gsds.cbi.pku.edu.cn/)繪制基因結構圖。利用MEGA 7.0鄰接法(Neighbor-joining,NJ)構建百脈根、擬南芥、水稻和大豆的PIN蛋白進化樹,Bootstrap值設置為1 000,缺口設置“pairwise deletion”,采用“poisson model”驗證可信度。
采用ExPASy ProtParam(http://cn.expasy.org)程序對百脈根PIN基因家族編碼的蛋白質分子質量、理論等電點、不穩定系數和親水性指數進行分析;利用SOPMA(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)預測蛋白質二級結構;通過MEME工具(http://meme.nbcr.net/meme/)分析蛋白質保守基序(Motif),設置基序數量15個,其余參數為默認條件。
參考文獻[19],利用在線預測工具PlantCARE(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)對獲得的百脈根PIN基因上游2 000 bp序列和主要的順式作用元件進行預測和分析。
從基因芯片數據庫(https://ljgea.noble.org/v2/)獲得百脈根PIN基因在根、莖、葉、花等器官及不同時期種子的表達量數據,并進行分析、作圖。
經比對共獲得35條LjPIN序列(表1),屬于27個候選基因,其中,LjPIN2、LjPIN6、LjPIN7、LjPIN19、LjPIN25和LjPIN27基因各2條LjPIN序列,LjPIN26基因有3條LjPIN序列,其他LjPIN基因各1條LjPIN序列。Lj0g3v0172269、Lj0g3v0320849、Lj1g3v0264160、Lj3g3v3735560、Lj5g3v0323470、Lj5g3v1174510和Lj5g3v2166080共7條序列存在可變剪切。通過Pfam數據庫對所有候選基因保守結構域進行分析發現,27個候選基因均含有PIN基因家族保守結構域Mem_trans(PF03547)。

表1 LjPIN基因家族基本信息Tab.1 Basic information of LjPIN gene family members
注:+表示與染色體測序方向一致;-表示與染色體測序方向不一致。
Note: +means consistent with chromosome sequencing direction; - means inconsistent with the direction of chromosome sequencing.
根據百脈根基因組信息分析27個PIN基因在染色體上的分布情況。百脈根共有6條染色體(Chr1—Chr6),另定義Chr0為無法定位到染色體上的基因所虛構的一條染色體。分析表明,在Chr1、Chr2、Chr3、Chr4、Chr5上分別分布著4、6、3、5、3個PIN基因, Chr6上無PIN基因分布,其中Lj0g3v0103729、Lj0g3v0172269、Lj0g3v0178829、Lj0g3v0178879、Lj0g3v0276789和Lj0g3v0320849存在于Chr0上(圖1)。
對鑒定得到的27個LjPIN基因進行系統進化、內含子和外顯子分析。結果(圖2)表明,百脈根PIN基因家族除了LjPIN4、LjPIN13、LjPIN23這3個以外,其他均含1~10個內含子和1~10個外顯子,其中LjPIN1和LjPIN2還存在非編碼區(UTR)。根據AtPIN與LjPIN的進化關系,參考文獻[20],可以將LjPIN分為兩大類,其中LjPIN3、4、6、10、11、13、20、21、22、23為Long PIN,其余的LjPIN成員為Short PIN。

Chr0為虛擬的一條染色體Chr0 is a virtual chromosome圖1 LjPIN基因的染色體定位分布Fig.1 Location map of LjPIN in chromosome

圖2 LjPIN的基因結構和系統發育關系Fig.2 Gene structure and phylogenetic relationship of LjPIN
為了研究百脈根PIN基因與其他植物的親緣關系,對植物PIN蛋白家族進化進行探討。利用PIN基因研究較多的擬南芥、水稻和大豆3種植物與百脈根共78個PIN蛋白序列構建系統進化樹(圖3)。分析發現,百脈根LjPIN蛋白與擬南芥AtPIN、大豆GmPIN的進化關系較接近,而與水稻OsPIN的進化關系較遠。其中16個LjPIN未能與其他物種的PIN聚類到一起,可能與物種分化后因不同選擇壓力導致的進化方向不同有關,可作為百脈根LjPIN基因鑒定的分子特征。

?表示未能與其他物種的PIN聚類到一起的16個LjPIN?means 16 LjPINs that failed to cluster with PINs from other species圖3 擬南芥、大豆、水稻和百脈根PIN蛋白的系統進化樹Fig.3 Phylogenetic tree of PIN proteins from Arabidopsis thaliana,soybean,rice and Lotus corniculatus
蛋白質序列特性分析(表2)表明,LjPIN蛋白序列長度在108~645個氨基酸,其中最長的是LjPIN20,長度為645個氨基酸,蛋白質分子質量為70.112 00 ku;最短的是LjPIN7.2,長度為108個氨基酸,分子質量為12.098 51 ku。35個PIN蛋白的理論等電點在5.33~9.94,除了LjPIN1、LjPIN2、LjPIN3、LjPIN5、LjPIN15、LjPIN16和LjPIN27為酸性蛋白質外,其他均為堿性蛋白質。不穩定系數比較發現,除了LjPIN8、LjPIN11、LjPIN12、LjPIN15、LjPIN16、LjPIN19.2、LjPIN21、LjPIN22和LjPIN26.2為不穩定蛋白質(不穩定系數>40)外,大部分PIN蛋白為穩定蛋白質。親水性指數分析得到,LjPIN1、LjPIN2、LjPIN5、LjPIN7.1、LjPIN8、LjPIN9、LjPIN14、LjPIN15、LjPIN16、LjPIN17、LjPIN18、LjPIN25、LjPIN27蛋白均為疏水蛋白質,其余LjPIN蛋白為兩性蛋白質,親水性介于-0.5~0.5(GRAVY為負值表示親水性,正值表示疏水性)。
蛋白質結構分析(表3)表明,LjPIN蛋白由α-螺旋、延伸鏈、β-轉角、無規卷曲4種二級結構元件組成,并以α-螺旋和無規卷曲2種元件為主。LjPIN1、LjPIN2.1、LjPIN2.2、LjPIN5、LjPIN7.1、LjPIN7.2、LjPIN8、LjPIN9、LjPIN13、LjPIN14、LjPIN15、LjPIN16、LjPIN17、LjPIN19.1、LjPIN19.2、LjPIN23、LjPIN25.1、LjPIN25.2、LjPIN27.1和LjPIN27.2等20個蛋白質中的α-螺旋占比高于無規卷曲,其他LjPIN蛋白中則是α-螺旋占比低于無規卷曲。

表2 LjPIN蛋白的基本特性Tab.2 Basic characteristics of LjPIN proteins

表3 LjPIN蛋白的二級結構 Tab.3 Secondary structure of LjPIN proteins

續表3 LjPIN蛋白的二級結構 Tab.3(Continued) Secondary structure of LjPIN proteins
保守基序分析(圖4—5)發現,35個LjPIN蛋白的保守基序數量介于2~9個,其中,LjPIN1的保守基序數量最少(2個),LjPIN20的保守基序數量最多(9個)。基序Motif6、Motif7、Motif9、Motif10和Motif13在LjPIN基因編碼的蛋白質中分布最廣,分別存在于15個LjPIN基因中,表明這些基序在LjPIN蛋白的進化上具有相對保守性。

氨基酸位置 Amino acid position圖4 LjPIN蛋白的Motif分布Fig.4 Motif distribution of LjPIN proteins

圖5 LjPIN蛋白的關鍵MotifFig.5 Key motif of LjPIN proteins
通過對PIN基因上游2 000 bp序列進行分析發現(圖6),LjPIN基因家族除了存在大量的順式作用基本元件CAAT-box和TATA-box外,還存在光合反應、激素調控和生長發育相關的3類順式作用元件,具體包括:(1)光響應調節元件G-Box;(2)生長素響應元件TGA-elemnt、茉莉酸甲酯(MeJA)反應元件TGACG-motif、水楊酸反應元件TCA-element、脫落酸反應元件ABRE和赤霉素反應相關元件(TATC-box、P-box和GARE-motif);(3)參與胚乳表達的調節元件GCN4-motif、參與分生組織表達的調控元件CAT-box、參與柵欄葉肉細胞分化的HD-Zip1元件。以上研究表明,LjPIN基因家族在百脈根中以激素調控為主,與植物生長發育過程密切相關,其可能通過對生長素與其他激素的共同調控作用實現對植物生長發育的調控。
對百脈根的根、莖、葉、花及不同形成時期種子(按授粉后天數計算)的芯片數據進行分析,結果如圖7所示。由圖7可以看出,27個PIN基因中僅有11個在9個樣本中出現組織差異表達(上調),其中,PIN2.1、PIN6.1、PIN8、PIN9、PIN15和PIN25.1在葉中高表達;PIN2.1、PIN6.1、PIN8、PIN9和PIN14在莖中高表達;PIN2.1和PIN8在花中高表達;PIN2.1、PIN6.1、PIN8、PIN10和PIN21在根中高表達;PIN2.1、PIN8和PIN18在授粉后10、12、14 d的種子中高表達,PIN2.1、PIN8、PIN18和PIN25.1在授粉后16、20 d的種子中均高表達。

圖6 LjPIN基因的順式作用元件位點組成Fig.6 The cis-acting element site of LjPIN genes

圖7 LjPIN基因的時空差異表達變化Fig.7 Expression of LjPIN genes in different tissues and seed maturation stages
PIN蛋白是調控植物生長素極性運輸的重要載體元件,參與調控植物生長發育。擬南芥和水稻等模式植物中的PIN基因研究得較為清楚,但在百脈根中尚未見報道,研究百脈根LjPIN基因對其功能鑒定和利用具有重要意義。本研究從百脈根基因組中共鑒定出了27個PIN基因,編碼35個PIN蛋白,高于擬南芥(8個)、水稻(12)和大豆(23個)中的PIN成員數量[10,18,21]。系統進化分析發現,LjPIN與擬南芥和大豆PIN基因家族的進化關系最為密切,LjPIN蛋白大多為堿性穩定蛋白質,這與其他植物中的相關報道一致[22-23]。百脈根LjPIN基因的順式作用元件中含有光響應、激素調控相關及生長發育響應元件,表明LjPIN的生物學活性較為廣泛;百脈根PIN基因中的激素調控元件除了生長素類之外,還包括茉莉酸甲酯、水楊酸、脫落酸、赤霉素等其他激素的響應元件,這表明LjPIN基因家族的功能涉及到多種激素調控,推測其在調控生長素的分布后,進而在局部與其他激素協作或拮抗,共同調控植物的生長發育。本研究發現,百脈根LjPIN基因由多種順式作用元件組成,這為植物體中生長素與其他植物激素通過交互響應調控植物生長發育[5]提供了重要依據。HE等[24]發現,棉花PIN基因家族中僅有2個PIN基因對棉花的主根、側根發育起關鍵作用。WANG等[18]發現,大豆PIN基因存在的表達類型、時間和空間差異性對每個組織的發育過程均至關重要,而來自不同組織的PIN基因協同表達,有助于大豆進化過程的靈活性及多變性。本研究中,在百脈根的根、莖、葉、花和不同發育階段的種子中,僅有11個LjPIN基因出現上調差異表達,表明LjPIN基因存在表達類型差異和時空表達特異性,這種差異可能與不同PIN基因對不同部位和不同時期的調控有關,百脈根LjPIN基因家族與上述棉花[24]和大豆[18]中PIN基因家族的表達類型差異和空間表達差異一致,而這種一致性是各種植物中該基因家族功能豐富和滿足特定發育部位和階段所必需的。綜上,百脈根中存在PIN基因家族,該家族基因具有典型的結構特征和特定的表達特性,對進一步研究百脈根LjPIN奠定了基礎,也為其他植物PIN基因家族的研究提供了參考信息。