吳勝男,楊 媛,李英壯,王 娜,謝彥周,簡俊濤,楊 輝,王成社
(1.西北農林科技大學 農學院,旱區(qū)作物逆境生物學國家重點實驗室,陜西楊凌 712100;2.南陽市農業(yè)科學院,河南南陽 473000)
鉀是植物必需的大量營養(yǎng)元素,占植物總干質量的2%~7%[1]。K+在維持細胞質的電荷平衡、細胞膨壓、關鍵酶促反應的激活、促進細胞延伸和滲透調節(jié)等多種生理活動中起至關重要的作用[2]。植物對K的吸收和運輸主要通過K+通道蛋白協(xié)助完成[3]。研究表明,在外界K+濃度較低的條件下,植物主要依靠高親和力K+轉運蛋白來獲取生長發(fā)育所需的K+[4]。前人在擬南芥和水稻中已經鑒定的K+轉運蛋白基因主要分為四大家族:KUP/HAK/KT、Trk/HKT、KEA及CHX[5]。KUP/HAK/KUP最早是于大腸桿菌中被鑒定發(fā)現的,是最大的K+轉運蛋白家族,為H+和K+同向轉運蛋白,被認為在維持植物生長發(fā)育和介導細胞內鉀的積累方面起著重要作用,一般具有10~14個跨膜結構域,在第2和第3跨膜區(qū)之間擁有一個較長的環(huán)形結構(p-loop)[6]。迄今為止,在擬南芥[7],水稻[8],玉米[9]、大豆[10],蘋果[11],毛果楊[12]中均有針對KUP/HAK/KT基因家族的系統(tǒng)報道,且多個物種中KUP/HAK/KT基因已被克隆。作為最大的鉀轉運蛋白家族,HAK/KUP/KT家族被分為4個組,即簇Ⅰ、簇Ⅱ、簇Ⅲ和簇Ⅳ[8]。
植物含有多種HAK/KUP/KT轉運蛋白,它們在鉀的吸收和轉運以及植物生長發(fā)育、耐鹽性和滲透勢調節(jié)中發(fā)揮著不同的作用。擬南芥和水稻中鉀轉運突變體的存在,使人們更好地理解了它們在鉀吸收和轉運中的作用。如OsAKT1、AtHAK5、OsAKT5和ThHAK5在低K條件下,能顯著提升酵母和大腸桿菌對K的吸收[13-15]。擬南芥中AtHAK5、AtHAK6、AtHAK2、AtKUP4和AtKUP11可以響應鹽脅迫[16];過表達水稻OsHAK5的煙草可顯著提高K+從根部轉運到地上部的能力,從而增加其對鹽脅迫的耐受性;蘆葦PhaHAK2在耐鹽材料中轉錄本顯著增加[17]。生長激素可以通過調節(jié)OsHAK5的K+/H+協(xié)同轉運活性從而促進植物體對K+的吸收;AtKUP4可參與形成擬南芥根毛,TRH1/KUP4是植物適應環(huán)境中根毛發(fā)育及生長素途徑的交叉點[18]。水稻OsHAK1、OsHAK19和OsHAK20可通過HAK/KUP/KT轉運蛋白介導花粉管生長所需要的K+穩(wěn)定態(tài)[19]。因此鑒定和克隆植物KUP/HAK/KT基因,在提高植物對K+的吸收和轉運方面,以及響應逆境脅迫具有很大的潛力。
小麥作為世界上最重要的糧食作物,因其是異源六倍體,以及基因組巨大而復雜(約17 Gb),且首個六倍體小麥基因組圖譜于2018年完成[20],這限制了對小麥KUP/HAK/KT基因的深入研究。因此本試驗用篩選到的小麥、水稻、擬南芥、二穗短柄草、大麥、高粱和玉米KUP/HAK/KT基因構建系統(tǒng)發(fā)育進化樹,并進一步分析了保守結構域、基因結構、染色體分布、基因復制、GO功能注釋以及表達模式,以期為后續(xù)小麥KUP/HAK/KT基因的功能機制和改良小麥性狀奠定基礎。
從Ensembl Plants 數據庫(http://plants.ensembl.org/index.thml)中下載小麥的蛋白序列數據、基因組序列和注釋文件,并建立本地數據庫,使用擬南芥的KUP/HAK/KT蛋白質序列進行BLASTP搜索,篩選閾值設為E 為了解KUP/HAK/KT基因在禾本科間的進化關系,從TRAI網站(https://www.arabidopsis.org/)下載擬南芥KUP/HAK/KT蛋白序列、MSU數據庫(http://rice.plantbiology.msu.edu/)下載水稻KUP/HAK/KT白序列,Ensembl plants(http://plants.ensembl.org/index.html)下載二穗短柄草、大麥、高粱和玉米的KUP/HAK/KT蛋白序列,并根據是否含有保守結構域對其進行鑒定,含有保守結構域的KUP/HAK/KT蛋白被保留下來作進一步分析。基于MAFFT軟件進行多重序列比對[22],利用RAxML軟件,PROTGAMMAJTT模型構建禾本科KUP/HAK/KT系統(tǒng)發(fā)育進化樹[23]。使用MEME服務器(http://meme-suit/org/)搜索小麥KUP/HAK/KT蛋白序列中的保守基序(motifs)。根據KUP/HAK/KT基因的cDNA、CDS和全長序列,通過在線軟件GSDS2.0(http://gsds.cbi.pku.cn/)對基因的外顯子/內含子結構進行可視化分析。 利用blastp搜索到的小麥KUP/HAK/KT的蛋白質序列提交的eggNOG-mapper數據庫(http://eggnog-mapper.embl.de/)[24]進行GO注釋分析,使用BGIWEGO進行可視化[25],對KUP/HAK/KT基因進行功能注釋。 從Ensembl Plants 數據庫獲得小麥KUP/HAK/KT基因在染色體上的位置信息。利用Circos v0.67工具進行可視化小麥KUP/HAK/KT基因的復制事件[26]。使用KaKs calculator軟件計算Ka/Ks比值及進化年限[27]。 從NCBI-SRA(http://www.ncbi.nlm.nig.gov/sra/)數據庫獲得了干旱脅迫(SRR10990683-SRR10990700),熱脅迫(SRR6128107-SRR6128115)和DDT脅迫(SRR8745812-SRR8745820)的轉錄組數據。使用hisat2和featurecount軟件進行轉錄組分析,計算KUP/HAK/KT基因在不同脅迫下的TPM表達量,利用R語言繪制小麥KUP/HAK/KT基因的表達量熱圖。 為了從小麥全基因組中篩選并鑒定編碼小麥KUP/HAK/KT基因,通過HMM模型和Blast程序搜索小麥基因組和蛋白組數據庫。去除冗余后共鑒定到98條編碼完整KUP/HAK/KT結構域的小麥KUP/HAK/KT基因,根據其染色體位置和系統(tǒng)進化關系進行命名。小麥KUP/HAK/KT蛋白質存在較大差異(表1),蛋白質長度為93~1 172 aa,分子質量為10 518~ 130 495.3 u,其中TaHAKⅢA-7A-1含有最短的氨基酸序列為93 aa,TaHAKⅠA-5D-3含有最長的氨基酸序列為1 172 aa,小麥KUP/HAK/KT蛋白質的等電點為4.18~9.44,平均值為8.03。進一步亞細胞定位發(fā)現,98個KUP/HAK/KT基因全部定位到質膜上。 表1 小麥KUP/HAK/KT基因家族基因的特征Table 1 Characteristic features of KUP/HAK/KT gene family in wheat (續(xù)表1 Continued table 1) (續(xù)表1 Continued table 1) 大量研究表明植物KUP/HAK/KT家族是個多基因家族,本研究通過在TRAI網站(https://www.arabidopsis.org/)下載擬南芥KUP/HAK/KT蛋白序列、MSU數據庫(http://rice.plantbiology.msu.edu/)下載水稻KUP/HAK/KT蛋白序列,Ensembl plants(http://plants.ensembl.org/index.html)下載二穗短柄草、大麥、高粱和玉米KUP/HAK/KT蛋白序列,并根據是否含有保守結構域對其進行鑒定,含有保守結構域的KUP/HAK/KT蛋白被保留下來做進一步分析。本研究共鑒定到284個KUP/HAK/KT基因(表2),其中分別在擬南芥、二穗短柄草、大麥、水稻、高粱和玉米基因組發(fā)現了14、29、35、33、32和42個。其中擬南芥KUP/HAK/KT基因數目最少,小麥中KUP/HAK/KT基因數目最多,其他5種禾本科作物中KUP/HAK/KT基因數目相差不大。 表2 擬南芥和6種禾本科植物基因組鑒定出的KUP/HAK/KT基因數量Table 2 Number of each class of KUP/HAK/KT genes identified in Arabidopsis thaliana and six grass species 為進一步分析小麥KUP/HAK/KT基因家族與禾本科作物的進化關系,將搜索到的擬南芥和6種禾本科植物共283個KUP/HAK/KT基因進行多序列比對,構建擬南芥和6種禾本科植物的系統(tǒng)發(fā)育進化樹。結果(圖1)發(fā)現KUP/HAK/KT家族基因大致可以分為4個進化簇,將禾本科KUP/HAK/KT基因的4個進化簇分別命名為ClusterⅠ、ClusterⅡ、ClusterⅢ、ClusterⅣ,又進一步分為ⅠA、ⅠB、ⅡA、ⅡB、ⅢA、ⅢB、ⅣA和ⅣB 8個亞類。其中ClusterⅠ的成員數目最多(103),Ⅳ亞家族成員數目最少(35)。可以看出除擬南芥外的6種禾本科植物均包含ClusterⅠ-Ⅳ,且均呈現出ClusterⅠ和ClusterⅡ的成員數目遠多于ClusterⅢ和ClusterⅣ。在每一個亞組中,如果同一物種中含有多個KUP/HAK/KT基因則可能發(fā)生了基因復制,而某個物種在某個亞組缺乏代表成員則可能發(fā)生基因的丟失事件。通過禾本科系統(tǒng)發(fā)育進化樹筆者發(fā)現,在一些亞組中,同一物種的KUP/HAK/KT基因成對存在,如在ⅡA亞組中,各包含4個二穗短柄草、大麥、水稻和玉米的KUP/HAK/KT基因。各個亞組中均沒有缺失某一物種的代表成員。因此認為每個亞組由一個祖先KUP/HAK/KT基因經過復制以及物種分化而來,這對后續(xù)判斷KUP/HAK/KT基因家族在禾本科植物中的進化和起源具有指導意義。 基因的結構決定基因的表達和功能,小麥KUP/HAK/KT家族中基因結構差異較大,其中最長的KUP/HAK/KT基因為TaHAKⅡB-4D,最短的KUP/HAK/KT基因為TaHAKⅢA-7A-1,且所有TaHAKs的編碼序列均包括內含子和外顯子,外顯子數目為3~14,其中結構最簡單的基因是TaHAKⅢA-7A-1,僅有2個外顯子,推測其功能具有高度保守性;TaHAKⅠA-5A-3、TaHAKⅠA-5B-3和TaHAKⅠA-5D-3的結構最為復雜,含有14個外顯子。系統(tǒng)發(fā)育進化樹表明,ClusterⅡ和ClusterⅢ亞組內部成員基因結構差異較小,ClusterⅠ亞族內部成員之間差異顯著。 對小麥KUP/HAK/KT的保守基序統(tǒng)計分析如圖2所示,共識別到10個motif(保守基序),并依次命名為motif1到motif10。其中motif2和motif3最為保守,在所有小麥KUP/HAK/KT基因中均被鑒定到。進一步分析發(fā)現,所有的ClusterⅠKUP/HAK/KT基因都含有motif1、motif2、motif3、motif5、motif7、motif8和motif9,ClusterⅡ均含有motif1、motif2、motif3、motif4、motif5、motif6、motif7、motif8和motif9,ClusterⅢ均含有motif2、motif3和motif9,而ClusterⅣ均含有motif2、motif3和motif10,表明同一進化簇成員間具有相似的保守結構域組成,而不同簇具有各自特異的保守結構域,這可能與其具體的生物學功能相關。 為了更好地了解小麥KUP/HAK/KT基因的功能,將所有的小麥KUP/HAK/KT基因進行基因本體論(Gene ontology)。如圖3所示,在細胞成分中,超過60%的KUP/HAK/KT蛋白參與細胞膜組成,少于10%的KUP/HAK/KT蛋白參與質膜、細胞構成和細胞內組分。在分子功能方面,超過80%的KUP/HAK/KT蛋白具有跨膜轉運蛋白活性,少于20%的KUP/HAK/KT蛋白能夠參與環(huán)狀化合物和雜環(huán)化合物的合成。對小麥KUP/HAK/KT蛋白參與的生物進程分析發(fā)現,超過80%的KUP/HAK/KT蛋白參與細胞的鉀離子轉運功能,另有少于20%的KUP/HAK/KT蛋白在小麥受到非生物刺激和逆境脅迫下起到調控的作用。通過上述結果,推測小麥KUP/HAK/KT蛋白主要功能是參與細胞膜的組成、具有跨膜轉運蛋白活性以及細胞中鉀離子轉運功能。 利用小麥基因組注釋信息,對98個小麥KUP/HAK/KT基因進行染色體定位。結果表明(圖4),98個KUP/HAK/KT基因均可以定位到小麥21條不同染色體上,每條染色體上有 2~9個小麥KUP/HAK/KT基因。在小麥A、B和D 3個同源染色體組中,分別含有33、32和33個KUP/HAK/KT基因,說明在小麥進化過程中,不同基因組中同源染色體的丟失和保留沒有明顯的偏好現象。 基因復制是自然界普遍存在的生物現象,基因復制及功能分化是基因組進化最重要的驅動力之一,也是物種產生新功能基因的主要源泉。其中,基因復制包括串聯復制和并聯復制。利用MSCcanX軟件對小麥全基因組產生的基因復制事件進行分析,結果發(fā)現(圖4)共產生95對并聯復制事件和8對串聯復制事件。其中串聯復制發(fā)生在2A、2B、2D、3A、3D、5A、5B和5D染色體上;并聯復制中有79個KUP/HAK/KT基因,構成了27個同源基因組,每組均由A、B和D染色體組上的3個同源基因組成。從同源關系來看,2B染色體上的TaHAKⅡB-2B與4A染色體上的TaHAKⅡB-4BA、4B染色體上的TaHAKⅡB-4B、4D染色體上的TaHAKⅡB-4D和2D染色體上的TaHAKⅡB-2D基因具有同源性,推測這4個基因可能是由TaHAKⅡB-2B復制而來。而7A染色體上的TaHAKⅣA-7A-2和3A染色體上的TaHAKⅠB-3A僅與7D染色體上的TaHAKⅣA-7D-2和3B染色體上的TaHAKⅠB-3B具有同源性,說明這兩個基因在B基因組和D基因組沒有拷貝。 在生物進化過程中,非同義突變指可導致多肽產物的氨基酸序列改變的基因突變,同義突變指基因的突變不導致氨基酸序列的改變。常用的參數有以下3種:非同義突變頻率(Ka)、同義突變頻率(Ks)、非同義突變頻率與同義突變頻率的比值(Ka/Ks)。當Ka/Ks <1,則認為受到純化選擇;Ka/Ks>1,則認為受到正向選擇作用;當Ka/Ks=1,則認為受到中性選擇。為了進一步研究這些復制基因對受到何種選擇,對其Ks、Ka以及Ka/Ks比值的計算。結果發(fā)現所有小麥KUP/HAK/KT基因Ka/Ks<1,表明在基因擴張過程中經歷了強烈的純化選擇。預計串聯重復發(fā)生在0.24 Mya,并聯復制發(fā)生在0.084 Mya。上述結果表明,串聯復制可能在基因分化記憶進化過程中起到更重要的作用。 為探究小麥KUP/HAK/KT基因在逆境脅迫下的生物學功能,本研究利用NCBI-SRA數據庫下載了熱脅迫、DDT(二硫蘇糖醇)脅迫以及3個小麥品種(‘周麥22’‘百農207’‘百農607’)在水淹脅迫下的數據,分析了小麥KUP/HAK/KT基因在熱、水淹和DDT脅迫下的表達情況。如圖5所示,在DDT(二硫蘇糖醇)和DOUCA(牛磺熊去氧膽酸)處理下,共有79個TaHAKs基因在至少一種處理下表現出差異表達。在DDT處理下,46個基因的表達量顯著升高,23個基因的表達量顯著降低,10個基因表達量無明顯變化;在DDT+DOUCA處理下,22個基因的表達量顯著升高,23個基因的表達量顯著降低,34個無明顯變化。值得注意的是TaHAKⅠA-5A-1、TaHAKⅠA-5B-1和TaHAKⅠA-5D-1基因在DDT和DDT+DOUCA處理下表達量均顯著升高,暗示著3個基因在小麥DDT脅迫響應中扮演重要的角色。在熱脅迫條件下,共有78個TaHAKs基因表現出差異表達(圖5)。其中16個基因的表達量隨著熱處理的程度增加持續(xù)下降;10個基因的表達量隨著熱處理程度的增加持續(xù)升高;10個基因在輕度熱處理時表達量無明顯變化,在重度熱處理時表達量顯著升高;27個基因在輕度熱處理時表達量顯著升高,而在重度熱處理時表達量降低。說明大多數TaHAKs基因都可以響應小麥的熱脅迫。 通過分析3個小麥品種(‘周麥22’‘百農207’‘百農607’)在水淹處理下的轉錄組數據,共有95個TaHAKs基因至少在一個品種中表現出了差異表達(圖6)。‘周麥22’在水淹脅迫下,42個基因的表達量顯著升高,43個基因的表達量顯著降低;‘百農207’在水淹脅迫下,42個基因的表達量顯著升高,38個基因的表達量顯著降低;‘百農607’在水淹脅迫下,20個基因的表達量顯著升高,43個基因的表達量顯著降低。值得注意的是TaHAKⅠB-2A-2P、TaHAKⅢA-7A-1、TaHAKⅠB-4A、TaHAKⅠA-5D-2、TaHAKⅣB-7B-3、TaHAKⅢB-2B-1、TaHAKⅠB-4A和TaHAKⅠB-4D在3個品種中均呈現表達量升高,暗示這些基因可能在對應非生物脅迫的響應中起著重要的作用。 小麥是世界第一大糧食作物,鉀元素對小麥產量和品質都有較大影響。因此培育鉀高效小麥品種和提高小麥對土壤中鉀的吸收以及利用效率,對提高小麥產量和品質具有重要意義[28]。 本試驗通過比較基因組學、轉錄組學等生物信息學手段,對小麥KUP/HAK/KT基因家族進行鑒定,結果共鑒定到98個小麥KUP/HAK/KT基因,其數量上遠多于擬南芥(13)、水稻(33)、玉米(43)、大麥(35)和高粱(32),這可能是小麥是異源六倍體,在進化過程中經歷了3個二倍體祖先種的兩輪自然加倍,使得基因組也經歷了2次擴張,造成KUP/HAK/KT基因數目加倍。TaHAKs基因都定位在質膜上,這與前人對大豆KUP/HAK/KT研究結果一致[10],表明TaHAKs可能在質膜上行使鉀離子轉運的功能。與擬南芥、水稻、二穗短柄草、大麥、高粱和玉米進化分析、發(fā)現小麥和其他禾本科植物的KUP/HAK/KT蛋白進化關系很近,且禾本科植物中各個進化簇中均沒有缺失某一物種的代表成員。對其保守結構域和基因結構分析發(fā)現,幾乎所有的小麥TaHAKs基因都含有motif1-motif10,TaHAKs基因結構在不同亞族間差異很大,但同一亞組中編碼區(qū)結構類似,這一規(guī)律與大豆和葡萄KUP/HAK/KT家族中的類似。GO注釋結果也表明,TaHAKs基因廣泛地參與了細胞組成、分子功能及生物進程3個生理過程。 KUP/HAK/KT鉀離子轉運蛋白家族成員首次在細菌中發(fā)現[29]。該家族并非存在于所有生物中,它存在于植物、真菌和細菌中,但并不存在于原核生物和動物中[30-34]。前人研究表明,KUP/HAK/KT基因參與K+吸收、轉運、耐鹽性、滲透調節(jié)、響應植物激素以及非生物脅迫的響應[35-36]。在大豆中的研究發(fā)現,KUP/HAK/KT在不同組織中的表達水平也有差異[10]。擬南芥在干旱脅迫下,ABA可使KUP6表達量上調,KUP6及其同系物KUP2和KUP8的失活會影響,ABA所介導的氣孔關閉以及植物對干旱脅迫的響應[37]。而沉默OsHAK5基因的株系在正常供K+的條件下,鉀離子吸收和轉運受阻。前人研究大多數是從組織特異性,干旱脅迫和低鹽脅迫等來研究KUP/HAK/KT基因的表達模式。本研究則從DDT脅迫、水淹脅迫和熱脅迫對該基因家族的表達特異性進行分析,為進一步研究KUP/HAK/KT基因在逆境過程中的功能奠定基礎。結果表明在DDT脅迫下87%的TaHAKs基因表達量出現明顯改變,DDT可通過破壞蛋白折疊過程中二硫鍵形成所需要的氧化條件,導致內質網中某些蛋白錯誤折疊,而外源添加TUDCA可以促進蛋白質的正確折疊,其中TaHAKⅠA-5A-1、TaHAKⅠA-5B-1和TaHAKⅠA-5D-1基因在DDT和DDT+DOUCA處理下表達量均顯著升高,表明他們在響應內質網脅迫方面具有重要作用。在水淹脅迫下,至少有66%的TaHAKs基因在水淹脅迫下表達量明顯升高,如TaHAKⅠB-2A-2、TaHAKⅢA-7A-1、TaHAKⅠB-4A、TaHAKⅠA-5D-2、TaHAKⅣB-7B-3、TaHAKⅢB-2B-1、TaHAKⅠB-4A和TaHAKⅠB-4D在3個品種的水淹脅迫下均呈現表達量上調,暗示這些基因可能在水淹脅迫響應方面發(fā)揮作用。1.2 系統(tǒng)發(fā)育樹的構建、基因結構、保守結構域序列分析
1.3 小麥KUP/HAK/KT基因本體論(GO)注釋分析
1.4 染色體定位和基因復制事件分析
1.5 表達模式分析
2 結果與分析
2.1 小麥KUP/HAK/KT基因家族成員的鑒定



2.2 系統(tǒng)發(fā)育樹的構建、蛋白質保守結構域和基因結構分析

2.3 GO注釋分析
2.4 染色體定位及基因復制分析
2.5 表達模式分析
3 討 論