陳慶山,郭淼鑫,辛大偉,王錦輝,滕 達,張天馳,李文欣
(東北農業大學農學院,哈爾濱 150030)
大豆是食用和經濟價值均較高的作物,其豐富的蛋白質和油分為人類提供多種營養物質。我國大豆主產區分布在一些生長環境相對惡劣的地區,對大豆產量和品質均產生非常嚴重的影響,尤其影響其光合及蒸騰作用[1],因此,提高大豆對非生物脅迫耐受能力,是目前大豆育種至關重要工作。熱激蛋白(Heat shock proteins,Hsps)是一種廣泛分布于動植物以及真菌中的蛋白質家族[2]。遇到高溫等非生物脅迫時,熱激蛋白大量表達并積累,參與應激應答反應,進而維持細胞穩態。Hsps 按分子質量高低分為不同家族,包括Hsp60、Hsp70/Hsp80、Hsp90、Hsp110 及小分子質量Hsp(smHSP)等[3]。其中,Hsp90s 具有高度保守特性,氨基酸序列比對結果顯示,動物和酵母中Hsp90s同源性達63%~71%;而不同植物中Hsp90s同源性甚至高達88%~93%[4]。在ATP調節作用下,Hsp90s輔助參與信號轉導蛋白質折疊、聚集以及運輸,是一種非常重要的分子伴侶[5]。Hsp90s在正常狀態下為組成性表達,但在非生物脅迫下(主要是高溫脅迫),其表達進一步增加至幾倍之多[6]。
目前研究結果表明,擬南芥在受高溫、高鹽或重金屬脅迫時,Hsp90 表達量大量增加[7]。擬南芥中共有7 個Hsp90,其中AtHsp90-l、AtHsp90-2、AtHsp90-3 和AtHsp90-4 在細胞質中被定位到,AtHsp90-5、AtHsp90-6 和AtHsp90-7 分別在葉綠體、線粒體和內質網中被定位到。Hsp90s 在植物不同發育時期對種子萌發及胚發育起不同的調節作用,其中Hsp90s 各成員地位和作用也有所區別[8]。Liu等過表達擬南芥細胞質中AtHsp90,發現植物細胞氧化損傷被加劇,對氧化應激耐受性也因此下降[9]。Sangster 等對擬南芥Hsp90s 抑制處理,發現擬南芥表型結構改變,影響總結實率、開花時間等生長過程中多種數量性狀,增加植物形態多樣性[10]。除擬南芥,在水稻、油菜、煙草等作物中,Hsp90s 重要性也逐漸被發現。水稻在受低溫、高鹽、干旱及ABA 誘導后Hsp90 表達量短時間內大量增加[11];油菜中Hsp90受低溫非生物脅迫后也大量積累[12];煙草中,Song 等分別選擇高溫、低溫、NaCl、PEG、ABA 誘導煙草后,分析Hsp90s 表達模式發現,Hsp90s 對高溫脅迫反應最為強烈[13];另外,葡萄、番茄和香蕉等作物中,熱脅迫條件下Hsp90s 響應已被鑒定,并參與調節生物體耐熱性[14]。
近年來,人們發現動物和酵母細胞中部分互作蛋白,主要采用方法包括串聯親和層析、免疫共沉淀以及酵母雙雜交,研究發現該方法在植物中同樣可行。Willmund 和Schroda 用免疫共沉淀方法在衣藻葉綠體中發現與Hsp90 相互作用蛋白Hsp70B,這為Hsp90s 功能及機制研究奠定基礎[15]。Hsp90 家族相關基因近年來也不斷在各植物中被挖掘出來,促進Hsp90 家族研究進展。Huang等利用來源于轉基因大豆中GmHsp90A2 過表達穩定系以及CRISPR/Cas9 系統產生的突變系研究證實,過表達GmHsp90A2 的T3 轉基因大豆植株表現出更高耐熱性,原因是其葉綠素含量提高,同時丙二醛(Malondialdehyde,MDA)含量下降;相反,T2 純合敲除GmHsp90A2 突變體導致耐熱性下降,是由于葉綠素含量降低,MDA 含量增加[16]。在擬南芥中,也有類似試驗發現AtHsp90-1 敲除導致突變體植株耐熱性下調[17]。但也有研究表明,過表達Hsp90也降低植物耐熱性。在擬南芥中,AtHsp90.3過表達降低植物熱耐受性[18],這可能是因為Hsp90過量表達誘導Hsf下調,也可能是因為植物耐熱機理受多個基因協調調控,不受單個Hsp90 基因影響。
綜上所述,Hsp90 基因與其他熱激蛋白基因家族協同作用,使植物細胞適應高溫等非生物脅迫,維持細胞內環境穩定。Hsp90 基因也在生物體各階段、各部位發揮不可取代作用。目前關于Hsp90研究越來越廣泛,而大豆Hsp90 基因家族研究較少,本文通過生物信息學鑒定及分析大豆Hsp90基因家族,研究結果對深入了解Hsp90家族功能以及對豆科植物遺傳改良均具有重要意義。
使用3 種方法獲取Hsp90 家族蛋白,再通過3 種方法將獲得蛋白序列進一步篩選獲得候選Hsp90 家族蛋白序列。首先在大豆Soybase 數據庫(https://www.soybase.org/)搜索關鍵詞“Hsp90”獲取相關蛋白信息并保存為文本1;其次,從數據庫下載Wm82.a4 蛋白組序列數據庫,在Pfam 庫(http://pfam.xfam.org/)下載Hsp90 家族蛋白保守結構域隱馬爾可夫模型(HMM),利用HMMER 3.0_WIN?DOWS 軟件以隱馬爾可夫模型(Hsp90)為模板在大豆Wm82.a4 蛋白組序列數據庫中搜索比對大豆Hsp90 蛋白名稱保存為文本2;最后,通過擬南芥已知Hsp90蛋白(AT2G04030)為探針,通過在大豆Soybase 數據庫(https://www.soybase.org/)Blast 比對獲取E-value<1×10-5大豆Hsp90蛋白保存為文本3。
進一步篩選獲得3個Hsp90家族蛋白文本,首先通過將3個文本去重后取交叉蛋白信息保存為文本4,然后將文本4蛋白序列通過在線MEME(http://meme-suite.org/tools/meme)分析蛋白功能域(Motif),通過TBtool v1.0692 軟件將蛋白質功能域(Motif)作可視化對比,對蛋白質功能域(Motif)存在差異明顯的氨基酸序列通過在線NCBI-CD(https://www.nc?bi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)預測蛋白質保守域,去除功能域不完整蛋白,最終確定候選大豆Hsp90家族蛋白編碼基因。
利用植物基因組數據庫Phytozeme(https://phy?tozome.jgi.doe.gov/pz/portal.html)和蛋白質預測Prot?Param(https://web.expasy.org/protparam/)在線網頁搜索候選大豆Hsp90 家族基因(所在染色體、編碼長度、CDS 和外顯子數)和預測蛋白質(氨基酸長度、分子質量和等電點)基本信息。
利用植物基因組數據庫Phytozeme(https://phy?tozome.jgi.doe.gov/pz/portal. html)獲 取 候 選 大 豆Hsp90 家族基因染色體位置與所對應染色體信息,通過Mapchart 2.32軟件繪制染色體圖譜。
利用DNAMAN 軟件對13 個大豆Hsp90 家族基因氨基酸比對分析,并構建大豆Hsp90 家族基因進化樹;利用在線MEME(http://meme-suite.org/tools/meme)分析13 個大豆Hsp90 家族基因蛋白基序(Motif),通過TBtool v1.0692 軟件將蛋白質基序(Motif)作可視化對比。利用網頁在線工具CDsearch(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)分析13個大豆Hsp90家族蛋白保守結構域(Domain)。利用Softberry 網頁在線工具(http://linux1.softberry.com/berry.phtml? topic=protcomppl&group=programs&subgroup=proloc)預測13 個大豆Hsp90家族蛋白亞細胞定位。
在植物基因組數據庫Phytozome(https://phyto?zome.jgi.doe.gov/pz/portal.html)下載擬南芥Araport11和水稻v7_JGI 參考蛋白組序列,利用HMMER 3.0_WINDOWS 軟件以隱馬爾可夫模型(Hsp90)為模板提取擬南芥和水稻Hsp90 家族基因名稱信息,通過TBtool v1.0692 軟件提取其基因氨基酸序列,將大豆、擬南芥和水稻Hsp90 氨基酸序列放入MEGA7.0軟件比對并構建進化樹。
本研究通過關鍵詞(Hsp90)從大豆蛋白質組搜索到35 個相關基因,通過對已知擬南芥功能基因(AT2G04030)氨基酸序列對大豆蛋白組BLAST 搜索到22 個相關基因,通過Hsp90 隱馬爾可夫模型(HMM)在大豆蛋白組搜索到12個相關基因。研究發現隱馬爾可夫模型具有結構保守穩定的特點,搜索到的基因均存在于前面兩種結果中。對獲取的所有基因進一步篩選,首先選取兩種方法以上搜索到基因共21 個,分析其蛋白保守基序(Mo?tif),發現有8 個蛋白保守基序存在明顯缺失,預測該21 個基因蛋白質結構域發現,8 個基因均與Hsp90 蛋白合成相關,為非編碼Hsp90 蛋白基因,最終保留13 個Hsp90 家族基因。13 個大豆Hsp90家族基因分別位于8 條染色體,序列長度2 538~9 131 bp,編碼序列長度1 968~2 533 bp,外顯子數為2~19 個,編碼蛋白質氨基酸個數為655~847,其分子質量為75.88~97.07 ku,等電點為4.84~6.28,大豆Hsp90家族蛋白酸性(見表1)。
13 個大豆Hsp90 家族基因分別位于8 條染色體。1號染色體和18號染色體各有1個基因,均位于染色體前端;9、16 和17 號染色體各有1 個基因,均位于染色體尾端;2 號染色體有3 個基因,染色體尾端2 個基因非常接近;8 號染色體有2 個基因,分別位于染色體兩端;14號染色體存在3個基因,染色體前端2個基因非常接近。
利用DNAMAN 軟件對13 個大豆Hsp90 家族基因氨基酸多序列比對發現相似度高達62%,說明大豆Hsp90家族在進化上高度保守(見圖2)。預測大豆Hsp90 家族基因含10 個保守基序,除GmH?sp90-5 缺失保守基序Motif 6 外,13 個大豆Hsp90家族蛋白保守基序在組成和順序上保持高度一致(見圖3)。對13個大豆Hsp90家族蛋白功能域預測發現,根據匹配值最高的家族主要分為3 大類(A、B、C)(見圖4A),A 類為PTZOO272 超大家族,B類為Hsp90 超大家族和PRK05218 超大家族。再進一步細化功能發現13 個大豆Hsp90 家族蛋白均含有Hsp90(pfam00183)結構域,且除GmHsp90-5,其余12 個大豆Hsp90 家族蛋白均含有HATPase_c(pfam02518)結構域(見圖4B)。總之,大豆Hsp90家族基因保守結構域一致性較高,主要匹配到家族及結構域一致。

圖1 大豆Hsp90家族基因染色體位置Fig.1 Location of Hsp90 family genes on chromosomes

圖2 大豆Hsp90家族基因氨基酸多序列比對Fig.2 Amino acid multiple sequence alignment of the Hsp90 family genes of soybean

圖3 大豆Hsp90家族基因蛋白保守基序預測Fig.3 Motif prediction of Hsp90 family genes in soybean

圖4 大豆Hsp90家族基因蛋白功能域預測Fig.4 Functional domain prediction of Hsp90 family genes in soybean
結合大豆Hsp90家族基因進化樹分析和蛋白質功能與預測認為主要分為3 大類(A、B、C)5 小類(a、b、c、d、e),其中歸類到A 類主要有GmH?sp90-3、GmHsp90-9、GmHsp90-5、GmHsp90-6、GmHsp90-13、GmHsp90-7和GmHsp90-11;歸類到B 類主要有GmHsp90-10 和GmHsp90-12;歸類到C 類主要有GmHsp90-1、GmHsp90-2、GmH?sp90-4 和GmHsp90-8。進一步分析Hsp90 家族蛋白功能域發現A類最為穩定,雖然進化關系上分為a、b 兩個小類,但除GmHsp90-5 匹配到HATPase_superfamily 不完整,可能是前端缺少Mo?tif6 功能元件,A 類其余基因均匹配到多個相似功能域。B類、C類在分支上出現蛋白質功能域變化,主要分為3 個小類(c、d、e),c 類均匹配到特有top6b和mut1功能域,d類均匹配到特有COG1389功能域,d類匹配到特有COG1389功能域。
利用HMMER 3.0_WINDOWS 軟件共鑒定出Hsp90家族基因擬南芥7個、水稻11個,進化樹分析結果表明,可將擬南芥和水稻Hsp90家族基因歸類到大豆Hsp90 家族基因3 大類(A、B、C)和5 小類(a、b、c、d、e)中(見圖5)。大豆a類基因與擬南 芥AT2G04030.1、 AT5G56000.1、 AT5G56010.1,和 水 稻 LOC_Os09g30412.1、 LOC_Os09g30418.1、LOC_Os08g39140.2、LOC_Os08g39140.3、LOC_Os08g 39140.4、LOC_Os09g36420.1 相似度較高;大豆b類基因與水稻LOC_Os04g01740.1,和擬南芥AT5G52640.1 歸為一類;大豆c 類基因與大豆LOC_Os06g50300.1,和擬南芥AT4G24190.2同源性較高;大豆d類基因與大豆LOC_Os12g32986.1,和擬南芥AT3G07770.1 相似度較高;大豆e 類基因與擬南芥AT2G04030.1,和大豆LOC_Os08g38086.4、LOC_Os09g29840.1、LOC_Os09g29840.2高度同源。
由表2可知,大豆Hsp90主要被定位于內質網膜和細胞質體,但13個Hsp90家族蛋白定位結果不同,從定位結果明顯分為3種類型,這與進化關系中推測一致,差異主要出現在植物組織液泡和線粒體,A類被定位到液泡和線粒體中表達,B類兩者中均表達,C類僅在液泡中表達。內質網膜和細胞質體定位結果積分值均遠高于其他組織定位,可能大豆Hsp90 蛋白穩定存在于該位置表達。內質網膜上,積分值B類(大約6)高于C類(大約5),高于A類(大約3);細胞質體上,積分值A類(大約5)高于C類(大約4),高于B類(大約3)。GmHsp90-11在線粒體中明顯高于其他家族蛋白積分值。

圖5 大豆、擬南芥和水稻Hsp90家族基因進化樹Fig.5 Phylogenetic tree analysis of Hsp90 gene family in soybeans,Arabidopsis and rice

表2 大豆Hsp90家族蛋白亞細胞定位Table 2 Subcellular localization of Hsp90 family protein in soybeans
目前,關于大豆Hsp90 家族基因還未被研究。本研究共鑒定出13 個Hsp90 家族基因,其中通過隱馬爾可夫模型篩選的12 個Hsp90 家族基因穩定存在與其他兩種方法篩選結果中。研究認為隱馬爾可夫模型HMM 保守結構域鑒定家族蛋白可靠性達到95%[19],但還存在一定誤差,多種方法同時篩選目標基因家族,可更全面獲得家族基因。本研究通過多種方法,在隱馬爾可夫模型篩選出的12個結果外,又找到新的Hsp90 家族基因GmHsp90-5。這種多方法篩選基因家族被廣泛應用于多種植物不同家族基因篩選。
研究發現13 個大豆Hsp90 家族基因氨基酸序列高度相似,同源性為62%,其基因結構保守基序組成和順序一致,三級結構功能域均存在完整Hsp90結構域,具有高度保守性和穩定性特點。這與王靜等研究辣椒Hsp90 家族基因接近,除GmH?sp90-5 外,其余12 個大豆Hsp90 家族基因還包含完整的HATPase_c結構域[20]。杜志如研究認為該結構與ATP 結合,推測OsHsp90ATPase 結構域可能同時與CPS結合共同作用合成氨甲酰磷酸,與水稻抗性有關,因此GmHsp90-5 可能由于結構域缺失喪失該功能[21]。Hsp90家族具有高保守性,在酵母和動物研究中發現其同源性高于63%。在不同植物中甚至達到90%以上[2]。一般認為Hsp90 存在3個高度保守結構域,第一是約25kDaN 端結構域、35kDa 中間結構域和12kDaC 端結構域,而本試驗通過結構域預測,發現主要是兩個結構域,HATPase_c 結構域(pfam02518)和Hsp90 結構域(pfam00183),僅在N 端存在蛋白結構域區別,是本研究對大豆Hsp90家族基因分類主要依據。多個研究也證實HATPase 主要功能是共價連接N 端結構域和中間結構域,以維持Hsp90構象穩定[22],因此后續可通過挖掘大豆Hsp90家族基因HATPase_c結構域區別,具體闡明其參與的生化反應。
在大豆、擬南芥和水稻3個物種系統進化樹構建研究中發現,13個Hsp90家族基因可分為3大類(A、B、C),與辣椒、擬南芥、水稻相同,表明不同物種間Hsp90 家族成員在進化過程中也高度保守[23],蛋白組成結構相近、功能域相似被分到同一組,其進化關系近。目前擬南芥和水稻Hsp90家族基因研究較多,分析得到的系統進化樹,可通過擬南芥和水稻Hsp90基因預測同源關系相近的大豆Hsp90基因功能。在對亞細胞定位預測中也發現符合以上3大分類,大豆Hsp90家族蛋白主要被定位于內質網膜和細胞質體,這與不同植物物種間亞細胞定位結果一致[11]。表明不同物種Hsp90基因家族在進化過程中變異較少,且進化樹分類到同一大類蛋白質結構域相近,可能其在不同植物上功能表達存在相似性,還需進一步通過直接試驗證據驗證。