范 凱 潘鑫峰 毛志君 葉方婷 李兆偉 林偉偉 林文雄
叉柱棉基因家族的鑒定與特征分析
范 凱 潘鑫峰 毛志君 葉方婷 李兆偉 林偉偉 林文雄*
福建農林大學農學院作物遺傳育種與綜合利用教育部重點實驗室, 福建福州 350002
植物小分子熱激蛋白(small heat shock protein, sHSP)是植物熱激蛋白中一類分子量最小的基因家族, 該家族具有保守的α-晶體結構域, 在響應外界環境脅迫過程中具有重要的作用。叉柱棉()有關sHSP家族的鑒定與特征分析還未見相關報道。本研究在叉柱棉中共鑒定了39個GksHSP成員, 并且可以將GksHSP成員進一步分為10個亞家族。在GksHSP家族中發現了7個基因復制事件, 并且所有的基因復制事件都是片段復制事件。棉屬特有的全基因組復制事件主要導致了GksHSP成員的擴增, 其擴增還與蛋白激酶家族、線粒體載體蛋白家族以及植物生長素響應蛋白家族有關。此外, GksHSP家族可能與ABA和茉莉酸甲酯調控的脅迫響應相關, 并且GksHSP26成員及其在陸地棉中的同源基因可能在脅迫響應中具有關鍵的作用。本研究的結果可以進一步為今后叉柱棉和棉花的抗逆育種研究提供一定的理論基礎。
叉柱棉; sHSP; 鑒定; 擴增; 功能
在自然環境中, 植物會頻繁受到諸如干旱、鹽漬、高溫等脅迫的影響, 這些脅迫嚴重制約著植物的生長和發育過程, 進而影響植物的產量和品質。目前已經發現有許多基因家族可以響應外界的環境脅迫, 如WRKY家族[1]、PP2C家族[2]、NAC家族[3]等, 其中植物熱激蛋白(heat shock protein, HSP)是一類重要的響應外界環境脅迫的基因家族[4]。
植物熱激蛋白依據分子量的大小可以進一步分為HSP100家族、HSP90家族、HSP70家族、HSP60家族和HSP20家族, 其中HSP20家族是分子量最小的一類植物熱激蛋白[5]。HSP20成員的分子量集中在15~42 kD之間, 因此又稱為植物小分子熱激蛋白(small heat shock protein, sHSP)[5]。sHSP成員在C端具有長度大約為80~100個氨基酸組成的保守的α-晶體結構域, 該結構域主要由β-sandwich結構組成, 其N端具有相對多樣化的結構[6]。sHSP家族不僅存在于酵母、動物等中[7-8], 而且在擬南芥[9]、水稻[10]、番茄[11]、馬鈴薯[12]、棉花[13]、銀杏[14]、簸箕柳[15]等植物中也識別出許多成員。在植物中, sHSP家族主要以分子伴侶形式保護其他蛋白質免受多種脅迫的傷害, 已有大量的研究表明sHSP成員可以響應多種外界脅迫[6]。過表達水稻的sHSP成員可以提高水稻植株的抗鹽和抗旱能力[16]。過表達苜蓿的sHSP成員可以提高擬南芥植株的抗熱、抗旱以及抗氧化脅迫的能力[17]。過表達擬南芥的sHSP成員可以提高擬南芥植株的抗鹽和抗旱能力[18]。
叉柱棉()主要分布在莫桑比克、肯尼亞、坦桑尼亞以及南非等地區, 其可以產生棕色的纖維, 種子呈橢圓狀且無短絨毛。叉柱棉屬于錦葵科棉族叉柱棉屬, 是常見的重要經濟作物棉花的近緣物種, 是研究棉花進化趨勢的關鍵物種。叉柱棉常年生長在高溫地區, 對其高溫相關基因的研究有助于揭示其耐高溫調控機制并對棉花的耐高溫育種具有重要的意義。叉柱棉全基因組測序的完成為研究叉柱棉乃至棉花的耐高溫機制提供了便利的條件[19]。目前有關叉柱棉的研究主要集中在揭示其染色體數目(=12)比棉花染色體數目(=13)少一條的起因上[19-21], 而叉柱棉基因家族的研究還未見相關報道, 其相關的逆境脅迫研究還處于空白狀態。本研究主要對叉柱棉sHSP家族的鑒定、結構特征、系統發育關系、保守結構域、基因結構、染色體定位、基因復制事件、啟動子中的順式調控元件分布等方面進行綜合分析, 旨在全面解析叉柱棉sHSP家族的進化歷史, 為今后叉柱棉和棉花的抗逆育種研究提供一定的理論基礎。
從Cottongen (https://www.cottongen.org/)中下載叉柱棉的全基因組數據, 從TAIR (https://www. arabidopsis.org/)中提取擬南芥的sHSP成員, 從CottonFGD (https://cottonfgd.org/)中獲得陸地棉的全基因組數據以及表達譜數據。
從pfam數據庫中下載(http://pfam.xfam.org/) sHSP保守區域的隱馬爾可夫模型(PF00011), 并且使用HMMER 3.0程序獲得候選的叉柱棉sHSP成員(GksHSP)。候選的GksHSP成員進一步利用NCBI中的CDD程序(https://www.ncbi.nlm.nih.gov/cdd)確保每一個GksHSP成員均包含保守的PF00011結構域。
通過MEME程序(http://meme-suite.org/tools/meme)對叉柱棉sHSP家族的保守基序進行分析, 使用的參數與之前的研究相一致[22]。識別出的保守基序利用NCBI中的CDD程序(https://www.ncbi.nlm.nih.gov/cdd)進行注釋。使用TBtools軟件對GksHSP成員的染色體定位以及基因結構的結果進行可視化展示[23]。分別使用ProtParam網站(http://web.expasy.org/protparam/)和SOPMA網站(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html)計算GksHSP蛋白質的一級結構以及二級結構。
所有的sHSP成員通過MAFFT軟件進行序列聯配分析。本研究使用最大似然法利用IQ-tree軟件構建系統發育進化樹, 其中最合適的模型使用ModelFinder程序進行評估, bootstrap值設定為1000。進化樹使用MEGA軟件進行可視化展示。
GksHSP成員的基因復制事件主要通過MCScan (Python version)軟件進行識別, 每個復制框中至少包括5個基因復制事件, 其余均為默認參數, 并且用Circos軟件對基因復制關系進行可視化展示。此外, 通過MCScan (Python version)軟件對與GksHSP成員復制事件相關的微共線關系進行可視化分析, 利用NCBI中CDD程序(https://www.ncbi.nlm.nih. gov/cdd)對微共線關系內的基因進行注釋。另外, 使用TBtools軟件[23]計算非同義替換率(Ka)、同義替換率(Ks)以及它們的比例(Ka/Ks)。
從CottonGen網站中提取GksHSP成員啟動子區域2000 bp的序列, 通過PlantCARE數據庫(http://bioinformatics.psb.ugent.be/webtools/plantcare/html/)對其順式調控元件進行識別。通過TBtools軟件對GksHSP成員啟動子區的順式調控元件的分布圖進行可視化分析[23]。
本研究通過HMMER 3.0程序在叉柱棉基因組中共鑒定出39個叉柱棉sHSP成員(GksHSP), 并且每一個GksHSP成員均包含sHSP家族保守的PF00011結構域(表1)。依據其在染色體上的位置, 將鑒定出的GksHSP成員命名為~。
GksHSP成員編碼氨基酸的長度在93~327 aa之間, 其分子量介于10.5039~36.8318 kD之間。編碼長度最短(93 aa)和最小分子量(10.5039 kD)的氨基酸, 而編碼長度最長(327 aa)和最大分子量(36.83181 kD)的氨基酸。GksHSP成員理論pI為4.37~9.22, 最低的pI為4.37 (GksHSP11), GksHSP22有最高的pI (9.22)。所有的GksHSP成員均具有典型的4種蛋白質二級結構(α-螺旋、延伸鏈、β-折疊和無規則卷曲)。在蛋白質二級結構中, 除了GksHSP31和GksHSP18包含最高比例的α-螺旋結構外, 其余GksHSP成員包含最高比例的無規則卷曲結構, 而所有的GksHSP成員均包含最低比例的β-折疊結構。
本研究利用IQ-tree軟件對擬南芥和叉柱棉中sHSP成員進行系統發育分析(圖1)。使用ModelFinder模式計算發現, JTT+I+G4模型為構建該系統發育關系中最合適的氨基酸替換模型。按照之前對sHSP亞家族的分類標準[6], 本研究可以將GksHSP成員分為10個亞家族, 并且每個亞家族包含不同數目的GksHSP成員。CI亞家族有18個GksHSP成員, CII亞家族有5個GksHSP成員, CP亞家族有3個GksHSP成員, CIV亞家族、CV亞家族、ER亞家族、MTI/CP亞家族和PX亞家族分別有2個GksHSP成員, CIII亞家族和MTII亞家族分別有1個GksHSP成員, 另外還有1個GksHSP成員不屬于任何亞家族。
在GksHSP家族中, 通過MEME程序識別出20個潛在的保守基序(圖2)。利用CDD程序對這20個保守基序進行注釋發現, 只有3個基序(motif 1、motif 2和motif 3)注釋為sHSP保守結構域, 其他的基序暫時沒有發現任何注釋信息(表2)。基于這20個保守基序的分布, 可以進一步將GksHSP家族分成類似于系統發育研究中10個亞家族。motif 1、motif 2和motif 3存在于大部分的GksHSP成員中, 而其他的基序存在于特定的GksHSP亞家族。例如motif 9和motif 12只存在來自CII亞家族的GksHSP成員, motif 10和motif 18只存在來自CIV亞家族的GksHSP成員, motif 11和motif 19只存在來自CV亞家族的GksHSP成員。
本研究對GksHSP成員的基因結構進行分析, 根據外顯子和內含子的數量, 可以將GksHSP成員的基因結構分為4種不同的類型(圖2)。第1種類型包括24個GksHSP成員, 它們均只含有1個外顯子, 沒有內含子。第2種類型包括2個外顯子和1個內含子, 有12個GksHSP成員屬于這種類型。除此以外,包括3個外顯子和2個內含子,和包括4個外顯子和3個內含子。不同亞家族的基因結構具有一定的保守性, 如CII亞家族和ER亞家族的GksHSP成員只含有第1種類型的基因結構, CIV亞家族和MTII亞家族的GksHSP成員只含有第2種類型的基因結構。

表2 通過MEME程序識別有關GksHSP成員的基序信息

表3 叉柱棉中復制的sHSP成員的Ka和Ks分析
本研究鑒定的39個GksHSP成員定位在叉柱棉的11條染色體上, 但在叉柱棉的KI_01染色體上不存在任何GksHSP成員(圖3)。39個GksHSP成員并非平均分布在這11條染色體上。其中KI_05染色上包含最多的GksHSP成員(11個), 其次是KI_07染色體(6個)以及KI_12染色體(4個)。KI_06、KI_09和KI_10染色體上各包含3個GksHSP成員, KI_2_4、KI_03、KI_08和KI_13染色體上各包含2個GksHSP成員, 而KI_11染色體上僅包括1個GksHSP成員。另外, 一些GksHSP成員在叉柱棉的染色體上集中存在, 例如KI_05染色體的上半部和下半部以及KI_07染色體的下半部。
在叉柱棉中通過MCScan軟件共識別出7個與sHSP成員有關的基因復制事件(表3), 復制的GksHSP成員主要位于KI_05、KI_06、KI_07、KI_08以及KI_12染色體上(圖4-A)。鑒于相同復制事件中復制基因位于不同的染色體上, 所以在叉柱棉中所有的與sHSP成員有關的復制事件均為片段復制事件, 而不是串聯復制事件。在GksHSP家族中, 7個片段復制事件主要分布在CI亞家族、CII亞家族和CP亞家族中, 其中CII亞家族包含4個基因復制事件, CI亞家族包含2個基因復制事件, CP亞家族包含1個基因復制事件(圖4-B)。本研究對這些基因復制事件的Ks值分布進行計算發現, 大部分的基因復制事件的Ks值集中分布在0.731左右, 僅有1對復制基因(/)的Ks值為1.04 (圖4-C)。同時, 本研究對這些基因復制事件的Ka/Ks比值進行計算發現, 所有的基因復制事件的Ka/Ks比值均小于0.25。
在叉柱棉中, 7個基因復制事件主要與5個復制框(復制框1~復制框5)有關, 其中復制框1和2均包括2個基因復制事件, 另外3個復制框只包括1個基因復制事件(圖5-A~E)。隨后, 對這些復制框中的基因進行注釋發現, 復制框中的基因除了包含11個sHSP成員(PF00011)外, 還主要包含15個蛋白激酶成員(PF00069)、8個線粒體載體蛋白(PF00153)以及6個植物生長素響應蛋白(PF02519) (圖5-F)。其中復制框1主要包括6個線粒體載體蛋白、4個sHSP成員和4個蛋白激酶成員, 復制框2主要包括4個sHSP成員, 復制框3主要包括8個蛋白激酶成員和2個sHSP成員, 復制框4主要包括4個蛋白激酶成員、4個植物生長素響應蛋白和2個sHSP成員, 復制框5主要包括2個蛋白激酶成員、2個線粒體載體蛋白、2個sHSP成員和2個蛋白激酶成員。此外, 對這5個復制框的Ka值、Ks值和Ka/Ks比值進行計算發現, 這5個復制框的Ka值和Ka/Ks比值彼此相似, 但對于Ks值而言, 復制框1和復制框2的Ks值顯著低于復制框4的Ks值, 其他復制框的Ks值類似(圖5-G~I)。
A: 復制的成員分析, 與GksHSP家族有關的復制框使用不同的顏色在染色體上展示。B: 復制事件在不同亞家族的分布。C: 復制的同義替換率分布。
A: duplicated relationship ofmembers, the duplicated blocks were shown by the colors. B: the distribution of the duplication events in different subfamilies. C: the distribution of synonymous substation rate about duplicateds.
本研究利用PlantCARE數據庫對GksHSP成員啟動子區的順式調控元件進行分析發現, 所有的GksHSP成員除了包含真核生物共有的順式調控元件(如TATA框和CAAT框)外, 還包括一些與脅迫響應相關的順式調控元件(圖6)。所有的GksHSP成員均包含至少一種與脅迫響應相關的順式調控元件, 其中包含最多的與脅迫響應相關的順式調控元件(13個), 其次為(11個)、(10個)、(10個)和(10個)。在GksHSP家族中, 最多的與脅迫響應相關的順式調控元件為ABA響應元件(64個), 其次為茉莉酸甲酯響應元件(47個)、赤霉素響應元件(36個)、低溫響應元件(27個)、水楊酸響應元件(24個)、MYB結合位點(22個)和生長素響應元件(21個), 最少的與脅迫響應相關的順式調控元件為防御/脅迫響應元件(15個)。此外, 來自相同亞家族的GksHSP成員的啟動子區通常包含類似的順式調控元件。例如大部分CI亞家族的成員的啟動子區包含ABA響應元件和茉莉酸甲酯響應元件, 大部分CII亞家族的成員的啟動子區包含ABA響應元件, CP亞家族的成員的啟動子區均包含低溫響應元件。
A~E: 與GksHSP家族有關的復制框1 (A)、復制框2 (B)、復制框3 (C)、復制框4 (D)和復制框5 (E)的微共線分析。F: 與GksHSP家族有關的5個復制框的基因注釋分布。G~I: 與GksHSP家族有關的5個復制框的Ka(G)、Ks(H)和Ka/Ks(I)分析。*表示在< 0.05水平上差異顯著。
A–E: microsyntenic analysis of duplicated block 1 (A), duplicated block 2 (B), duplicated block 3 (C), duplicated block 4 (D), and duplicated block 5 (E). F: the distribution of gene annotation about the five duplicated blocks in the GkHSP family. G–I: Ka (G), Ks (H), and Ka/Ks (I) analysis of the five duplicated blocks in the GkHSP family. * represents significant difference at< 0.05.
本研究利用CottonFGD數據庫對啟動子中包含最多的與脅迫響應相關的順式調控元件的在陸地棉中的同源基因進行識別發現, 在陸地棉中和是叉柱棉的同源基因(相似度均大于94%) (圖7-A)。隨后在高溫、干旱和鹽脅迫條件下對和的表達量進行分析發現, 在高溫和鹽脅迫下和的表達量均顯著上調, 尤其是高溫處理6 h和鹽脅迫處理1 h其表達量達到最大值, 但對干旱脅迫響應并不明顯(圖7-B, C)。
GksHSP亞家族用不用的顏色和字母表示。每一個顏色的方框代表一種順式調控元件。
The GksHSP subfamilies were denoted by using different colors and letters. Each colored box represents a-regulatory element.
本研究從叉柱棉中識別出39個GksHSP成員(表1), 低于許多雙子葉植物中sHSP成員數量, 如番茄(43個)[11]、馬鈴薯(48個)[12]、棉花(94個)[13]以及小麥(109個)[24]等。叉柱棉中識別出較少的sHSP成員可能與該物種本身基因組(544 Mb)較小有關[19]。本研究識別的每一個GksHSP成員都具有sHSP家族保守的α-晶體結構域、分子量介于10.5039 kD到36.83181 kD之間、基因結構比較簡單(大部分外顯子數量少于2個)等特征(表1和圖2), 這些特征也出現在其他植物的sHSP成員中[5-6]。GksHSP家族通過系統發育分析可以進一步分為10個亞家族(圖1), 不同的亞家族含有不同數量的GksHSP成員, 其中CI亞家族和CII亞家族含有最多的GksHSP成員, CIII亞家族和MTII亞家族含有最少的GksHSP成員。在sHSP家族中, 相似的亞家族分布也出現在擬南芥[9]、水稻[10]、番茄[11]等植物中。在GksHSP家族中, 其保守基序、基因結構和啟動子區的順式調控元件等的分布也與系統發育分析中的分布相一致(圖2和圖6)。另外, GksHSP成員在KI_05染色體的上半部和下半部以及KI_07染色體的下半部中集中存在, 表明這些染色體區段可能是與GksHSP家族有關的熱點區域(圖3), 相似的現象也出現在玉米NAC家族[25]、棉花LTP家族[26]、木薯GRAS家族[27]等中。此外, 本研究在GksHSP家族中共發現7個基因復制事件, 而這些基因復制事件并非平均分布在整個亞家族中(表3和圖4-B), 其中CII亞家族(4個)和CI亞家族(2個)包括大部分的基因復制事件。CI亞家族和CⅡ亞家族具有較多的基因復制事件, 這是導致這2個亞家族含有更多GksHSP成員的一個原因。類似的基因復制事件導致不同亞家族含有不同成員的現象也出現在叉柱棉的近緣物種棉花的NAC家族[28]、KUP家族[22]、PEL家族[29]等基因家族中。
A:與其在陸地棉中的同源基因和的氨基酸序列分析。B~C: 在高溫、干旱和鹽脅迫下(B)和(C)的表達分析。
A: alignment analysis ofand its corresponding orthologous genes in(and). B–C: heat map representation of(B) and(C) expression levels under heat, salt, and drought stresses.
在GksHSP家族中, 所有的復制事件均與片段復制事件有關, 并沒有發生任何串聯復制事件(表3、圖3和圖4-A), 這可能與叉柱棉中由轉座子活性等導致基因組的片段化、基因丟失等現象有關[30-32]。本研究發現的7個片段復制事件均位于5個復制框中(圖4-A和圖5-A~E), 表明GksHSP家族的擴增主要與叉柱棉的全基因組復制事件有關[19]。通過Ks計算發現, 大部分的片段復制事件的Ks值集中位于0.731左右(表3和圖4-C), 這個時間正好對應于棉屬特有的全基因組復制事件所發生的時間[33]。因此, GksHSP成員的擴增主要發生在棉屬特有的全基因組復制事件中。與此同時, 本研究對與GksHSP家族擴增有關的復制框區域進行詳細的分析發現, 這5個復制框中含有較多的蛋白激酶成員、線粒體載體蛋白以及植物生長素響應蛋白(圖5-F)。目前很多研究已發現蛋白激酶、線粒體載體蛋白以及植物生長素響應蛋白均與脅迫響應相關[34-36]。例如擬南芥的蛋白激酶CDPK27成員與植株的抗鹽性有關[37], 南美杉的線粒體載體蛋白PUMP成員可以響應植株的冷害脅迫[38], 過表達小麥的生長素響應蛋白TaSAUR75可以提高擬南芥植株的干旱和鹽漬抗性[39]。因此, 在叉柱棉中, GksHSP家族的進化可能與蛋白激酶家族、線粒體載體蛋白家族以及植物生長素響應蛋白家族有關。此外, 本研究發現, 復制框1和復制框2的Ks值顯著低于復制框4的Ks值(圖5-G~I), 并且不同的復制框中所包含的成員種類也是不一樣的(圖5-F), 表明在叉柱棉中與GksHSP家族有關的不同復制框的進化速率顯著不同。
啟動子區的順式調控元件在生物學功能及其調控過程中具有非常關鍵的作用[40]。本研究發現, 在叉柱棉中GksHSP成員的啟動子區包含大量的與脅迫響應相關順式調控元件, 這表明GksHSP成員可能與植物的脅迫響應相關(圖6)。在所有與脅迫響應相關的順式調控元件中, 最多的順式調控元件為ABA響應元件(64個), 其次為茉莉酸甲酯響應元件(47個), 表明大部分GksHSP成員可能與ABA和茉莉酸甲酯調控的脅迫響應相關, 目前已經在馬鈴薯[12]、小麥[12]、簸箕柳[15]等植物的sHSP成員的啟動子區發現類似的順式調控元件分布。此外, 在GksHSP家族中, 來自CⅠ亞家族的包含最多的與脅迫響應相關的順式調控元件, 并且在陸地棉中識別了的同源基因和, 發現在高溫和鹽脅迫下這2個同源基因的表達量顯著上調(圖7), 其在擬南芥中的同源基因[41]和在水稻中的同源基因[42]也已經報道了可以響應多種脅迫。
在叉柱棉中共鑒定了39個GksHSP成員, 并且可以將GksHSP成員根據系統發育關系進一步分為10個亞家族, 每個亞家族都具有保守的基序、類似的基因結構以及相似的啟動子區的順式調控元件分布。在叉柱棉中, 棉屬特有的全基因組復制事件主要導致了GksHSP成員的擴增, 與此同時其擴增還與蛋白激酶家族、線粒體載體蛋白家族以及植物生長素響應蛋白家族有關。此外, GksHSP家族可能與ABA和茉莉酸甲酯調控的脅迫響應相關, 尤其是可以作為叉柱棉抗逆育種的一個重要候選基因。
[1] Eulgem T, Rushton P J, Robatzek S, Somssich I E. The WRKY superfamily of plant transcription factors.,2000, 5: 199–206.
[2] Schweighofer A, Hirt H, Meskiene I. Plant PP2C phosphatases: emerging functions in stress signaling., 2004, 9: 236–243.
[3] Pinheiro G L, Marques C S, Costa M D, Reis P A, Alves M S, Carvalho C M, Fietto L G, Fontes E P. Complete inventory of soybean NAC transcription factors: sequence conservation and expression analysis uncover their distinct roles in stress response., 2009, 444: 10–23.
[4] Jacob P, Hirt H, Bendahmane A. The heat-shock protein/ chaperone network and multiple stress resistance., 2017, 15: 405–414.
[5] 栗振義, 龍瑞才, 張鐵軍, 楊青川, 康俊梅. 植物熱激蛋白研究進展. 生物技術通報, 2016, 32(2): 7–13
Li Z Y, Long R C, Zhang T J, Yang Q C, Kang J M. Research progress on plant heat shock protein., 2016, 32(2): 7–13 (in Chinese with English abstract).
[6] Waters E R, Vierling E. Plant small heat shock proteins-evolutionary and functional diversity., 2020, 227: 24–37.
[7] Bentley N J, Fitch I T, Tuite M F. The small heat-shock protein Hsp26 ofassembles into a high molecular weight aggregate., 2010, 8: 95–106.
[8] Elicker K S, Hutson L D. Genome-wide analysis and expression profiling of the small heat shock proteins in zebrafish., 2007, 403: 60–69.
[9] Scharf K, Siddique M, Vierling E. The expanding family ofsmall heat stress proteins and a new family of proteins containing α-crystallin domains (Acd proteins)., 2001, 6: 225–237.
[10] Sarkar N K, Kim Y, Grover A. Rice sHsp genes: genomic organization and expression profiling under stress and development., 2009, 10: 393.
[11] 張寧, 姜晶, 史潔瑋. 番茄基因家族的全基因組鑒定、系統進化及表達分析. 沈陽農業大學學報, 2017, 48(2): 137–144.
Zhang N, Jiang J, Shi J W. Genome-wide identification, phyletic evolution and expression analysis of thegene family in tomato., 2017, 48(2): 137–144 (in Chinese with English abstract).
[12] Zhao P, Wang D, Wang R, Kong N, Zhang C, Yang C, Wu W, Ma H, Chen Q. Genome-wide analysis of the potatogene family: identification, genomic organization and expression profiles in response to heat stress., 2018, 19: 61.
[13] Ma W, Zhao T, Li J, Liu B, Fang L, Hu Y, Zhang T. Identification and characterization of thegene family in, 2016, 6: 1–13.
[14] 何福林, 張斌. 銀杏() GbHsp20基因家族的鑒定及系統進化分析. 分子植物育種, 2019, 17: 7368–7376.
He F L, Zhang B. Identification and phylogenetic analysis of GbHsp20 gene family inL., 2019, 17: 7368–7376 (in Chinese with English abstract).
[15] Li J, Zhang J, Jia H, Yue Z, Lu M, Xin X, Hu J. Genome-wide characterization of thegene family in Sreveals its functions under different abiotic stresses., 2018, 19: 3246.
[16] Jung Y J, Nou I S, Kang K K. Overexpression ofgene encoding small heat shock protein enhances tolerance to abiotic stresses in rice., 2014, 2: 370–379.
[17] Li Z Y, Long R C, Zhang T J, Yang Q C, Kang J M. Molecular cloning and characterization of thegene fromL., 2016, 43: 815–826.
[18] Sun W, Bernard C, Cotte B V D, Montagu M V, Verbruggen N., encoding a small heat-shock protein in, can enhance osmotolerance upon overexpression., 2001, 27: 407–415.
[19] Udall J A, Long E, Ramaraj T, Conover J L, Yuan D, Grover C E, Gong L, Arick II M A, Masonbrink R E, Peterson D G, Wendel J F. The genome sequence ofillustrates a descending dysploidy in plants., 2019, 10: 1541.
[20] Elhady S.Isolation and Structural Elucidation of Natural Products fromOliver and(Mast.) Hutch J B. PhD Dissertation of Faculty of Agricultural and Applied Biological Sciences of Ghent University, Ghent, Belgium, 1999.
[21] Wendel J F, Cronn R C. Polyploidy and the evolutionary history of cotton., 2003, 78: 139–186.
[22] Fan K, Mao Z, Zheng J, Chen Y, Li Z, Lin W, Zhang Y, Huang J, Lin W. Molecular evolution and expansion of the KUP family in the allopolyploid cotton speciesand., 2020, 11: 1501.
[23] Chen C, Chen H, Zhang Y, Thomas H R, Frank M H, He Y, Xia R. TBtools: an integrative toolkit developed for interactive analyses of big biological data., 2020, 8: 1194–1202.
[24] Muthusamy S K, Dalal M, Chinnusamy V, Bansal K C. Genome-wide identification and analysis of biotic and abiotic stress regulation of small heat shock protein () family genes in bread wheat., 2017, 211: 100.
[25] Fan K, Wang M, Miao Y, Ni M, Bibi N, Yuan S, Li F, Wang X. Molecular evolution and expansion analysis of the NAC transcription factor in., 2014, 9: e111837.
[26] Li F, Fan K, Ma F, Yue E, Bibi N, Wang M, Shen H, Hasan M M, Wang X. Genomic identification and comparative expansion analysis of thegene family in., 2016, 6: 38948.
[27] Shan Z, Luo X, Wu M, Wei L, Zhu Y. Genome-wide identification and expression of GRAS gene family members in cassava., 2020, 20: 46.
[28] Fan K, Li F, Chen J, Li Z, Lin W, Cai S, Liu J, Lin W. Asymmetric evolution and expansion of the NAC transcription factor in polyploidized cotton., 2018, 9: 47.
[29] Sun H R, Hao P B, Ma Q, Zhang M, Qin Y, Wei H J, Su J J, Wang H T, Gu L J, Wang N H, Liu G Y, Yu S X. Genome-wide identification and expression analyses of the pectate lyase () gene family in cotton (L.)., 2018, 19: 661.
[30] Wang Y, Wang X, Tang H, Tan X, Ficklin S P, Feltus F A, Paterson A H. Modes of gene duplication contribute differently to genetic novelty and redundancy, but show parallels across divergent angiosperms., 2011, 6: e28150.
[31] Soltis D E, Visger C J, Marchant D B, Soltis P S. Polyploidy: pitfalls and paths to a paradigm., 2016, 103: 1146–1166.
[32] Albalat R, Ca?estro C. Evolution by gene loss., 2016, 17: 379.
[33] Wang K, Wang Z, Li F, Ye W, Wang J, Song G, Yue Z, Cong L, Shang H, Zhu S, Zou C S, Li Q, Yuan Y L, Lu C R. The draft genome of a diploid cotton., 2012, 44: 1098–1103.
[34] Ray S, Agarwal P, Arora R, Kapoor S, Akhilesh K T. Expression analysis of calcium-dependent protein kinase gene family during reproductive development and abiotic stress conditions in rice (L. ssp.)., 2007, 278: 493–505.
[35] Haferkamp I, Schmitz-Esser S. The plant mitochondrial carrier family: functional and evolutionary aspects., 2012, 3: 2.
[36] 朱宇斌, 孔瑩瑩, 王君暉. 植物生長素響應基因的研究進展. 生命科學, 2014, 26: 407–413.
Zhu Y B, Kong Y Y, Wang J H. Research advances in auxin-responsivegenes., 2014, 26: 407–413 (in Chinese with English abstract).
[37] Zhao R, Sun H, Zhao N, Jing X, Shen X, Chen S. TheCa2+-dependent protein kinase CPK27 is required for plant response to salt-stress., 2015, 563: 203–214.
[38] Valente C, Pasqualim P, Jacomasso T, Maurer J B B, Souza E M D, Martinez G R, Rocha M E M, Carnieri E G S, Cadena S M S C. The involvement of PUMP from mitochondria ofembryogenic cells in response to cold stress., 2012, 197: 84–91.
[39] Guo Y, Jiang Q, Hu Z, Sun X, Zhang H. Function of the auxin-responsive geneunder salt and drought stress., 2018, 2: 181–190.
[40] 郭晉艷, 鄭曉瑜, 鄒翠霞, 李秋莉. 植物非生物脅迫誘導啟動子順式元件及轉錄因子研究進展. 生物技術通報, 2011, (4): 16–20.
Guo J Y, Zheng X Y, Zou C X, Li Q L. Research progress of-elements of abiotic stress inducible promoters and associated transcription factors., 2011, (4): 16–20 (in Chinese with English abstract).
[41] Sewelam N, Kazan K, Meike H, Maurino V G, Schenk P M. Thegene expression is mediated by diverse signals that link biotic and abiotic stress factors with ROS and can be a useful molecular marker for oxidative stress., 2019, 20: 3201.
[42] Zou J, Liu C, Liu A, Zou D, Chen X. Overexpression ofandenhances drought and salt tole-rance in rice., 2012, 169: 628–635.
Identification and analysis ofgene family in
FAN Kai, PAN Xin-Feng, MAO Zhi-Jun, YE Fang-Ting, LI Zhao-Wei, LIN Wei-Wei, and LIN Wen-Xiong*
Key Laboratory of Ministry of Education for Genetics, Breeding and Multiple Utilization of Crops, College of Agriculture, Fujian Agriculture and Forestry University, Fuzhou 350002, Fuzhou, China
Small heat shock protein (sHSP) has the lowest molecular weight in heat shock protein and sHSP has the highly conserved α-crystallin domain. The sHSP family is very important in response to various stresses, but the identification and analysis of sHSP gene family inhave not been reported. In this study, we identified 39 GksHSPs with 10 subfamilies in. There were seven gene duplication events in GksHSP family and all of duplicated gene pairs were involved in segmental duplication events. The cotton-specific whole genome duplication event primarily resulted in the GksHSP expansion. The GksHSP expansion was also related to the protein kinase, mitochondrial carrier protein, and auxin responsive protein. Besides, GksHSP members might respond to various stresses by ABA/MeJA-mediated pathways, and GksHSP26 and its corresponding orthologous genes inwere very important in stress responses. These results could provide the theoretical basis of the breeding of stress tolerance inand cotton.
; sHSP; identification; expansion; function
10.3724/SP.J.1006.2021.04235
本研究由國家自然科學基金項目(31701470), 中國博士后科學基金項目(2017M610388, 2018T110637), 福建農林大學科技創新專項基金(CXZX2020007A)和福建農林大學杰出青年科研人才計劃項目(xjq201917)資助。
This study was supported by the National Natural Science Foundation of China (31701470), the China Postdoctoral Science Foundation (2017M610388, 2018T110637), the Science and Technology Innovation Special Fund of Fujian Agriculture and Forestry University (CXZX2020007A), and the Outstanding Youth Scientific Fund of Fujian Agriculture and Forestry University (xjq201917).
林文雄, E-mail: lwx@fafu.edu.cn
E-mail: fankai@fafu.edu.cn
2020-10-29;
2021-03-19;
2021-03-31.
URL: https://kns.cnki.net/kcms/detail/11.1809.S.20210331.1316.004.html