崔向華 隗正陽 杜振偉 周霞麗 劉焱 石明權 闞躍峰 張少澤 崔承齊 梅鴻獻



摘要:以294份遺傳多樣性豐富的芝麻種質資源為試驗材料,于2014年調查駐馬店市、商丘市、南陽市3個地點的株高、始蒴高度、單株蒴數、蒴粒數、千粒質量、單株產量等6個產量相關性狀,結合33 027個SNP標記,使用混合線性模型進行全基因組關聯分析,對重復檢測到的顯著SNP位點兩側99 kb區域內挖掘所有功能注釋基因,根據注釋信息找尋與目標性狀相關的基因,并進行功能富集分析。結果表明,6個性狀存在廣泛變異,3個環境下變異系數表現為單株產量和單株蒴數>始蒴高度>蒴粒數>千粒質量>株高。6個性狀均呈現正態分布,廣義遺傳力為44.07%~85.49%。經關聯分析共檢測到171個顯著關聯位點,表型變異解釋率為5.46%~11.56%。在駐馬店和商丘共同檢測到6個與蒴粒數顯著關聯的位點,在其側翼各99 kb區域內共挖掘到118個功能注釋基因,其中SIN_1012613基因與擬南芥CKI1(AT2G47430)是同源基因,該基因可能通過調控雌配子的發育來決定芝麻蒴粒數。本研究結果有助于解析芝麻產量相關性狀的遺傳機制,為芝麻產量的遺傳改良奠定理論基礎。
關鍵詞:芝麻;產量性狀;全基因組關聯分析;SNP標記;功能注釋基因;廣義遺傳力;候選基因預測
中圖分類號:S565.303.2文獻標志碼:A
文章編號:1002-1302(2023)21-0106-07
芝麻(Sesamum indicum L.,2n=26)屬胡麻科胡麻屬,主產地為亞洲和非洲,是我國重要的油料作物之一[1]。芝麻具有較高的經濟價值,以芝麻籽加工的芝麻油和芝麻醬,具有獨特的風味和豐富的營養物質,受到消費者青睞[2]。同時芝麻也具有藥用價值,芝麻含有的木酚素具有降低人體膽固醇的作用[3],其富含的芝麻酚、芝麻醇、維生素E等是天然抗氧化物質[4]。近年來,人們對芝麻需求量的增加與中國芝麻種植面積不斷萎縮的矛盾凸顯,芝麻進口量逐年增加[5],因此,需要通過選育更高產的芝麻品種來緩解國內芝麻供給不足的現狀。優異的產量性狀是提升芝麻產量的關鍵,明確其遺傳機制,鑒定和定位控制產量性狀的染色體位點,對于挖掘高產基因、培育高產品種均具有重要意義。
全基因組關聯分析(GWAS)以自然群體長期重組交換保留下的連鎖不平衡為基礎,相較于經典雙親連鎖作圖,具有無需構建分離群體、研究周期短、定位精度高等優點[6]。近些年,隨著基因組測序成本的降低,全基因組關聯分析應用到作物遺傳育種研究中的例子越來越普遍,已成為研究作物數量性狀的重要方法[7]。目前,全基因組關聯分析已經在玉米[8]、小麥[9]、水稻[10]、大豆[11]、油菜[12]等作物中得到大量應用。隨著芝麻高質量參考基因組的公布[13],全基因組關聯分析也逐漸被應用到芝麻復雜農藝性狀的遺傳基礎解析中。Tesfaye等在2個環境中對300份芝麻種質資源進行全基因組關聯分析,共鑒定到21個與7個產量相關性狀相關聯的顯著標記[14]。Wei等對705份芝麻種質資源進行重測序,并首次對56個農藝性狀進行全面的全基因組關聯分析[15]。Dossa等以400份芝麻材料為群體,對其抗旱相關性狀進行全基因組關聯分析,檢測到10個穩定數量性狀基因座(QTL)位點解釋表型變異40%以上[16]。崔承齊等將由363份種質資源組成的群體作為研究對象,借助全基因組單核苷酸多態性(SNP)標記對8個產量相關性狀進行關聯分析,結果檢測到10個重復關聯位點[17]。
相較于主要作物,芝麻遺傳育種研究相對滯后,挖掘更多產量相關性狀的優異等位基因仍尤為必要。本研究以294份芝麻種質資源為關聯群體,結合基于SLAF-seq(specific locus amplified fragment sequencing) 技術開發的高質量SNP標記和該群體3個種植點的表型數據,對株高、始蒴高度、單株蒴數、蒴粒數、千粒質量和單株產量等性狀進行全基因組關聯分析,旨在挖掘顯著關聯位點,為目標性狀的基因克隆和功能驗證奠定基礎,最終通過分子設計育種提高芝麻產量。
1 材料與方法
1.1 試驗材料
關聯分析群體由294份收集于各地的種質資源組成,由河南省農業科學院芝麻研究中心提供。分別于2014年在商丘市、南陽市和駐馬店市試驗基地種植,田間試驗設計2個重復,行長劃定為3 m,行距劃定為0.4 m,3對真葉時定株距為0.17 m,試驗區采取常規田間管理。
1.2 表型測定
終花期每個重復隨機選取10株長勢一致的健康植株,統計株高(PH)、始蒴高度(FCH)和單株蒴數(CN)并掛牌標記;成熟期每株收獲成熟、均勻蒴果30個,曬干,統計蒴粒數(SN)和千粒質量(SW);之后將標記植株整株收獲,晾干,收取全部籽粒并稱質量,獲得單株產量(SY)[17]。
1.3 表型數據分析
利用IBM SPSS Statistics v19.0 軟件對表型數據進行統計分析和方差分析。使用R語言lme4包計算3個環境中性狀的最優線性無偏估計值(BLUP),使用corrplot包進行相關性分析。使用ICiMapping軟件ANOVA功能進行廣義遺傳力估算,計算公式參照Knapp等的研究[18]。
1.4 基因型鑒定和分析
采用SLAF-seq技術對群體材料進行簡化測序,然后利用BWA軟件將過濾后的數據比對到改良后的中芝13參考基因組上[19],再采用SAMTOOLS軟件檢測群體SNP,經VCFtools軟件初步過濾后,去除缺失率大于10%或最小等位基因頻率小于0.01的SNP,最終獲得33 027個高質量SNP用于全基因組關聯分析。
1.5 全基因組關聯分析
利用TASSEL 5.0軟件分別對3個環境下6個性狀進行全基因組關聯分析,以P=0.000 1為閾值,判定SNP標記與目標性狀關聯的顯著性。使用R語言qqman包繪制曼哈頓圖。
2 結果與分析
2.1 表型數據的描述統計
對關聯群體在3個不同環境下6個產量相關性狀(單株產量、單株蒴數、蒴粒數、千粒質量、株高、始蒴高度)表型數據進行統計分析(表1)。通過表型數據發現這6個性狀具有廣泛的變異,變異系數分布為9.41%~30.54%,表明材料間性狀差異較大,具有豐富的遺傳變異。同時,3個環境下各性狀變異系數具有相同的表現,即單株產量和單株蒴數>始蒴高度>蒴粒數>千粒質量>株高,表明單株產量較其他性狀更容易受到環境因素影響,而株高則與之相反。從各性狀頻數分布直方圖(圖1)來看,6個性狀基本符合正態分布,符合數量性狀特點。對產量相關性狀的BLUP值進行相關性分析,得出相關系數(表2)。結果表明,株高與始蒴高度、單株蒴數、單株產量呈極顯著正相關(P<0.01);單株產量與單株蒴數極顯著正相關;單株蒴數與蒴粒數、千粒質量呈極顯著負相關;蒴粒數和千粒質量呈極顯著負相關;單株蒴數與單株產量的相關性最高 (相關系數0.67)。
方差分析結果(表3)顯示,這6個性狀的基因型效應、環境效應及二者互作效應均達到極顯著水平(P<0.01)。由表1可知,各性狀的廣義遺傳力為44.07%~85.49%,其中單株產量的廣義遺傳力最低,株高的廣義遺傳力最高,說明單株產量更容易受到環境因素影響。
2.2 產量相關性狀的全基因組關聯分析
基于混合線性模型(MLM)對關聯群體的單株產量、株高、單株蒴數、蒴粒數、千粒質量、始蒴高度等6個性狀進行GWAS分析,以P<0.000 1為顯著性閾值,共檢測到171個顯著關聯位點(圖2)。其中,與株高關聯的位點共16個,分布在1號、11號和12號染色體上,解釋表型變異的有6.62%~10.02%,其中1號染色體上的關聯位點最多,達到11個;與始蒴高度關聯的位點共26個,解釋表型變異的有6.62%~11.12%,分布在1號、2號、3號、4號、5號和6號染色體上;與單株蒴數關聯的位點共計34個,解釋表型變異的有6.54%~9.93%;與蒴粒數關聯的位點共55個,解釋表型變異的有5.46%~10.52%;與千粒質量關聯的位點共26個,解釋表型變異的有6.51%~11.56%;與單株產量關聯的位點共14個,解釋表型變異的有6.57%~8.97%。其中,共有6個與蒴粒數關聯的位點在駐馬店和商丘2個環境中均能重復被檢測到(表4)。
2.3 候選基因預測
為保證結果的可靠性,只對重復檢測到的關聯位點進行候選基因篩選。參考前期研究,LD衰減距離約為99 kb[17],在6個重復檢測到的位點側翼各99 kb區間內共找到153個基因,其中118個基因具有功能注釋。GO功能富集分析結果顯示,這些基因富集到43個功能類別下,涉及植物的細胞組分、生物學過程和分子功能(圖3)。其中,細胞(cell)、細胞組分(cell part)、細胞進程(cellular process)、細胞器(organelle)、代謝過程(metabolic process)這5個功能類別下富集的基因占比較多(圖3)。根據功能注釋結果篩選到1個可能與蒴粒數相關的候選基因SIN_1012613,該基因與擬南芥CKI1(AT2G47430)基因同源,CKI1基因在擬南芥中編碼組氨酸激酶蛋白,該蛋白通過調控雌配子發育來決定種子的形成。
3 討論與結論
芝麻產量構成因素較多且復雜,各因素之間相互聯系。本研究通過對產量相關性狀BLUP值進行相關性分析發現,各性狀之間存在復雜的相關性,株高與始蒴高度、單株蒴數和單株產量極顯著正相關,單株產量與單株蒴數的相關系數最高,為0.67。說明選育高產品種首先應關注株高和單株蒴數,且單株蒴數是影響產量最密切的因素,這與前人研究結果相似。唐雪輝等利用通徑分析發現,單株蒴數是構成芝麻產量的第一因素,直接通徑系數為0.830 9[20]。呂偉等利用逐步回歸分析和通徑分析發現,單株蒴數、千粒質量和蒴粒數3個性狀的優良表現對芝麻單株產量起到促進作用[21]。劉紅艷等以15份芝麻種質資源為試驗材料,對產量和品質性狀進行典型相關分析,認為選育豐產型品種應考慮株型、千粒質量、單株蒴果數和蒴粒數[22]。同時,在本研究中各環境下單株蒴數與蒴粒數、千粒質量呈極顯著負相關關系,蒴粒數和千粒質量呈極顯著負相關關系。綜上,各性狀相互配合、相互影響,因此培育高產品種應綜合考慮多個性狀表現。
全基因組關聯分析利用覆蓋整個基因組的分子標記,鑒定目標性狀表型和基因型之間的關聯。準確的表型數據對GWAS研究十分重要[23]。本研究共檢測到171個與產量相關性狀顯著關聯的位點,但大多只在單個環境中被檢測到,僅有6個與蒴粒數關聯的顯著位點在駐馬店和商丘2個環境中重復檢測到,原因可能是產量相關性狀屬復雜的數量性狀,易受環境影響,需要依靠多年多點的試驗和更加高效準確的表型采集技術來獲得良好的表型數據。然而,目前作物表型數據仍然依靠人工采集,效率低,難以避免主觀誤差,且作物生長發育過程存在人工無法獲取和采集的表型信息。鑒于此,多尺度、高通量、規模化的植物表型組學研究快速發展[24],通過使用數字成像、近紅外光譜等技術,會更加高效、準確地獲得植物表型數據,推動GWAS研究進一步發展。
數量性狀遺傳基礎復雜,本研究在6個與蒴粒數顯著關聯的位點區間內共發現153個基因,其中118個具有功能注釋。這些基因中SIN_1012613位于6號染色體上,是擬南芥CKI1(cytokinin independent 1)的同源基因,CKI1在擬南芥中編碼組氨酸激酶蛋白(histidine kinase protein)。有研究表明,該蛋白可能通過調控胚囊中央細胞的命運分化和發育過程來決定種子的形成[25]。Deng等通過獲得純合CKI1突變體擬南芥,發現CKI1的功能缺失會導致雌配子發育缺陷、結實率低等問題[26]。由此推測,芝麻SIN_1012613基因可能具有相似功能,即通過調控雌配子的發育來決定芝麻蒴粒數。本研究同時在關聯區間內檢測到MYB、bZIP、NAC等與植物生長代謝調控相關的轉錄因子,這些轉錄因子可能通過影響植物生長發育間接控制蒴粒數。然而,后續仍需要借助基因編輯、遺傳轉化等方法進行功能驗證。
參考文獻:
[1]劉紅艷. 芝麻細胞核雄性不育的遺傳特性、生理生化及分子標記研究[D]. 北京:中國農業科學院,2013.
[2]許方濤,崔向華,盛 晨,等. 芝麻不同組織中礦物質元素分布特征及相關性分析[J]. 中國油料作物學報,2023,45(5):1028-1033.
[3]Hirata F,Fujita K,Ishikura Y,et al. Hypocholesterolemic effect of sesame lignan in humans[J]. Atherosclerosis,1996,122(1):135-136.
[4]劉 坤,齊 靜,劉夢蘭,等. 芝麻GRF基因家族全基因組鑒定分析[J]. 分子植物育種,2020,18(22):7323-7333.
[5]周 瑢,許方濤,盛 晨,等. 芝麻含油量及脂肪酸含量QTL分析[J]. 中國油料作物學報,2021,43(6):1042-1051.
[6]熊雪航,段海洋,李文龍,等. 玉米穗長全基因組關聯分析[J/OL]. 分子植物育種:1-16.(2022-06-30)[2023-08-25]. http://kns.cnki.net/kcms/detail/46.1068.S.20220630.1359.004.html.
[7]楊 飛,張征鋒,南 波,等. 水稻產量相關性狀的全基因組關聯分析及候選基因篩選[J]. 作物學報,2022,48(7):1813-1821.
[8]Palaisa K,Morgante M,Tingey S,et al. Long-range patterns of diversity and linkage disequilibrium surrounding the maize Y1 gene are indicative of an asymmetric selective sweep[J]. Proceedings of the National Academy of Sciences of the United States of America,2004,101(26):9885-9890.
[9]Neumann K,Kobiljski B,Denc[DD(-1*2/3][HT6]ˇ[DD)]i[KG-*5]c[DD(-1*2/3][HT6]'[DD)] S,et al. Genome-wide association mapping:a case study in bread wheat (Triticum aestivum L.)[J]. Molecular Breeding,2011,27(1):37-58.
[10]Huang X H,Wei X H,Sang T,et al. Genome-wide association studies of 14 agronomic traits in rice landraces[J]. Nature Genetics,2010,42(11):961-967.
[11]Zhou Z K,Jiang Y,Wang Z,et al. Resequencing 302 wild and cultivated accessions identifies genes related to domestication and improvement in soybean[J]. Nature Biotechnology,2015,33(4):408-414.
[12]Wei L J,Jian H J,Lu K,et al. Genome-wide association analysis and differential expression analysis of resistance to Sclerotinia stem rot in Brassica napus[J]. Plant Biotechnology Journal,2016,14(6):1368-1380.
[13]Wang L H,Yu S,Tong C B,et al. Genome sequencing of the high oil crop sesame provides insight into oil biosynthesis[J]. Genome Biology,2014,15(2):R39.
[14]Tesfaye T,Tesfaye K,Keneni G,et al. Genome-wide association study for yield-related traits in sesame (Sesamum Indicum)[J]. Plant Breeding,2022,141(2):246-256.
[15]Wei X,Liu K Y,Zhang Y X,et al. Genetic discovery for oil production and quality in sesame[J]. Nature Communications,2015,6:8609.
[16]Dossa K,Li D H,Zhou R,et al. The genetic basis of drought tolerance in the high oil crop Sesamum indicum[J]. Plant Biotechnology Journal,2019,17(9):1788-1803.
[17]崔承齊,劉艷陽,江曉林,等. 芝麻產量相關性狀的多位點全基因組關聯分析及候選基因預測[J]. 中國農業科學,2022,55(1):219-232.
[18]Knapp S J,Stroup W W,Ross W M.Exact confidence intervals for heritability on a progeny mean Basis[J]. Crop Science,1985,25(1):192-194.
[19]Mei H X,Liu Y Y,Cui C Q,et al. QTL mapping of yield-related traits in sesame[J]. Molecular Breeding,2021,41(7):43.
[20]唐雪輝,賀建文,譚順林,等. 芝麻主要農藝性狀與產量相關性及通徑分析[J]. 安徽農業科學,2010,38(26):14293-14294.
[21]呂 偉,韓俊梅,文 飛,等. 西北地區芝麻單株產量與農藝性狀的相關性與通徑分析[J]. 種子,2020,39(4):91-94.
[22]劉紅艷,趙應忠.芝麻產量性狀與品質性狀的典型相關分析[J]. 中國油料作物學報,2006,28(2):129-133.
[23]韓 貝,王旭文,李保奇,等. 陸地棉種質資源抗旱性狀的關聯分析[J]. 作物學報,2021,47(3):438-450.
[24]徐凌翔,陳佳瑋,丁國輝,等. 室內植物表型平臺及性狀鑒定研究進展和展望[J]. 智慧農業,2020,2(1):23-42.
[25]Yuan L,Liu Z N,Song X Y,et al. The CKI1 histidine kinase specifies the female gametic precursor of the endosperm[J]. Developmental Cell,2016,37(1):34-46.
[26]Deng Y,Dong H L,Mu J Y,et al. Arabidopsis histidine kinase CKI1 acts upstream of histidine phosphotransfer proteins to regulate female gametophyte development and vegetative growth[J]. The Plant Cell,2010,22(4):1232-1248.
收稿日期:2023-04-11
基金項目:國家特色油料產業技術體系建設專項(編號:CARS-14-1-01、CARS-14-2-16);河南省重大科技專項(編號:201300110600);河南省中央引導地方科技發展資金 (編號:Z20221343038);河南省農業科學院科技創新團隊項目(編號:2023TD31);河南省農業科學院基礎性科研工作項目(編號:2023JC13)。
作者簡介:崔向華(1973—),男,河南駐馬店人,副研究員,從事芝麻遺傳育種及高產栽培技術研究。E-mail:xianghuacui1973@163.com。
通信作者:梅鴻獻,博士,副研究員,從事芝麻種質資源與遺傳育種研究。E-mail:meihx2003@126.com。