張 東,張 政,史雨剛,王曙光,曹亞萍,范紹強,楊 斌,孫黛珍
(1.山西農業大學農學院,山西太谷 030801;2.山西省農業科學院小麥研究所,山西臨汾 041000)
小麥(TriticumaestivumL.)是世界上主要的糧食作物之一, 全世界超過45億人以其為主食[1]。隨著氣候的變化、耕地面積的不斷減少及人口數量的迅速增長,小麥供需矛盾日趨尖銳,提高小麥品種產量潛力就顯得十分重要[2]。穗數、穗粒數、千粒重、株高、穗長等其他農藝性狀與小麥產量顯著相關[3-5],對這些性狀的全基因組進行關聯分析,有助于掌握小麥產量形成的遺傳信息,促進小麥高產育種。
全基因組關聯分析(genome-wide association study,GWAS)由Risch等首先提出[6],是以連鎖不平衡為基礎,在全基因水平上對自然群體中目標性狀的遺傳變異與基因多樣性進行關聯,篩選與表型變異相關分子標記的一種策略,也被稱為連鎖不平衡作圖[7-8]。目前,關于小麥產量相關性狀的全基因組關聯分析已有一些報道。陳廣鳳等[9]以205份中國冬小麥品種(系)為材料,利用24 355個SNP標記,在4個環境條件下對農藝性狀進行關聯分析,發現11個標記至少在2個環境下與株高相關聯;鄧梅等[10]利用172個產量相關多態性SSR標記, 在繁6及其衍生后代中鑒定出4個與穗長相關聯的位點;趙丹陽等[11]利用52份黃淮麥區小麥材料關聯到5個與單株穗數顯著關聯的標記;張彥軍等[12]在43份不同來源的和尚頭小麥中,利用150對SSR標記關聯到2個與穗粒數顯著相關位點;張國華等[13]以128份黃淮麥區小麥品種(系)為材料, 在4個環境下檢測到13個與千粒重顯著關聯的位點。但是由于小麥的產量相關性狀是由多基因控制的數量性狀,且受環境的影響較大,所以有必要利用多個群體在多個環境下進行關聯分析,以便找到穩定的關聯位點用于育種。本研究以 236 份小麥種質資源構成的自然群體為材料,利用均勻分布于小麥 21 條染色體上的 106對SSR 標記,對小麥單株穗數、主穗粒數、千粒重、株高、穗長5個產量相關性狀在2年4個環境下進行產量相關性狀的全基因組關聯分析,篩選優異等位變異,為分子標記輔助選擇育種提供依據。
236份種質資源包括中國冬麥區推廣的小麥育成品種、骨干親本。其中,有225份來自于中國,1份來自智利,4份來自意大利,6份未知來源材料。
236份材料于2016年9月至2017年7月及2017年9月至2018年7月種植在山西農業大學農作站(北緯37°25″,東經112°25″)。試驗用隨機區組設計。每一份材料種植一行,每行點播70粒種子,行長2.0 m,行距0.2 m,株距3.0 cm,行向南北。設置雨養和灌溉兩種水分管理方式,各進行3個重復,每一重復生長條件除水分管理方式之外均相同。雨養條件下不進行人工灌溉,小麥生長僅依靠自然降雨,而灌溉條件下分別在越冬前期、返青期、拔節期和灌漿中期進行人工灌溉,以滿足小麥在生長發育過程中對水分的需要。
小麥成熟之后,每個重復隨機從中選取5株生長健壯、整齊一致的植株,考察株高、穗長、單株穗數、主穗粒數和千粒重,以其平均值作為性狀的觀測值。
每個材料于培養皿中培養至二葉一心期(25 ℃,12 h光照;20 ℃,12 h黑暗),取約0.2 g小麥葉片,研磨之后,使用CTAB法提取小麥葉片中的DNA,ddH2O溶解之后進行瓊脂糖凝膠電泳檢測DNA質量。
根據標記的多態性及PCR擴增的穩定性,從大量的SSR標記中篩選出106對SSR標記,其分布見表1。

表1 106對SSR標記在染色體上的分布
PCR程序為95 ℃預變性5 min;95 ℃變性30 s,退火30 s,72 ℃延伸45 s,運行34個循環;72 ℃延伸10 min;10 ℃保存。使用Taq酶(購置于天根生化科技有限公司)進行PCR擴增,引物由生工生物工程(上海)股份有限公司合成,反應總體系為15 μL,0.3 μL前引物,0.3 μL后引物,1 μL模板DNA,1.5 μL buffer,1.2 μL dNTPs,0.15 μL Taq酶,10.55 μL ddH2O。為防止PCR產物中殘留的鹽和蛋白影響毛細管電泳檢測,對擴增產物進行純化,利用ABI3730 DNA測序儀(Applied Biosystems,Foster City,USA)檢測擴增產物的片段大小;使用GenemapperV3.7軟件進行數據讀取。
依據Liu等[14]的方法對每個SSR位點的等位變異數、等位基因頻率、多態性信息指數(PIC)應用PowerMarker V3.25軟件進行計算。使用張政等[15]的方法應用Structure V2.3.2軟件,利用上述的106對SSR標記進行群體結構分析,每個K值重復5次,取值范圍設定為1~15,將MCMC(Markov Chain Monte Carlo)開始時的不作數迭代(length of burn-in period)設為50 000,再將不作數迭代后的MCMC設為100 000。亞群的數量依據Evanno等[16]方法用K+Q的模型進行確定;品種間的親緣系數依據Hardy等[17]的方法使用SPAGeDi軟件計算。表型數據依據Bernardo等[18]的方法使用SPSS 20.0軟件進行處理。關聯分析使用TASSEL 3軟件中的混合線性模型(MLM),用群體結構(Q)和親緣關系(K)為協變量,對標記和表型數據進行關聯分析,當P<0.01時為顯著關聯,當P<0.001時為極顯著關聯。通過各位點每個等位變異的效應與該位點平均效應值的比較計算等位變異的遺傳效應,再通過對等位變異表型效應的解析篩選優異等位變異[19]。
兩年四個環境下小麥株高、穗長、單株穗數、主穗粒數、千粒重變異廣泛,除了單株穗數之外其他性狀的變異系數均大于10%(表2)。說明這些性狀在品種間的遺傳變異性比較大。

表2 不同環境下產量相關性狀的表型變異統計
用106對SSR標記在236份小麥材料中共檢測到874個等位變異,每對標記平均為8.24個,變化范圍為2~23個;主要等位變異頻率(MAF)的變化范圍0.177~0.987,平均為 0.545,其中頻率最小的分子標記是gwm268,最大的是cfd106;多態性信息含量(PIC)的變化范圍為0.026~0.895,平均為0.550,頻率最小的分子標記是cfd106,最大的是gwm174,多態性達到高度水平(PIC>0.5)(表3)。這表明這些小麥品種在分子上的遺傳多樣性水平較高。

表3 106對標記的遺傳多樣性數據
基于混合線性模型對供試的236個小麥種質資源進行群體結構分析,以設定的K所對應的最大似然值為目標來選擇合適的群體數目,計算每個K值下的△K值,根據計算出的△K值繪制ΔK值隨K值變化的折線圖。K=2時,△K值出現明顯的最大值,隨后下降(圖1),因而選定K=2為最佳的群體數目,將該群體分為兩個亞群(圖2)。第一亞群包含127份材料(53.81%),第二亞群包含109份材料(46.19%)。其中來源于江蘇的63份材料主要分布于第二亞群(76.19%),河南的29份材料主要分布于第一亞群(82.86%),陜西的26份材料主要位于第一亞群(73.08%),山東的21份材料中有19份分布于第一亞群(90.48%),說明來源于上述地區的材料群體結構較為單一。

圖2 通過Structure V2.3.2軟件分析的遺傳結構(紅色:第一亞群;黃色:第二亞群)

圖1 通過假定不同K值計算得到的△K值
對236份小麥材料之間親緣關系分析的結果表明,75.62%的品種的親緣系數小于0.05,其中包括約55.35%材料的親緣關系值為0,12.57%的材料介于0.05~0.10范圍,6.21%的材料介于0.10~0.15范圍,2.89%的材料介于0.15~0.20范圍,1.22%的材料介于 0.25~0.30范圍,0.28%的材料介于0.30~0.35范圍,0.14%的材料介于0.35~0.04范圍,0.13%的材料介于 0.40~0.50范圍,0.09%的材料介于0.45~0.05范圍(圖3),說明大部分品種(系)之間沒有親緣關系或親緣關系較遠,對關聯分析影響較小。

圖3 236份小麥品種間親緣關系的分布
經關聯分析,在供試材料檢測到的位點中,7個位點與株高顯著關聯(P<0.01),它們分布在1A、5D和6D染色體上(表4)。其中,位于1A染色體上的Xgwm164(1A)在4個環境下均與株高顯著關聯,表型解釋率(R2)為10.55%~ 13.74%;Xgwm55(6D)在2個環境下與株高顯著關聯,表型解釋率分別為11.62%和12.17%。有4個位點與穗長顯著關聯,它們分布在2B、6B和6D染色體上,表型解釋率為11.50%~ 15.65%。其中,Xgwm429(2B)在2個環境下與穗長顯著關聯,表型解釋率分別為11.50%和 15.65%。有7個位點與單株穗數顯著關聯,它們分布在1A、1D、4D、5B、5D和6B染色體上,表型解釋率為7.36%~10.24%。其中,Xwmc415(5B)在2個環境下與單株穗數顯著關聯,表型解釋率分別為8.72%和9.37%;Xgwm642(1D)的表型解釋率大于10%。有5個位點與主穗粒數顯著關聯,它們分布在1D、2D、5D和6B染色體上,表型解釋率為6.25%~13.99%,其中Xgwm102(2D)和Xgwm219(6B)的表型解釋率大于10%。有3個位點與千粒重顯著關聯,它們分布在2B、4A和5A染色體上,表型解釋率為 7.70%~18.97%,其中Xgwm120(2B)和Xgwm186(5A)的表型解釋率大于10%,Xgwm120(2B)的表型解釋率最大,達到18.97%。

表4 小麥產量相關性狀的關聯分析
與株高關聯的優異等位變異中,Xgwm164-1A118效應最大,可降低株高4.24 cm。與穗長關聯的優異等位變異中,Xgwm429-2B207效應最大,可增加穗長0.75 cm。與單株穗數關聯的優異等位變異中,Xgwm194-4D129、Xwmc415-5B154、Xgwm292-5D208和Xgwm193-6B166的等位變異頻率分別為50.24%、71.71%、70.73%和74.63%,這些位點在育種過程中可能經過較強人工選擇,其中Xwmc415-5B154效應最大,可增加單株穗數1.07個。與主穗粒數關聯的優異等位變異中,Xgwm232-1D138效應最大,可增加主穗粒數1.93粒;優異等位變異Xcfd266-5D165的等位變異頻率為 50.24%。與千粒重關聯的優異等位變異中,Xgwm610-4A170效應最大,可增加千粒重 0.92 g(表5)。

表5 關聯標記的優異等位變異及其效應
影響關聯分析結果的主要因素包括表型測量的準確性、群體結構和親緣關系、標記的遺傳多樣性、關聯分析所選擇模型的檢測效力等。本研究在兩年四個環境下進行,且每個處理均設有三次重復,表型測量時通過隨機選5株的方法來減少試驗誤差。群體結構和親緣關系是導致關聯結果出現假陽性的兩個主要因素,假陽性可能帶來虛假的等位基因多樣性信息,最終導致基因型數據精確度受損。本試驗使用Structure V2.3.2軟件進行群體結構分析,將供試群體分為2個亞群,使用SPAGeDi軟件計算了群體間的親緣關系,同時將群體結構分析得到的Q矩陣和親緣關系分析得到的K矩陣作為協變量參與關聯分析,以消除由于供試材料的群體結構和親緣關系所引起的偽關聯。所選標記的遺傳多樣性較高時,可以提高其作圖能力,并且增加可供檢測的等位基因數量。本研究利用106對SSR標記掃描236份小麥材料,發現這些材料多態性信息指數(PIC)的變化范圍為0.026~0.895,平均為 0.550,表明這些小麥品種在分子水平上有較高的遺傳多 樣性。
目前,已命名的小麥矮稈(Rht)基因有30個,分布于小麥2AS、2BL、2DS、3BS、4BS、4DS、5AL、5DL、6A、7A和7B染色體上[20-23]。本研究發現,位于1A染色體上的標記Xgwm164和6D染色體上的標記Xgwm55分別在4個和2個環境下與株高顯著關聯。雖然余馬等[24]在1A染色體的標記區間Xgwm163-Xpsr11檢測到一個與株高相關的QTL,但與標記Xgwm164相距較遠,所以推斷本研究檢測到的這兩個與株高相關聯的標記位點是新位點。此外,陳曉杰[25]以90份中國冬小麥為材料發現Xgwm164(1A)與小穗數、胞間CO2濃度顯著關聯,并可增加0.099 3個小穗數、增加0.0919 μL·L-1胞間CO2濃度。Iqbal Saeed[26]對59份冬小麥材料研究發現,Xgwm164(1A)與凈光合速率在2個環境下顯著關聯,表型解釋率12.68%。而本研究發現,優異等位變異Xgwm164-1A118可以降低株高4.24 cm,因此該位點具有一因多效性。
其次,本研究發現6D染色體上的標記Xgwm55同時與株高和穗長兩個性狀顯著關聯,且優異等位變異Xgwm55-6D130可降低株高1.47 cm,增加穗長0.23 cm;而郭杰[19]研究發現Xgwm55與穗基部第三個小穗結實粒數顯著關聯,且可增加基部小穗結實數0.12粒;Perretant等[27]利用旱選10號和魯麥14構建的雙單倍體(DH)群體中定位到一個微效的籽粒硬度QTL位點與Xgwm55-6D連鎖,所以該位點也具有一因多效性。另外,本研究在2個環境下均檢測到標記Xwmc415(5B)與單株穗數顯著關聯,且優異等位變異Xwmc415-5B154,可以增加單株穗數1.07個。而楊林等[28]利用中國春/蘭考大粒的F2群體在5B染色體的標記區間上Wms499-Wms371定位到一個與單株穗數相關的QTL,與標記Xwmc415(5B)相距僅4 cM;張冬玲[29]研究發現Xwmc415與千粒重、穗粒數顯著關聯,且優異等位變異Xwmc415-5B154對千粒重和穗粒數均有顯著的增效作用。顯然,以上三個標記位點對于產量因子的作用都是正向的,因此利用這三個標記位點進行輔助選擇矮稈小麥品種的同時,還可增加每穗小穗數、改善胞間CO2濃度或者增加穗長和基部小穗結實數,改善品質或者可同時改善單株穗數、千粒重和穗粒數。
另一方面,已經在染色體1A、1B、2A、2B、2D、3A、3B、4A、4B、5A、5B、5D、6A、6B、7A和7B染色體上檢測到與穗長相關的QTL[30-33]。本研究中,在2017年雨養與灌溉兩種環境下,檢測到2B染色體上的標記Xgwm429與穗長相關聯,優異等位變異Xgwm429-2B207可以增加穗長0.75 cm,與侯立江[30]在2B染色體標記區間Xwmc764-Xwmc770中檢測到的QTL相距僅3 cM,可能為同一位點。同時郭杰[19]研究發現Xgwm429可同時提高頂部第一個小穗位的結實粒數0.02粒,然而付必勝等[34]檢測到標記Xgwm429在3個環境中與赤霉病抗性相關,可增加0.3個感赤霉病小穗數。因此,在育種過程中利用該標記進行輔助選擇時,一定要考慮到對赤霉病的感病性。