郝倩琳 楊廷志 呂新茹 秦慧敏 王亞林 賈晨飛 夏先春馬武軍 徐登安,*
1 青島農業大學農學院, 山東青島 266109; 2 中國農業科學院作物科學研究所, 北京 100081
小麥(TriticumaestivumL.)是全球重要的糧食作物之一, 為人類提供豐富的蛋白質、膳食纖維和能量, 保障小麥高產穩產對確保國家糧食安全具有重要意義[1]。中國是小麥主要生產國之一, 據國家統計局資料顯示, 2022 年全國小麥播種面積、總產和單產分別為235.19 萬公頃、13,772.30 萬噸、5856.00 kg hm-2(國家統計局關于2022 年糧食產量數據的公告,http://www.stats.gov.cn/)。隨著全球氣候變暖, 因干旱脅迫造成小麥減產危害日益嚴重, 篩選和培育耐旱的小麥品種成為重要的育種目標[2]。
胚芽鞘是一種鞘狀結構, 它包裹著植物的胚芽,保護胚芽出土時不受損傷, 同時胚芽鞘尖端含有葉綠體能進行光合作用, 對早期幼苗生長具有重要作用[3-4]。在小麥種植干旱地區, 人們通常采用深播的方式使小麥更好地利用深層土壤水分[5-6]。然而胚芽鞘短的小麥品種可能難以在深播的條件下出苗, 特別是當種植深度超過5 cm 時, 可能導致小麥出苗率降低, 出苗晚, 早期葉片發育緩慢等問題[7-9]。胚芽鞘長度對小麥苗期生長至關重要, 因為它決定著種子可以播種的最大深度[7,10-11]。
目前, 國內外學者對胚芽鞘長度遺傳基礎進行了廣泛的研究, 表明小麥胚芽鞘長度是受多基因控制的數量性狀, 遺傳力高, 加性效應強, 可以通過遺傳改良來調節胚芽鞘長度以提高小麥苗期抗旱性[3,12]。對小麥胚芽鞘長度的連鎖分析發現在不同的遺傳群體和環境中能重復地鑒定到位于小麥1A、1B、2B、2D、3A、3B、3D、4A、4B、4D、5A、5B、5D、6A、6B、7A 和7B 染色體上與胚芽鞘長度相關的 QTL[3,5,10,13-15]。其中矮稈基因Rht-B1b(Rht1)和Rht-D1b(Rht2)不僅導致株高降低, 而且抑制胚芽鞘伸長[5,7,16-18]。然而,Rht4、Rht5、Rht7、Rht8、Rht9、Rht12、Rht13、Rht14和Rht24能夠降低小麥株高, 但不影響胚芽鞘的長度[16,19-24], 這些基因為培育具有長胚芽鞘的矮稈小麥品種提供了可利用的遺傳資源。Yu 和Bai[5]在望水白×Wheaton 構建的139個重組自交系(RILs)中鑒定到6 個QTL (quantitative trait loci), 分別位于1B、3D、4DS、4DL、5AS 和5B 染色體上; Spielmeyer 等[13]利用攜帶GA 敏感矮稈基因Rht8的半矮稈小麥“傳麥18” (CM18)和高強育種系Vigour18 雜交產生的460 個重組自交系(RILs)在6A 染色體上鑒定出1 個QTL; 袁倩倩等[25]利用花培3 號×豫麥57 構建的DH 群體共定位到8 個控制胚芽鞘長度的QTL; Zhang 等[26]利用濰麥8 號×洛旱2 號(WL)、濰麥8 號×煙農19 (WY)和濰麥8 號×濟麥20 (WJ)構建的分別由179、175 和172 個株系組成的3 個RIL 群體在1A、3B、4A、5A、5B、6B、7A、7B 染色體上共鑒定到11 個QTL, 其中3 個QTL在2 個或3 個群體中均能檢測到; Singh 等[14]利用WL711 和C306 構建的206 個重組自交系群體在3B、4B 和6B 染色體上共鑒定到5 個QTL。
近年來, 全基因組關聯分析(genome-wide association study, GWAS)也逐漸應用于小麥胚芽鞘長度相關性狀遺傳位點的挖掘。Li 等[15]收集了全球893份冬季或兼性小麥品種進行GWAS 研究, 在1B、2D、4B、4D、5B 染色體上共鑒定到10 個QTL 位點, 其中矮稈基因Rht-B1b(Rht1)和Rht-D1b(Rht2)對胚芽鞘長度有顯著影響。Ma 等[27]對707 個中國小麥地方品種進行了關聯分析, 共鑒定出17 個與胚芽鞘長度相關的QTL, 其中QCl.sicau-6B.2位點位于6B 染色體508.17~509.26 Mb 位置, 為一個新的主效位點。Sidhu 等[28]利用298 份冬小麥品種進行GWAS研究, 鑒定到9 個與胚芽鞘長度相關的QTL, 其中包括先前已經報道過的Rht1和較高效應值的QCL.sdsu-5BL。Wei 等[29]利用來自山西省的282 個小麥品種在干旱和光照處理條件下進行關聯分析鑒定到9 個穩定的與胚芽鞘長度相關的QTL, 可解釋2.94%~7.79%的表型變異。到目前為止, 通過連鎖分析和GWAS 共鑒定到18 個控制小麥胚芽鞘長度相關性狀的QTL 簇[30]。
本研究利用豆麥×石4185 構建的重組自交系群體和186 份自然群體為研究材料, 使用90K SNP 芯片進行基因分型, 利用3 個環境下的胚芽鞘長度表型數據對控制小麥胚芽鞘長度的基因進行了QTL 定位和全基因組關聯分析, 以期為培育長胚芽鞘小麥新品種提供基因資源和種質資源。
QTL定位利用的材料為以豆麥(原豐6號經鈷-60輻射培育而成的核生2號的衍生品系)和石4185 (利用太谷核不育, 植8094、寶豐7228、石84-7120聚合雜交選育而成)為親本構建的重組自交系群體(recombinant inbred line, RIL), 該群體通過單籽粒傳法創建, 共包含275個家系。關聯分析材料由國內外收集的186份小麥品種(系)組成, 其中國內材料有154份, 主要來自安徽(15份)、北京(10份)、河北(17份)、河南(46份)、寧夏(2份)、山東(31份)、陜西(26份)、山西(5份)、四川(1份)、新疆(1份)共10個省市區, 國外材料有32份。186份自然群體材料、豆麥/石4185 RIL群體及其親本材料分別于2020—2021年種植在河南新鄉、2020—2021年和2021—2022年種植在山東青島, 種子收獲后用于胚芽鞘長度測定。
從186 份自然群體材料、豆麥/石4185 RIL 群體及其親本材料中選取10 粒大小均勻一致、健康無損、已度過休眠期的種子于2021 年10 月和2022 年12 月播種于高10 cm, 直徑8 cm 的圓柱形花盆中,參照Rebetzke 等[10,12]方法確定播種深度約2 cm, 播種前灌水并適當按壓以保證種子播種深度一致。避光培養5 d 后用尺子測定幼苗胚芽鞘長度(coleoptile length, CL)[31], 即從鞘壁到鞘尖的距離。
利用IciMapping v4.1 中的ANOVA (analysis of variance)模塊計算廣義遺傳力, 采用各誤差來源項的均方(mean square, MS)進行相應方差估算, 公式如下[32]:
廣義遺傳力(H2)計算公式如下[33]:
Wen 等[34]基于90K SNP 芯片構建了豆麥/石4185 RIL 群體的遺傳圖譜, 基于該遺傳圖譜和3 個環境下的表型及 BLUE 值, 利用軟件 IciMapping v4.1 (https://isbreeding.caas.cn/index.htm)[35]中的完備區間作圖法(inclusive composite interval mapping,ICIM)進行胚芽鞘長度QTL 定位[36], LOD 顯著性閾值設為2.5。
本研究中186 份自然群體使用90K iSelect SNP芯片進行基因型檢測, 該芯片包含81,587 個SNP 標記, 剔除SNP 標記中沒有染色體定位信息、缺失率>90%、雜合率>90%和最小等位基因頻率(minor allele frequency, MAF)<0.05 的低質量SNP, 最后保留了22,493 個高質量的SNP 標記進行關聯分析[37]。為避免親緣關系和群體結構造成假陽性, 將親緣關系(Kinship)和群體結構(PCA)作為協變量, 采用TASSEL v5.0 中的混合線性模型(mixed linear model,MLM)進行關聯分析[38-39]。P=1.0×10-3(-log10(P)=3.0)作為胚芽鞘長度關聯分析的顯著性閾值; Manhattan圖和Q-Q 圖由R v 3.5.1 的CMplot 程序包(https://github.com/YinLiLin/CMplot)繪制。
首先, 利用與胚芽鞘長度相關的顯著QTL 位點側翼標記序列與中國春參考基因組IWGSC RefSeq v2.1 (http://www.wheatgenome.org/)進行比對得到候選基因的物理位置。其次, 從國家水稻數據中心(http://www.ricedata.cn/gene/)和擬南芥信息資源(https://www.arabidopsis.org/)網站挖掘控制胚芽鞘長度的基因, 在小麥中尋找其同源基因, 并找到其基因組位置。最后, 將與顯著性標記物理位置鄰近的基因作為該QTL 的候選基因。
2.1.1 胚芽鞘長度表型分析 豆麥胚芽鞘長度在不同環境中的BLUE 值為5.40 cm; 石4185 相應表型值為4.54 cm。RIL 群體275 個家系3 個環境下的BLUE 值變異范圍為: 3.14~6.20 cm (均值4.29 cm,變異系數12.76%) (表1、圖1 和圖2)。RIL 群體胚芽鞘長度成連續型分布, 為典型多基因控制的數量遺傳性狀。對3 個環境下胚芽鞘長度的相關性分析表明, 胚芽鞘長度在不同環境間的相關系數為0.80~0.89, 廣義遺傳力為0.92, 說明遺傳因素對胚芽鞘長度具有較大貢獻(表2)。

圖2 豆麥/石4185 RIL 群體親本及其275 個家系胚芽鞘長度頻數分布圖Fig. 2 Distributions of coleoptile length for the parents and 275 lines of the Doumai/Shi 4185 RIL population

表1 豆麥/石4185 RIL 群體親本及其275 個家系胚芽鞘長度基本統計數據Table 1 Basic statistics of coleoptile length of two parents and 275 lines of the Doumai/Shi 4185 RIL population

表2 豆麥/石4185 RIL 群體親本及其275 個家系胚芽鞘長度在不同環境間相關性分析及廣義遺傳力Table 2 Correlations across environments and broad-sense heritability for coleoptile length of the parents and 275 lines of the Doumai/Shi 4185 RIL population
2.1.2 胚芽鞘長度QTL 定位 豆麥/石4185 RIL群體的遺傳連鎖圖譜總長2156.07 cM, 標記平均間距0.20 cM。其中A、B、D 基因組圖譜長度分別為839.71、770.64 和545.74 cM, 標記數量分別為4538 (41.31%)、5041 (45.89%)、1407 (12.81%), 標記平均間距分別為0.19、0.15 和0.39 cM[34]?;赪en等[34]構建的高密度遺傳連鎖圖譜, 采用完備區間作圖法(inclusive composite interval mapping, ICIM)對豆麥/石4185 RIL 群體胚芽鞘長度進行QTL 定位,將至少在兩個環境下定位到的QTL 作為穩定QTL,共定位到 2 個控制胚芽鞘長度的 QTL, 命名為QCL.qau-4BS和QCL.qau-6BL, 分別解釋表型變異率(phenotypic variation, PVE)為26.29%~28.46%和4.16%~4.36% (圖3 和表3)。

圖3 豆麥/石4185 RIL 群體胚芽鞘長度QTLFig. 3 QTL for coleoptile length identified in the Doumai/Shi 4185 RIL population

表3 豆麥/石4185 RIL 群體中定位到的胚芽鞘長度QTLTable 3 QTL for coleoptile length identified in the Doumai/Shi4185 RIL population
2.2.1 胚芽鞘長度表型分析 186 份自然群體材料胚芽鞘長度在不同的環境下均呈連續型分布, 3 個環境下表型BLUE 值為4.01 cm, 變異系數為13.7%,變異范圍廣, 適于全基因組關聯分析。不同環境間胚芽鞘長度相關系數為0.93~0.94。自然群體胚芽鞘長度的廣義遺傳力為0.91, 表明遺傳因素對胚芽鞘長度具有較大貢獻(表4 和圖4)。

圖4 186 份自然群體材料胚芽鞘長度頻數分布圖Fig. 4 Distributions of coleoptile length of the 186 natural population materials

表4 186 份自然群體材料胚芽鞘長度統計分析Table 4 Statistical analysis on coleoptile length evaluated on 186 natural population materials
2.2.2 親緣關系與群體結構分析 采用 Tassel v5.0 對本研究中的186 份自然群體材料進行Kinship分析, PCA 分析和進化樹分析, 結果表明186 份自然群體可以分為3 個亞群, 分別包含26、14、146 份材料(圖5)。
2.2.3 胚芽鞘長度GWAS 分析 基于混合線性模型下胚芽鞘長度BLUE 值Q-Q 圖表明該群體適于全基因組關聯分析, 顯著性較高的點為與小麥胚芽鞘長度相關的候選位點。在兩個及兩個以上環境中共檢測到36 個控制胚芽鞘長度的穩定QTL 位點, 包括1A (3)、1B (3)、1D (2)、2A (1)、3A (2)、3B (2)、4B (11)、5A (1)、5B (3)、6B (4)、7A (2)、7B (2) (表5 和圖6); 其中位于1A (499.03 Mb)、3A (73.06 Mb)、3B (19.95 Mb)、4B (24.28 Mb、40.43~40.59 Mb、648.74~648.87 Mb)、7A (36.31 Mb)染色體上的7 個位點在3 個環境及BLUE 值下被檢測到。

圖6 186 份自然群體材料胚芽鞘長度全基因組關聯分析Fig. 6 Genome wide association study of coleoptile length in 186 natural population materials

表5 基于MLM 模型在至少2 個環境下檢測到的CL 關聯位點Table 5 CL-associated loci detected in at least two environments by MLM
2.2.4 胚芽鞘長度候選基因分析 從擬南芥信息資源網站和國家水稻數據中心分別挖掘到140 個和14 個控制胚芽鞘長度的基因, 主要涉及植物激素信號轉導、酶、光信號轉導等途徑[41-49]。對關聯分析鑒定到的7 個穩定位點進行候選基因預測, 共預測到5個與胚芽鞘長度相關的基因。TraesCS1A03G0748300編碼擴展蛋白Expansin-A4;Rht1編碼DELLA 蛋白,參與赤霉素信號轉導途徑;TraesCS4B03G0110000和TraesCS4B03G0112200參與光信號轉導途徑;TraesCS7A03G0146600作為生長素響應啟動子, 參與生長素信號轉導途徑(表6)。

表6 CL 關聯位點候選基因Table 6 Candidate genes for the loci associated with CL
小麥胚芽鞘長度是典型的受多基因控制的數量性狀[53], 本研究對豆麥/石4185 RIL 群體進行QTL定位共檢測到2 個QTL 位點。通過與中國春小麥參考基因組IWGSC RefSeq v2.1 (http://www.wheatgenome.org/[40])比對發現, 其中QCL.qau-4BS(30.17~40.59 Mb)與Li 等[15]檢測到的Rht1(33.60 Mb)和Zhang 等[54]檢測到的qScl-4B(AX-110376140-AX-110455326, 34.90~41.10 Mb)在定位區間上有重疊,說明是同一位點, 該位點解釋表型變異率26.29%~28.46%。Xu 等[30]利用周8425B/中國春RIL 群體也定位到2 個主效QTL,QCL.qau-4BS和QCL.qau-4DS,解釋表型變異率9.10%~22.20%, 分別位于GA 不敏感的矮稈基因Rht1和Rht2附近。因此,QCL.qau-4BS的候選基因可能是Rht1。此外,QCL.qau-6BL(700.08~703.50 Mb)與Rebetzke 等[3,10]鑒定到的QCL_barc178(672.90 Mb)、QCL_gwm219(683.70 Mb)和QCL_wsnp_Ex_rep_c70767_69655253(702.20 Mb)以及Sidhu 等[28]檢測到的QCL.sdsu-6B(714.90 Mb)在位置上鄰近, 可能是相同位點, 解釋表型變異率4.16%~4.36%。該研究結果表明在不同的環境和遺傳群體中可重復鑒定到這2 個位點, 其中QCL.qau-4BS的候選基因Rht1對小麥胚芽鞘長度影響較大, 但位于6BL 染色體上的候選基因還未被克隆。
對186 份自然群體進行關聯分析發現, 位于1A(499.03 Mb)、3A (73.06 Mb)、3B (19.95 Mb)、4B(24.28 Mb、40.43~40.59 Mb、648.74~648.87 Mb)、7A (36.31 Mb)染色體上的7 個位點均在3 個環境及BLUE 值下被檢測到。其中位于3B 染色體19.95 Mb的QTL 位點與Singh 等[14]利用WL711×C306 構建的206 個重組自交系在3B 染色體上鑒定到qCL.3B.1(23.42 Mb)和qCL.3B.2(21.75 Mb)位置鄰近, 可能是同一位點。在4B 染色體上共鑒定到3 個控制胚芽鞘長度的QTL, 其中4B (24.28 Mb)染色體上的位點與Francki 等[55]鑒定到的QCL.daw.4B(27.31 Mb)和Nagel 等[56]鑒定到WMC617-barc199(17.50 Mb)和GWM894-barc193(27.70 Mb)位置鄰近, 可能是同一位點; 在豆麥/石4185 重組自交系群體和自然群體中都鑒定到位于4BS (40.43~40.59 Mb)染色體上的位點; 4B (648.74~648.87 Mb)染色體上IWB53155-IWB42023區段與Rebetzke 等[57]鑒定到的XksuC2(608.38 Mb)和 Sidhu 等[28]鑒定到QCL.sdsu-4BL(666.20 Mb)相距較遠, 可能是不同位點。Zhang 等[26]利用濰麥 8 號×洛旱 2 號(WL) RIL 群體鑒定到QCL-1A(515.38 Mb)與本研究在1A (499.03 Mb)染色體上鑒定到SNP 位點IWB50788可能是不同位點。此外, 本研究中鑒定到的3A (73.06 Mb)染色體上的SNP 位點IWB53051與Rebetzke 等[10]在3A (63.46 Mb)染色體鑒定到wsnp_Ku_c38911_47455924相距較遠, 推測其為新位點; 7A (36.31 Mb)染色體上SNP位點IWB11001與Zhang 等[26]在7A 染色體上鑒定到QCL-7A(18.04 Mb)和Rebetzke 等[10]在7A 染色體上鑒定到的wsnp_Ex_c61603_61581218(705.86 Mb)、wsnp_Ex_c42653_49180485(87.25 Mb)和wsnp_Ex_c43009_49439922(1.73 Mb)位置相距較遠, 該位點可能為新位點。綜上所述, 本研究通過關聯分析共鑒定到4 個新的控制胚芽鞘長度的QTL 位點, 連鎖標記分別為IWB50788、IWB53051、IWB53155-IWB42023和IWB11001。
對7 個關聯分析穩定位點進行候選基因預測,在 1A 染色體上挖掘到一個編碼擴展蛋白的基因TraesCS1A03G0748300, 其在水稻中的同源基因是OsEXP4,OsEXP4基因過表達后, 水稻胚芽鞘和中胚軸長度分別增加了31%和97%, 而反義苗的胚芽鞘和中胚軸長度分別減少了28%和43%, 表明擴展蛋白通過介導細胞壁松弛參與水稻幼苗生長[48]。Xu等[30]研究發現Rht1抑制小麥胚芽鞘伸長, 因此IWB70449(4B)位點的候選基因可能是Rht1。在Jiang等[50]和Perrella 等[51]的研究中發現AT5G39760、AT1G0957能夠感受光信號, 參與光形態建成, 進而調節擬南芥下胚軸發育, 其在小麥上的同源基因分別是TraesCS4B03G0110000和TraesCS4B03G0112200,是IWB54814(4B)的候選基因。Lin 等[52]研究發現生長素響應基因GH3.12(AT5G13320)可能參與ATPPI基因介導的下胚軸發育,GH3.12在小麥上的同源基因TraesCS7A03G0146600被預測為IWB11001(7A)的候選基因。
本研究從豆麥/石4185 RIL 群體鑒定到2 個與小麥胚芽鞘長度相關的位點, 分別是QCL.qau-4BS和QCL.qau-6BL。利用186 份自然群體共鑒定到36 個穩定的QTL 位點, 其中7 個位點在3 個環境中均能檢測到, 包括4 個控制小麥胚芽鞘長度的新位點,分別位于1A (499.03 Mb)、3A (73.06 Mb)、4B (648.74~648.87 Mb)和7A (36.31 Mb)染色體上。對7 個關聯分析得到的穩定QTL 進行候選基因預測, 共挖掘到5 個候選基因, 分別是TraesCS1A03G0748300、Rht1、TraesCS4B03G0110000、TraesCS4B03G0112200和TraesCS7A03G0146600。