王慧玲,閆愛玲,王曉玥,劉振華,任建成,徐海英,孫磊
葡萄果粒質量相關性狀全基因組關聯分析

1北京市農林科學院林業果樹研究所,北京 100093;2北京市落葉果樹工程技術研究中心,北京 100093;3農業農村部華北地區園藝作物生物學與種質創制重點實驗室,北京 100093
【目的】果粒大小是葡萄外觀和產量的重要構成因子之一,為受多基因調控的復雜數量性狀,挖掘葡萄果粒大小相關性狀的關鍵遺傳調控位點和基因,將有助于葡萄產量的提高。【方法】本研究以150份葡萄品種資源為材料,分別于2019年和2020年對葡萄果實單粒重、種子數目和種子質量等進行測定,并結合重測序獲得的高密度基因型數據進行全基因組關聯分析(genome-wide association study,GWAS),挖掘調控各性狀的遺傳位點和基因。【結果】各性狀在關聯群體中呈現廣泛的連續變異,變異系數為39.55%—68.89%;在不同年份均服從正態分布,符合數量性狀遺傳特征;相關性分析表明葡萄果實單粒重、種子數目和種子質量呈顯著正相關。全基因組關聯分析共檢測到150個與果實單粒重顯著關聯的SNP,在2019年檢測到99個SNP,解釋表型變異的14.48%—25.59%;在2020年檢測到73個SNP,解釋表型變異的16.08%—26.83%;其中24個SNP位點在兩個年份均檢測到,主要位于1號、5號、11號和16號染色體。相較于果實單粒重,檢測到的與種子數目顯著關聯的SNP較少,2019年檢測到1個顯著性SNP,表型解釋率為24.29%;2020年檢測到17個顯著性SNP,均位于18號染色體。兩個年份檢測到與種子質量顯著關聯的SNP分別有1個和2個,位于18號染色體,解釋表型變異的23.59%—48.29%。在兩年重復檢測到SNP位點基因組區域內,根據基因功能注釋篩選出11個可能與果實單粒重相關的候選基因,其中包括乙烯信號通路基因(基因ID:VIT_05s0049g00490、VIT_05s0049g00500、VIT_05s0049g00510和VIT_16s0100g00400)、赤霉素信號途徑基因(基因ID:VIT_11s0016g04630和VIT_16s0022g02310)、生長素響應蛋白基因(基因ID:VIT_11s0016g05640)和一些重要的轉錄因子基因(基因ID:VIT_05s0049g00460、VIT_11s0016g05660和VIT_16s0022g02330)。在18號染色體鑒定到與種子含量相關的候選基因(基因ID:VIT_18s0041g01880,編碼MADS-box蛋白AGL11),位于該基因上的SNP基因型變化顯著影響葡萄果實種子數目和質量。【結論】結合兩個年份的表型數據,共檢測到150個與果實單粒重顯著關聯的SNP,主要定位于1號、5號、11號和16號等染色體;檢測到19個與種子含量關聯的SNP,主要定位于18號染色體。基于基因注釋和基因型分析結果,確定了包含VIT_11s0016g04630和VIT_16s0022g02310等在內的11個候選基因可能參與調控葡萄果實單粒重,確定候選基因(基因ID:VIT_18s0041g01880)與種子含量顯著相關。
葡萄;果粒大小;全基因組關聯分析;候選基因
【研究意義】葡萄是世界上種植最廣泛的園藝作物之一,全球種植面積約750萬hm2,2018年產量為7 780萬t,其中36%是鮮食葡萄(http://faostat.fao.org)。果粒大小是鮮食葡萄的重要農藝性狀之一,影響著消費者的偏好和接受度,同時決定最終的產量。因此,果粒大小一直是葡萄育種者主要關注的性狀之一。闡明果粒大小相關性狀的遺傳基礎,將有助于理解葡萄果實發育的分子調控機制,且為提高傳統育種的準確性和效率奠定基礎。【前人研究進展】在葡萄中,果粒大小存在廣泛的變異。平均而言,成熟時的果實單粒重在0.5—11 g,種子數在0—6個,每個漿果的種子重量在0.03—0.22 g[1]。種子有無與果粒大小密切相關,大多數無核葡萄品種自然條件下果粒偏小[2]。與大多數葡萄農藝性狀相同,葡萄果粒大小及其相關性狀是由多種基因和環境因素共同作用產生的數量性狀[3]。前人利用不同的遺傳群體,研究了果粒大小或其相關性狀表型變異的遺傳決定因素。在以無核品種為親本的雜交群體中,與果實單粒重相連鎖的主效數量性狀遺傳位點(quantitative trait loci,QTL)主要被定位于第18號染色體上,與已知的無核位點共定位[4-5]。Doligez等[3]利用4個不同的雜交群體,在1號、8號、11號、17號和18號染色體檢測到與果實單粒重相連鎖的QTL位點,其中位于17號連鎖群的QTL位點表型解釋率達到31%。CORREA等[6]在‘紅寶石無核’和‘無核白’雜交后代群體中,鑒定到2個與果粒大小相關的QTL位點,分別位于2號和18號染色體。同年HOUEL等[7]在微型葡萄(microvine)群體中鑒定到一個新的位于7號染色體的主效QTL位點。而BAN等[8]利用一個具有歐美品種遺傳背景的雜交群體,連續4年在11號染色體發現一個穩定的QTL位點。近年來,全基因組關聯分析(genome wide association analysis,GWAS)已經廣泛應用于各種植物重要性狀基因挖掘[9-10]。在葡萄中,GUO等[11]對167份葡萄核心種質進行了低覆蓋度的重測序分析,將果實單粒重性狀定位到17號、18號和19號等染色體。而FLUTRE等[12]分別在1號、2號、8號、11號、15號和17號等染色體鑒定到與果實單粒重顯著關聯的基因位點。此外,利用全基因組關聯分析,除了18號染色體,ZHANG等[13]在5號、6號、10號和17號等染色體也檢測到與種子含量顯著關聯的基因位點。【本研究切入點】采用不同的群體材料,鑒定到不同的遺傳位點信息,說明果粒大小是復雜的數量性狀,需要利用遺傳背景更廣泛的群體進行研究。另外,之前的研究多采用遺傳群體,由于群體個數有限,作圖精度低,導致定位到的等位基因較少。相較于傳統的連鎖分析,關聯分析是以連鎖不平衡為基礎,分析標記候選基因的遺傳變異與某一群體內目標性狀關系的方法。選用不同來源的自然群體作為分析對象,所研究的等位基因更豐富,更容易找到目標性狀的多個微效基因,有利于數量性狀的基因定位。【擬解決的關鍵問題】本研究以150份葡萄品種資源群體為材料,結合重測序獲得的葡萄全基因組基因型數據,通過對葡萄果粒大小相關性狀開展GWAS分析,解析葡萄果粒大小相關性狀的遺傳基礎,挖掘出重要的調控基因位點,提高對葡萄果粒大小形成的遺傳結構和分子機制的認識,為進一步克隆調控葡萄果粒大小的關鍵基因,加速優良葡萄新品種培育及種質改良奠定基礎。
供試材料選取150份葡萄品種(附表1),該群體具有廣泛的果粒大小相關性狀變異。供試葡萄植株種植于北京市農林科學院林業果樹研究所葡萄資源圃(北緯39°58′,東經116°13′),單臂籬架水平龍干整形,株行距0.8 m×2 m,南北走向,采用簡易避雨、地表園藝地布覆蓋、滴灌供水和常規病蟲害等管理模式,生長期內修剪及肥水管理一致,樹勢基本相同。
1.2.1 樣品采集 于2019年4月初萌芽期采取嫩葉,用液氮速凍保存于-80℃冰箱,用于后續DNA提取。
分別于2019—2020年8—10份進行成熟果實樣品采集。果實成熟度依據往年物候期記載和果實可溶性固形物含量(oBrix≥16)確定。由于機械損傷(埋土防寒)、坐果不良或果實腐爛,每年采集的樣本數量各不相同。2019年和2020年分別采集到139份和135份葡萄品種果實樣品。針對每個葡萄單株分別在陽面和陰面隨機挑取3穗果,從不同位置選取10—20個果實作為一個重復,用于后期性狀表型調查,3次重復。
1.2.2 葡萄果粒大小相關性狀調查 分別對葡萄果實單粒重(BW)、種子數(SN)和種子質量(SW)進行測量分析,測量方法參照劉崇懷等[14]編著的《葡萄種質資源描述規范和數據標準》。
1.2.3 葡萄葉片DNA提取和全基因組重測序 葡萄葉片DNA提取采用植物DNA提取試劑盒(北京天根生物技術有限公司),并利用瓊脂糖凝膠電泳檢測DNA的完整性和純度。檢測合格的DNA樣品通過Covaris破碎機隨機打斷成長度為350 bp的片段,經末端修復、加ployA尾、加測序接頭、純化、PCR擴增等步驟完成整個文庫制備。構建好的文庫通過Illumina HiSeqPE150進行測序。
針對原始測序數據,進行過濾,過濾的過程如下:(1)去除接頭(Adapter)序列;(2)去除含N比例大于10%的reads;(3)去除低質量reads(質量值Q≤20的堿基數占整條read的50%以上)。進一步利用比對軟件BWA將數據比對到參考基因組(http:// plants.ensembl.org/Vitis_vinifera/Info/Index),利用Picard(Picard: http://sourceforge.net/projects/picard/)對比對結果進行排序并標記重復序列。使用軟件GATK獲得變異數據集,檢測到的變異進一步過濾獲得高質量標記:(1)非二等位位點去除;(2)第二等位基因頻率(minor allele frequency,MAF)小于0.05的位點去除;(3)缺失率大于0.5的位點去除;(4)雜合比例大于0.8的位點去除。
1.2.4 全基因組關聯分析(GWAS) 使用Admixture軟件(v1.3)[15]進行群體結構的推斷。使用PopldDecay軟件(v3.41)[16]計算兩兩標記間的LD大小(2),繪制連鎖不平衡的衰減圖。使用gemma軟件(v0.98.1)[17]進行GWAS分析,采用GWAS常用模型(GLM、GLM(Q)、MLM(K)、MLM(QK))進行計算。Admixture最優K值對應的群體結構矩陣作為相應模型的Q矩陣,gcta軟件計算的樣品間親緣關系矩陣作為相應模型的K矩陣。
1.2.5 候選基因篩選(GO、KEGG注釋分析) 根據果粒大小相關性狀顯著關聯的SNP標記在葡萄參考基因組中的物理位置,篩選顯著SNP位點上下游LD衰減距離區域范圍內的候選基因。利用Ensemble Plants數據庫(http://plants.ensembl.org/index.html/)及美國國立生物技術信息中心數據庫(https://www.ncbi. nlm.nih.gov/)對候選基因進行功能注釋和預測。
1.2.6 數據處理與統計分析 應用Excel 2007和SPSS 13.0軟件對性狀表型數據進行描述性統計分析和數據分布統計,并運用Pearson相關系數進行性狀相關性分析,最低顯著水平<0.01。采用SPSS中paired-samplestest進行顯著關聯標記等位效應分析。
分別于2019年和2020年對150份葡萄品種進行果實單粒重(BW)、種子數量(SN)和種子質量(SW)調查,基本統計分析(表1)表明,2019年關聯群體果實單粒重、種子數量和種子質量均值分別為(5.62± 2.37)g、(2.23±1.15)個和(0.34±0.22)g;2020年相應各個性狀均值分別為(5.92±2.44)g、(2.20±0.87)個和(0.45±0.31)g;不同年份各性狀在關聯群體中呈現廣泛的連續變異,變異系數為39.55%—68.89%。對各個性狀的偏度和峰度進行計算,絕對值均小于1,表明這些性狀在不同年份均服從正態分布。結合各自的頻率分布直方圖可以看出(圖1),果實單粒重表型數據基本呈現正態分布,種子數量和種子質量呈現非對稱性的雙峰分布,并不符合常規的單峰正態分布;各個性狀均表現數量性狀遺傳特征。

表1 葡萄果粒大小相關性狀描述性統計

圖1 葡萄果粒大小相關性狀頻率分布
不同年份關聯群體果實單粒重、種子數目和質量的Pearson相關分析表明(表2),果實單粒重與種子數目、種子質量在兩個年份均呈顯著正相關,種子數目和質量在兩個年份呈顯著正相關,說明各性狀之間相互影響,相互協同。此外,相同性狀在不同年份也呈現顯著正相關,表明各個性狀主要受遺傳因素影響。

表2 葡萄果粒大小性狀相關系數
2019BW:2019年單粒重;2019SN:2019年種子數目;2019SW:2019年種子質量;2020BW:2020年單粒重;2020SN:2020年種子數目;2020SW:2020年種子質量
2019BW: Berry weight in 2019; 2019SN: Seed number in 2019; 2019SW: Seed weight in 2019; 2020BW: Berry weight in 2020; 2020SN: Seed number in 2020; 2020SW: Seed weight in 2020. *:<0.05; **:<0.01
通過軟件PopLDdecay以2降低到全染色體最大值(0.3702)一半時的物理距離作為LD衰減距離(圖2-A),計算為1.8 kb。根據連鎖不平衡衰減圖可見,隨著物理距離的增加,2值急劇下降,表明這些群體在演化過程中重組率較大,關聯分析所需要的SNP密度更大,但相應能獲取更小的候選區間,篩選候選基因更加容易。通過Admixture軟件分析,當交叉驗證錯誤率最低時,K值為4,因此,可將亞群根據群體的基因型情況細分為4個。將K=4時所對應的群體結構矩陣作為后續關聯分析所用矩陣(圖2-B)。

圖2 群體連鎖不平衡(LD)和群遺傳結構分析
連續2年結合果實單粒重、種子數目和種子質量等性狀表型數據進行GWAS分析,基于0.01/SNP總數作為顯著關聯的SNP標記篩選閾值。2019年,共檢測到與果粒單重相關的顯著SNP有99個,主要位于1號、3號、5號、7號、11號、15號、16號、17號和19號染色體上,表型解釋率在14.48%—25.59%(圖3-A、附表2);2020年,共檢測到與果粒單重相關的顯著SNP有73個,主要位于1號、5號、11號、16號和17號染色體,解釋表型變異的16.08%— 26.83%(圖3-B、附表2)。相較于果粒單重,檢測到的與種子數目顯著關聯的SNP較少,2019年僅檢測到1個顯著性SNP(圖3-C、附表2),表型解釋率為24.29%;2020年檢測到17個顯著性SNP(圖3-D、附表2),均位于18號染色體,表型解釋率在16.42%—30.48%。兩個年份檢測到與種子質量顯著關聯的SNP分別有1個(2019,圖3-E)和2個(2020,圖3-F),位于18號染色體,解釋表型變異的23.59%— 48.29%(附表2)。

A—B:分別表示2019和2020年葡萄果實單粒重GWAS分析結果;C—D:表示兩個年份種子數量GWAS分析結果;E—F:表示兩個年份種子質量GWAS分析結果。橫坐標為各染色體從小到大排列的物理位置,一個點代表一個SNP位點,縱坐標為p值取-log10后對應數值;紅色橫虛線位置為0.01/SNP總數的負對數,藍色虛線為0.05/SNP總數的負對數,高于閾值的點為關聯顯著位置
為了保證關聯位點的可靠性,進一步篩選兩個年份同時檢測到的顯著SNP位點作為后期候選基因挖掘重點區域,由結果可見(表3、附表2),24個與果粒單重顯著關聯的SNP在兩個年份重復被檢測到,分別位于1號、5號、11號和16號染色體上。其中1號染色體有1個SNP位點,2019年和2020年的表型解釋率分別為23.45%和23.30%;5號染色體上檢測到位于7 537 999和9 220 655位置的兩個SNP位點,兩個年份表型解釋率分別為21.59%、22.03%和22.19%、23.47%;11號染色體上有19個SNP在兩個年份均被檢測到,表型解釋率范圍16.03%—27.69%;最后兩個SNP位點位于16號染色體,14 893 081位點表型解釋率分別為18.70%(2019年)和18.45%(2020年);15 790 424位點2019年和2020年表型解釋率分別為18.55%和18.45%。與種子數目關聯的顯著SNP在兩個年份同時檢測到1個SNP位點,2019年和2020年表型解釋率分別為24.29%和25.67%。而兩個年份均檢測到的與種子質量顯著關聯的SNP也是1個,表型解釋率達到40.11%(2019年)和48.29%(2020年)。

表3 葡萄果粒大小相關性狀全基因組關聯分析兩年同時檢測到的重合顯著性位點信息
依據該群體的LD衰減距離(圖2-A),在26個位點的基因組區段內共檢測到76個基因,結合基因功能注釋和前人報道,篩選出11個候選基因可能參與果實大小發育過程(表4)。其中與單粒重相關的基因有VIT_01s0150g00260(編碼E3泛素蛋白連接酶)、VIT_05s0049g00460(編碼轉錄因子bHLH104)、VIT_05s0049g00490—VIT_05s0049g00510(編碼乙烯響應轉錄因子)、VIT_11s0016g04630(編碼DELLA蛋白SLR1)、VIT_11s0016g05640(編碼生長素響應蛋白IAA9)、VIT_11s0016g05660(編碼轉錄因子MYB82)、VIT_16s0022g02310(編碼赤霉素-20-氧化酶)、VIT_16s0022g02330(編碼MADS-box轉錄因子6)和VIT_16s0100g00400(乙烯響應轉錄因子ERF027)。與種子數目和質量相關的基因有VIT_ 18s0041g01880(編碼MADS-box蛋白AGL11)。

表4 位于檢測顯著位點區域已發表的可能參與葡萄種子和/或漿果發育的功能候選基因
為進一步確定可能的候選基因,針對與候選基因關聯的7個SNP位點的等位變異效應進行分析,6個與單粒重性狀顯著關聯的SNP位點在本群體中呈現3種基因型,與種子數量和質量關聯的SNP在本群體中檢測到2個基因型。由圖4可見,每個SNP的等位變異在兩個年份的果實大小相關性狀均達到顯著水平。例如,SNP 5_7537999位點G/A和A/A等位變異在兩個年份的平均果實單粒重顯著高于G/G等位變異;SNP 18_26889437不同基因型對種子數目和質量均有顯著影響。該結果進一步說明與該標記關聯的候選基因可能在調控葡萄果粒大小方面發揮重要的作用。
在雜交后代遺傳群體中的研究表明,葡萄果實單粒重呈現豐富的遺傳變異,遵循多基因控制的數量性狀遺傳特征[2-8]。本研究結果顯示兩個年份果實單粒重性狀在群體中均表現出連續的變異,這與之前另外的自然群體研究結果一致[11];并且在不同年份之間該性狀表型存在明顯的波動,進一步表明葡萄果實單粒重屬于復雜的數量性狀,可能受到基因和環境因子等多方面調控。此外,HOUEL等[1]調查多個葡萄品種平均單粒重發現,成熟時的果實單粒重在0.5—11 g,這與本研究結果相似。種子數目和種子質量在本研究群體中呈現雙峰分布,前期研究者在多個雜交后代群體中發現相似的分布規律,第一個峰主要代表無核個體的分布,而第二個峰代表有核個體的分布,進一步確定葡萄果實種子的有無受一個主效遺傳位點SDI控制,而有核個體中種子含量為多基因控制的數量性狀[2-5]。

SNPs 1_22639484、5_7537999、11_39611705、11_5164917、16_14893081和16_15790424分別與候選基因VIT_01s0150g00260、VIT_05s0049g00460 —VIT_05s0049g00510、VIT_11s0016g05640—VIT_11s0016g05660、VIT_16s0022g02310—VIT_16s0022g02330關聯;SNP 18_26889437位于候選基因VIT_18s0041g01880內;**和*分別表示0.01和0.05顯著水平
此外,本研究還發現在本群體中,果實單粒重和種子數目、種子質量在兩個年份均表現顯著正相關。已有研究表明葡萄果實單粒重和種子含量之間的相關性在不同群體中表現不同,在有核品種內[27-28],無核分離群體內[2-5],以及由有核和無核葡萄育種群體組成的群體內[29],經常觀察到果實單粒重和種子含量之間具有正相關關系。但是在另外一些群體中,種子含量和漿果大小之間沒有發現顯著的相關性[1]。一般認為,果粒大小與種子含量之間的相關性主要來自種子產生的生長調節劑[3]。
基于表型數據,本研究兩個年份共檢測到與葡萄果實單粒重顯著關聯的SNP位點有150個,分別位于1號、3號、5號、7號、11號、15號、16號、17號和19號等染色體上,其中位于1號、5號、11號和16號染色體上的24個與果粒單重顯著關聯的SNP在兩個年份均檢測到,說明這些位點受環境影響較小,可在不同環境下穩定遺傳,可能存在調控果實單粒重的重要調控因子。利用不同的雜交后代遺傳群體,研究者也分別在1號[3-4]、5號[30]、11號[3,8]染色體上鑒定到穩定的數量性狀遺傳位點(QTL),與本研究結果一致。此外,還分別在2號、7號、8號、17號、18號等染色體檢測到與果粒單重相連鎖的QTL位點,其中位于17號連鎖群的QTL位點表型解釋率較高[3-8]。在本群體中,盡管連續兩年均在17號染色體檢測到顯著性關聯位點,但是SNP位置略有差異,并未在2號、8號和18號等染色體檢測到顯著性位點。但是本群體中檢測到新的位于16號染色體的顯著關聯SNP位點,且其中1個SNP連續兩年均被檢測到。值得注意的是,本研究中兩個年份在11號染色體重復檢測到19個顯著關聯SNP。BAN等[8]利用一個種間雜交群體在11號染色體確定了葡萄果實單粒重主效QTL。DOLIGEZ等[3]和RICHTER等[31]也在歐亞種雜交群體中報道了位于11號染色體上的QTL。這些結果說明在該染色體區域存在重要的調控葡萄果實單粒重的基因。
種子含量作為葡萄的重要性狀,研究者已經利用不同的群體確定了位于18號染色體上的該性狀主效調控遺傳位點SDI[4,26]。在本研究群體中,也在18號染色體檢測到與種子數目和質量顯著關聯的SNP位點,且與SDI位點物理位置一致(表3)。ZHANG等[13]利用199份葡萄種質進行全基因組關聯分析,還分別在5號、6號、10號和17號染色體鑒定到與無核顯著關聯的SNP位點。ZINELABIDINE等[32]還在8號、11號、12號、14號、16號等染色體檢測到與種子數目顯著關聯的基因位點;而在本研究群體中,并未檢測到相同的基因位點,這可能與群體大小和不同的遺傳背景相關。關于種子數目,本群體中2019年在7號和16號染色體鑒定到新的SNP位點。
針對兩年重復檢測到的SNP位點基因組區域,進行關鍵候選基因挖掘和篩選,最終確定11個候選基因可能參與調控葡萄果實大小形成。植物激素可以調節各種植物生長發育過程,包括果實發育和果實大小,以響應環境和內源信號。乙烯作為一種重要的植物激素,通過抑制或者刺激生長在各種植物發育過程中發揮著作用[33]。最近,科學家分離到一種乙烯響應因子(AP2/ERF轉錄因子,EXCESSIVE NUMBER OF FLORAL ORGANS (ENO)),并報道其參與番茄果實大小的調節[20]。本研究分別在5號和16號染色體顯著關聯SNP位點區域鑒定到編碼乙烯響應轉錄因子的基因(基因ID:VIT_05s0049g00490、VIT_05s0049g00500、VIT_05s0049g00510和VIT_16s0100g00400)。與這些基因緊密關聯的SNP分子標記基因型改變會導致果粒大小顯著變化(圖4),說明這些基因可能在調控葡萄果實大小方面發揮著重要作用。
此外,本研究在11號染色體顯著關聯區域鑒定到一個編碼DELLA蛋白基因(基因ID:VIT_11s0016g04630)。DELLA蛋白是植物生長發育過程中響應赤霉素(GA)應答途徑的關鍵調控因子,主要行使轉錄調控因子的功能,幾乎參與了植物生長發育的各個重要過程[34]。已有的研究表明,GA在葡萄果實種子形成和果實大小方面發揮著重要的作用,合適濃度的GA處理可以促進葡萄果實增大[35]。在湯普森無核葡萄中,GA信號通過DELLAs、GA受體以及兩個GA特異性F-box蛋白傳導并發揮作用,DELLA蛋白與不同器官對外源性GA的反應有關[36]。此外,在16號染色體顯著性SNP位點區域還鑒定到VIT_16s0022g02310,該基因編碼赤霉素-20-氧化酶。在梨果實的研究中,科學家發現赤霉素-20-氧化酶可以通過改變赤霉素合成途徑加強GA4合成從而促進坐果及果實發育[24]。結合關聯分子標記等位變異效應分析結果,本研究獲得的兩個基因可能在介導GA調控葡萄果實大小方面具有重要的作用。在11號染色體顯著關聯區域還鑒定到一個編碼生長素響應蛋白(auxin-responsive protein IAA9)的基因(基因ID:VIT_11s0016g05640)。生長素通過調節細胞分裂和細胞伸長,控制植物的生長發育。之前的研究表明,生長素對葡萄果實發育具有重要的調控作用[37]。Aux/IAA作為調控生長素信號通路的主要基因家族之一,也已在番茄中被證明與果實大小相關[22]。
轉錄因子作為基因表達的調控因子,在植物發育和對激素信號的響應中發揮著重要作用[38]。已有的研究報道bHLH蛋白在肉質果實發育過程中通過調控生長素及赤霉素對于果實大小發揮作用[39]。葡萄中的MYB5b轉錄因子在番茄中誘導矮化、葉片結構的改變、花形態的改變等,果實和葉片的掃描電鏡證實了細胞大小和形狀的改變[40]。多個MADS-box轉錄因子6的基因在其他果樹作物中影響果實大小發育[25]。本研究在5號、11號和16號染色體顯著關聯SNP位點區域分別檢測到編碼bHLH104、MYB82和MADS-box轉錄因子6的基因,且與這些轉錄因子關聯的分子標記基因型變化對表型具有顯著的影響(圖4),推測這些基因可能參與調控葡萄果粒大小形成,但是基因具體的功能需要后期通過轉基因和基因敲除等技術驗證。
本研究在18號染色體鑒定到與種子含量相關的候選基因(基因ID:VIT_18s0041g01880),該基因已被證明為無核性狀主效調控位點SDI的候選基因,并且報道位于該基因上chr18:26889437位置SNP基因型的改變是導致無核的主要原因[26]。在本研究群體中檢測到相同位置的SNP位點,該SNP表型解釋率達到48%(表3),且該SNP基因型改變顯著影響種子含量(圖4),可以作為后期無核性狀篩選的分子標記。綜上,本研究結果進一步證實了葡萄果粒質量相關性狀的多基因性質,其受到不同染色體上許多基因位點的調控[2-8]。基于其復雜的遺傳基礎,需要在單個葡萄基因型中聚合多個有益的QTL等位基因,以通過加性互補機制提高葡萄產量[41]。此外,鑒定到的與表型顯著關聯的SNP信息,可以為后期通過基因編輯技術定向改良這些遺傳位點提供參考依據。
連續兩年對葡萄果實單粒重、種子數目和種子質量3個相關性狀進行全基因組關聯分析,共檢測到169個與性狀顯著關聯的SNP位點。其中,與果實單粒重顯著關聯的26個SNP位點在兩年被同時檢測到,主要位于1號、5號、11號、16號和18號染色體。在重復檢測到SNP位點的基因組區段中,篩選出11個可能與果實單粒重相關的候選基因。種子數目和質量性狀在兩年分別重復檢測到1個SNP位點,篩選出與種子數目和質量相關的候選基因(基因ID:VIT_18s0041g01880)。
[1] HOUEL C, MARTIN-MAGNIETTE M L, NICOLAS S D, LACOMBE T, LE CUNFF L, FRANCK D, TORREGROSA L, CONéJéRO G, LALET S, THIS P, ADAM-BLONDON A F. Genetic variability of berry size in the grapevine (L.). Australian Journal of Grape and Wine Research, 2013, 19(2): 208-220.
[2] CABEZAS J A, CERVERA M T, RUIZ-GARCíA L, CARRE?O J, MARTíNEZ-ZAPATER J M. A genetic analysis of seed and berry weight in grapevine. Genome, 2006, 49(12): 1572-1585.
[3] DOLIGEZ A, BERTRAND Y, FARNOS M, GROLIER M, ROMIEU C, ESNAULT F, DIAS S, BERGER G, FRAN?OIS P, PONS T, ORTIGOSA P, ROUX C, HOUEL C, LAUCOU V, BACILIERI R, PéROS J P, THIS P. New stable QTLs for berry weight do not colocalize with QTLs for seed traits in cultivated grapevine (L.). BMC Plant Biology, 2013, 13: 217.
[4] MEJíA N, GEBAUER M, MU?OZ L, HEWSTONE N, MU?OZ C, HINRICHSEN P. Identification of QTLs for seedlessness, berry size, and ripening date in a seedless × seedless table grape progeny. American Journal of Enology and Viticulture, 2007, 58(4): 499-507.
[5] COSTANTINI L, BATTILANA J, LAMAJ F, FANIZZA G, GRANDO M S. Berry and phenology-related traits in grapevine (L.): From quantitative trait loci to underlying genes. BMC Plant Biology, 2008, 8: 38.
[6] CORREA J, RAVEST G, LABORIE D, MAMANI M, TORRES E, MU?OZ C, PINTO M, HINRICHSEN P. Quantitative trait loci for the response to gibberellic acid of berry size and seed mass in tablegrape (L.). Australian Journal of Grape and Wine Research, 2015, 21(3): 496-507.
[7] HOUEL C, CHATBANYONG R, DOLIGEZ A, RIENTH M, FORIA S, LUCHAIRE N, ROUX C, ADIVèZE A, LOPEZ G, FARNOS M, PELLEGRINO A, THIS P, ROMIEU C, TORREGROSA L. Identification of stable QTLs for vegetative and reproductive traits in the microvine (L.) using the 18 K Infinium chip. BMC Plant Biology, 2015, 15: 205.
[8] BAN Y, MITANI N, SATO A, KONO A, HAYASHI T. Genetic dissection of quantitative trait loci for berry traits in interspecific hybrid grape (×). Euphytica, 2016, 211(3): 295-310.
[9] 張芳, 任毅, 曹俊梅, 李法計, 夏先春, 耿洪偉. 基于SNP標記的小麥籽粒性狀全基因組關聯分析. 中國農業科學, 2021, 54(10): 2053-2064.doi: 10.3864/j.issn.0578-1752.2021.10.002.
ZHANG F, REN Y, CAO J M, LI F J, XIA X C, GENG H W. Genome-wide association analysis of wheat grain size related traits based on SNP markers. Scientia Agricultura Sinica, 2021, 54(10): 2053-2064. doi: 10.3864/j.issn.0578-1752.2021.10.002. (in Chinese)
[10] 崔承齊, 劉艷陽, 江曉林, 孫知雨, 杜振偉, 武軻, 梅鴻獻, 鄭永戰. 芝麻產量相關性狀的多位點全基因組關聯分析及候選基因預測. 中國農業科學, 2022, 55(1): 219-232.doi: 10.3864/j.issn.0578-1752. 2022.01.018.
CUI C Q, LIU Y Y, JIANG X L, SUN Z Y, DU Z W, WU K, MEI H X, ZHENG Y Z. Multi-locus genome-wide association analysis of yield-related traits and candidate gene prediction in sesame(L.). Scientia Agricultura Sinica, 2022, 55(1): 219-232. doi: 10.3864/j.issn.0578-1752.2022.01.018. (in Chinese)
[11] GUO D L, ZHAO H L, LI Q, ZHANG G H, JIANG J F, LIU C H, YU Y H. Genome-wide association study of berry-related traits in grape [L.]based on genotyping-by-sequencing markers. Horticulture Research, 2019, 6: 11.
[12] FLUTRE T, LE CUNFF L, FODOR A, LAUNAY A, ROMIEU C, BERGER G, BERTRAND Y, TERRIER N, BECCAVIN I, BOUCKENOOGHE V, ROQUES M, PINASSEAU L, VERBAERE A, SOMMERER N, CHEYNIER V, BACILIERI R, BOURSIQUOT J M, LACOMBE T, LAUCOU V, THIS P, PéROS J P, DOLIGEZ A. A genome-wide association and prediction study in grapevine deciphers the genetic architecture of multiple traits and identifies genes under many new QTLs. G3: Genes|Genomes|Genetics, 2022, 12(7): jkac103.
[13] ZHANG H, FAN X C, ZHANG Y, JIANG J F, LIU C H. Identification of favorable SNP alleles and candidate genes for seedlessness inL. using genome-wide association mapping. Euphytica, 2017, 213(7): 136.
[14] 劉崇懷, 沈育杰, 陳俊. 葡萄種質資源描述規范和數據標準. 北京: 中國農業出版社, 2006.
LIU C H, SHEN Y J, CHEN J. Descriptors and data standard for grape (L.). Beijing: China Agriculture Press, 2006. (in Chinese)
[15] ALEXANDER D H, NOVEMBRE J, LANGE K. Fast model-based estimation of ancestry in unrelated individuals. Genome Research, 2009, 19(9): 1655-1664.
[16] ZHANG C, DONG S S, XU J Y, HE W M, YANG T L. PopLDdecay: A fast and effective tool for linkage disequilibrium decay analysis based on variant call format files. Bioinformatics, 2019, 35(10): 1786-1788.
[17] ZHOU X, STEPHENS M. Genome-wide efficient mixed-model analysis for association studies. Nature Genetics, 2012, 44(7): 821-824.
[18] SONG X J, HUANG W, SHI M, ZHU M Z, LIN H X. A QTL for rice grain width and weight encodes a previously unknown RING-type E3 ubiquitin ligase. Nature Genetics, 2007, 39(5): 623-630.
[19] GU C, ZHOU Y H, SHU W S, CHENG H Y, WANG L, HAN Y P, ZHANG Y Y, YU M L, JOLDERSMA D, ZHANG S L. RNA-Seq analysis unveils gene regulation of fruit size cooperatively determined by velocity and duration of fruit swelling in peach. Physiologia Plantarum, 2018, 164(3): 320-336.
[20] YUSTE-LISBONA F J, FERNáNDEZ-LOZANO A, PINEDA B, BRETONES S, ORTíZ-ATIENZA A, GARCíA-SOGO B, MüLLER N A, ANGOSTO T, CAPEL J, MORENO V, JIMéNEZ-GóMEZ J M, LOZANO R. ENO regulates tomato fruit size through the floral meristem development network. Proceedings of the National Academy of Sciences of the United States of America, 2020, 117(14): 8187-8195.
[21] UPADHYAY A, MASKE S, JOGAIAH S, KADOO N Y, GUPTA V S. GA3 application in grapes (L.) modulates different sets of genes at cluster emergence, full bloom, and berry stage as revealed by RNA sequence-based transcriptome analysis. Functional & Integrative Genomics, 2018, 18(4): 439-455.
[22] SU L Y, BASSA C, AUDRAN C, MILA I, CHENICLET C, CHEVALIER C, BOUZAYEN M, ROUSTAN J P, CHERVIN C. The auxin sl-IAA17 transcriptional repressor controls fruit size via the regulation of endoreduplication-related cell expansion. Plant and Cell Physiology, 2014, 55(11): 1969-1976.
[23] MORI K, LEMAIRE-CHAMLEY M, ASAMIZU E, MIZOGUCHI T, EZURA H, ROTHAN C. Comparative analysis of common genes involved in early fruit development in tomato and grape. Plant Biotechnology, 2013, 30(3): 295-300.
[24] WANG H B, WU T, LIU J L, CONG L, ZHU Y F, ZHAI R, YANG C Q, WANG Z G, MA F W, XU L F.regulates fruit set and induces parthenocarpy by enhancing GA4content. Frontiers in Plant Science, 2020, 11: 113.
[25] IRELAND H S, YAO J L, TOMES S, SUTHERLAND P W, NIEUWENHUIZEN N, GUNASEELAN K, WINZ R A, DAVID K M, SCHAFFER R J. Apple SEPALLATA1/2-like genes control fruit flesh development and ripening. The Plant Journal, 2013, 73(6): 1044-1056.
[26] ROYO C, TORRES-PéREZ R, MAURI N, DIESTRO N, CABEZAS J A, MARCHAL C, LACOMBE T, IBá?EZ J, TORNEL M, CARRE?O J, MARTíNEZ-ZAPATER J M, CARBONELL-BEJERANO P. The major origin of seedless grapes is associated with a missense mutation in the MADS-box gene. Plant Physiology, 2018, 177(3): 1234-1253.
[27] FRIEND A P, TROUGHT M C T, CREASY G L. The influence of seed weight on the development and growth of berries and live green ovaries inL. cvs. Pinot Noir and Cabernet Sauvignon. Australian Journal of Grape and Wine Research, 2009, 15(2): 166-174.
[28] WALKER R R, BLACKMORE D H, CLINGELEFFER P R, KERRIDGE G H, RüHL E H, NICHOLAS P R. Shiraz berry size in relation to seed number and implications for juice and wine composition. Australian Journal of Grape and Wine Research, 2005, 11(1): 2-8.
[29] EBADI A, MOGHADAM J E, FATAHI R. Evaluation of 22 populations achieved from controlled crossing between some seeded × seedless grapevine cultivars. Scientia Horticulturae, 2009, 119(4): 371-376.
[30] FISCHER B M, SALAKHUTDINOV I, AKKURT M, EIBACH R, EDWARDS K J, T?PFER R, ZYPRIAN E M. Quantitative trait locus analysis of fungal disease resistance factors on a molecular map of grapevine. Theoretical and Applied Genetics, 2004, 108(3): 501-515.
[31] RICHTER R, GABRIEL D, RIST F, T?PFER R, ZYPRIAN E. Identification of co-located QTLs and genomic regions affecting grapevine cluster architecture. Theoretical and Applied Genetics, 2019, 132(4): 1159-1177.
[32] ZINELABIDINE L H, TORRES-PéREZ R, GRIMPLET J, BAROJA E, IBá?EZ S, CARBONELL-BEJERANO P, MARTíNEZ-ZAPATER J M, IBá?EZ J, TELLO J. Genetic variation and association analyses identify genes linked to fruit set-related traits in grapevine. Plant Science, 2021, 306: 110875.
[33] VANDENBUSSCHE F, VASEVA I, VISSENBERG K, VAN DER STRAETEN D. Ethylene in vegetative development: a tale with a riddle. The New Phytologist, 2012, 194(4): 895-909.
[34] 張文穎, 王晨, 朱旭東, 馬超, 王文然, 冷翔鵬, 鄭婷, 房經貴. 葡萄全基因組DELLA蛋白基因家族鑒定及其應答外源赤霉素調控葡萄果實發育的特征. 中國農業科學, 2018, 51(16): 3130-3146. doi: 10.3864/j.issn.0578-1752.2018.16.009.
ZHANG W Y, WANG C, ZHU X D, MA C, WANG W R, LENG X P, ZHENG T, FANG J G. Genome-wide identification and expression of DELLA protein gene family during the development of grape berry induced by exogenous GA. Scientia Agricultura Sinica, 2018, 51(16): 3130-3146. doi: 10.3864/j.issn.0578-1752.2018.16.009. (in Chinese)
[35] WU J, ZHONG J H, XU K, WEI Q P, WEI Z L. Effects of exogenous GA3 on fruit development and endogenous hormones in fujiminori grape. Journal of Fruit Science, 2001, 4: 209-212.
[36] ACHEAMPONG A K, HU J H, ROTMAN A, ZHENG C L, HALALY T, TAKEBAYASHI Y, JIKUMARU Y, KAMIYA Y, LICHTER A, SUN T P, OR E. Functional characterization and developmental expression profiling of gibberellin signalling components in. Journal of Experimental Botany, 2015, 66(5): 1463-1476.
[37] 袁華招, 趙密珍, 吳偉民, 于紅梅, 錢亞明, 王壯偉, 王西成. 葡萄生長素響應基因家族生物信息學鑒定和表達分析. 遺傳, 2015, 37(7): 720-730.
YUAN H Z, ZHAO M Z, WU W M, YU H M, QIAN Y M, WANG Z W, WANG X C. Genome-wide identification and expression analysis of auxin-related gene families in grape. Hereditas, 2015, 37(7): 720-730. (in Chinese)
[38] RIECHMANN J L, HEARD J, MARTIN G, REUBER L, JIANG C Z, KEDDIE J, ADAM L, PINEDA O, RATCLIFFE O J, SAMAHA R R, CREELMAN R, PILGRIM M, BROUN P, ZHANG J Z, GHANDEHARI D, SHERMAN B K, YU G.transcriptionfactors: genome-wide comparative analysis among eukaryotes. Science, 2000, 290(5499): 2105-2110.
[39] MAKKENA S, LAMB R S. The bHLH transcription factorregulates root growth by controlling the size of the root meristem. BMC Plant Biology, 2013, 13: 1.
[40] MAHJOUB A, HERNOULD M, JOUBèS J, DECENDIT A, MARS M, BARRIEU F, HAMDI S, DELROT S. Overexpression of a grapevine R2R3-MYB factor in tomato affects vegetative development, flower morphology and flavonoid and terpenoid metabolism. Plant Physiology and Biochemistry, 2009, 47(7): 551-561.
[41] TYAGI S, MIR R R, KAUR H, CHHUNEJA P, RAMESH B, BALYAN H S, GUPTA P K. Marker-assisted pyramiding of eight QTLs/genes for seven different traits in common wheat (L.). Molecular Breeding, 2014, 34: 167-175.
Genome-Wide Association Studies for Grape Berry Weight Related Traits

1Institute of Forestry and Pomology, Beijing Academy of Agricultural and Forestry Sciences, Beijing 100093;2Beijing Engineering Research Center for Deciduous Fruit Trees, Beijing 100093;3Key Laboratory of Biology and Genetic Improvement of Horticultural Crops (North China), Ministry of Agriculture and Rural Affairs, Beijing 100093
【Objective】Grape berry size is one of important factors affecting grape appearance and the final productivity. It is a complex quantitative trait regulated by multiple genes. Mining the key genetic regulatory loci and the underlying genes for berry size related traits would help to improve grape yield. 【Method】In this study, 150 diverse grapevine varieties were selected as materials. The berry weight, seed number per berry, and seed weight were measured in 2019 and 2020, respectively. Based on high-density genotype data obtained by resequencing, the genome-wide association studies (GWAS) were carried out to detect significantly associated SNPs and to predict important candidate genes.【Result】The three measured traits exhibited extensive phenotypic variation with 39.55%-68.89% of phenotypic variation coefficients; the phenotypic distribution of the observed three traits in the population showed continuous quantitative genetic characteristics; a significant positive correlation between each trait were observed in two years; based on the phenotypic data collected in two years, a total of 150 significant SNPs were detected for berry weight. In 2019, 99 SNPs were detected, each of which contributed the phenotypic variation from 14.48% to 25.59%; in 2020, 73 SNPs were detected, explaining 16.08%-26.83% of phenotypic variation;among these SNPs, 24 were detected repeatedly in both two years, mainly located on chromosome 1, 5, 11 and 16. Compared with the trait of berry weight, less SNPs significantly associated with the seed number were detected. A significant SNP was detected in 2019, and the phenotypic explanation value was 24.29%; in 2020, 17 significant SNPs were detected, which all located on chromosome 18; 1 and 2 SNPs located on chromosome 18 significantly associated with seed weight were detected in 2019 and 2020, respectively, accounting for 23.59%-48.29% of phenotypic variation. Within the genomic region of SNPs detected repeatedly for two years, 11 candidate genes related to berry weight were screened out based on the functional annotation, including ethylene signal pathway genes (VIT_05s0049g00490, VIT_05s0049g00500, VIT_05s0049g00510 and VIT_16s0100g00400), gibberellin signal pathway genes (VIT_11s0016g04630 and VIT_16s0022g02310), auxin responsive protein gene (VIT_11s0016g05640) and some important transcription factor genes (VIT_05s0049g00460, VIT_11s0016g05660 and VIT_16s0022g02330). A candidate gene VI(encoding a MADS box proteinAGL11) associated with seed content was identified on chromosome 18, and different SNP genotypes on this gene significantly affected the grape berry seed number and weight. 【Conclusion】A total of 150 SNPssignificantly associated with berry weight were detected in two years, mainly located on chromosomes 1, 5, 11 and 16; A total of 19 significant SNPs associated with seed content were detected, mainly located on chromosome 18. Based on the results of gene annotation and genotype analysis, 11 candidate genes that might be involved in the regulation of grape berry weight including VIT_11s0016g04630 and VIT_16s0022g02310 were selected; the candidate gene VIT_18s0041g01880 was determined significantly correlated with seed content.
grape; berry size; genome-wide association studies; candidate gene
10.3864/j.issn.0578-1752.2023.08.011
2022-06-08;
2022-08-24
北京市農林科學院創新能力建設專項(KJCX20200406)、現代農業產業技術體系建設專項(CARS-29)、河北省重點研發計劃(21326310D)
王慧玲,E-mail:wanghui198216@126.com。通信作者徐海英,E-mail:haiyingxu63@sina.com。通信作者孫磊,Tel:010-82592156;E-mail:sunlei.bjfu@gmail.com
(責任編輯 趙伶俐)