任毅 趙泓 寇青禾 江姣 張海英 侯文菊 鄒小花 孫宏賀 宮國義 許勇

目的與意義:現代西瓜品種的遺傳基礎較窄,然而西瓜中有幾個亞種具有廣泛遺傳多樣性,它們可以成為改良西瓜品種的有用種質資源。當前西瓜基因組資源和遺傳圖譜有限,并需要開發一種可用于鑒定西瓜染色體的細胞遺傳學圖譜,其能夠劃定栽培西瓜與其它相關的西瓜屬植物之間存在的結構差異。現如今,還沒有任何關于西瓜基因組序列的高密度遺傳連鎖圖譜的報道,致使西瓜在不同品種之間遺傳多樣性較低。所以,構建高密度的西瓜遺傳連鎖圖譜成為當下之需。
材料與方法:使用栽培種‘97103和野生種‘PI 296341-FR雜交單粒傳構建的103株系重組自交系(RILs)選擇96株。從栽培種‘97103基因組組裝scaffolds和野生種‘PI 296341-FR的基因組序列讀取來開發SSR(簡單重復序列),InDel(插入缺失)和SV(結構變異)標記。利用栽培種‘97103和野生種‘PI 296341-FR構建的103株RIL群體進行遺傳作圖。使用JoinMap進行圖譜的構建,計算片段的重組率。利用細菌人工染色體(BAC),5S和45S rDNA探針,用于熒光原位雜交(FISH)。
結果與分析:SSR、InDel和SV標記是基于栽培種‘97103組裝的353 M基因組scaffolds 序列和野生種‘PI 296341-FR的重測序數據開發的。研究中共鑒定了13 744個假設的SSR位點。在消除多種同源性的SSR基因后,選擇具有長重復基序的1 877個特有SSR用于與RIL群體的親本系(‘97103和‘PI 296341-FR)的多態性分析。在1 877個SSR中,787個(41.9%)在PCR擴增后顯示出栽培種‘97103和野生種‘PI 296341-FR之間的多態性。在僅選擇5~10 bp內的InDel和120 bp至1 500 bp的SV,獲得3 759個InDel和584個SV。選擇InDels標記303個和SV標記54個用于2個RIL親本之間的多態性分析,結果顯示303個InDel標記中的290個標記和所有54個SV標記在父母本之間是多態的。
偏分離普遍存在于遺傳作圖中,偏分離在植物基因組進化中起著主導作用。在第1、2、3、4、5、7、8、9號和10號連鎖群(LGs)中分別檢測到9個偏分離熱點區域。在11個LGs中發現了11個重組抑制區域,染色體末端的區域具有更高的重組率。熱點區域的重組率為3.0~8.3 cM·Mb-1,而抑制區域的重組率為0~0.9 cM·Mb-1,整個基因組的遺傳距離與物理距離的平均比值為2.3 cM·Mb-1。
成功錨定了234個scaffolds,總共330 Mb,占栽培種‘97103基因組被拼接的353 Mb的93.5%,而且,195個scaffolds至少被2個標記所錨定。平均每個scaffolds 被4個標記所定位,具有一個以上標記的94個scaffolds可以在遺傳圖譜上確定方向。對于僅具有一個遺傳標記或具有低重組頻率的基因組區域的140個較小scaffolds在圖譜上的定位尚不能確定方向,根據連鎖組命名編號將11條染色體進行了scaffolds組裝。
測序了947個BAC克隆的兩端的序列,并獲得了一個共有1 664個高質量的末端序列,這些序列和西瓜基因組scaffolds比對。將86個單拷貝BAC鑒定為FISH的候選探針,其中11個具有染色體特異性。還對有絲分裂染色體上的45S和5S rDNA位點進行了FISH定位,以識別第4號染色體和第8號染色體。結果發現,栽培種‘97103基因組中有2個45S rDNA位點和一個5S rDNA位點。5S rDNA位點與第8號染色體上的一個45S rDNA位點同步,而另一個45S rDNA位點位于第4號染色體上。
利用來源于包括scaffolds錨定和定位全基因組測序以及重測序多態性SSR標記,InDel標記和SV標記構建了西瓜遺傳圖譜。這是第1個以組裝基因組為基礎的高密度西瓜基因圖譜。以高密度遺傳圖譜用作參考圖譜,用FISH分配連鎖群來匹配染色體,該圖譜為錨定和定向基因序列以及確認目前基因組組裝的完整性提供了基礎。對未來的數量性狀基因(QTL)定位、分子標記輔助育種和位置基因克隆很有價值。這些標記被選擇出來后均勻分布在scaffolds 中(圖3),從而可以對整個基因組重組進行更好地評估。發現9個偏分離熱點區域(SDRs)中的8個和Citrullus lanatus var. lanatus親本相關,這種偏離的可能是栽培親本中區域基因與果實和種子的產量有關。
鑒定了位于每個染色體中的基因組區間SNP和InDel數量在減少,表明這些區域可能具有較低的序列多樣性。在低SNP和InDels區域,鑒定出50和100個標記,其平均重組率分別為0.6和0.9cM·Mb-1,與重組抑制區域速率(0.4 cM ·Mb-1)相似,低于全基因組重組率(2.3 cM·Mb-1)。這些標記發生在重組抑制區域,意味著低序列多樣性區域與遺傳圖譜中鑒定的低重組區域重疊,它們可能位于著絲粒周邊區域。每個標記都是從非重復scaffolds 序列設計的,理論上可以檢測整個基因組中的交叉。具有高SNP和InDel密度的區域富含重組活性染色體末端,表明它們位于端粒和富含基因的區域。
結? ? 論:利用由103株系重組自交系和228.3 Mb組裝序列組成的高密度遺傳圖譜,成功地錨定了234個Scaffords(占353Mb序列的93.5%),繪制出了第一個以基因組組裝為基礎的西瓜高密度遺傳圖譜。最近報道的幾種作物遺傳圖譜中組裝序列錨定和定位百分比顯示,可可(67%錨定,50%定位);蘋果(88%,66%);葡萄(69%,61%);草莓(94%錨定);大豆(97%錨定);黃瓜(72.8%錨定),與此相比較,西瓜中scaffolds錨定的比例(93.5%)很高,而定位序列(65%)所占的比例并不高,但與其他作物中所報道的定位程度相似。高密度西瓜遺傳圖譜反映了整個基因組scaffolds序列的整合,將有助于重要基因的定位克隆、QTL的鑒定和標記輔助選擇(MAS),對西瓜育種有很大幫助。