李 清,羅永堅,2,吳柔賢,賈俊婷,張文虎,宋松泉,劉 軍
(1.廣東省農業科學院農業生物基因研究中心/廣東省農作物種質資源保存與利用重點實驗室,廣東 廣州 510640;2. 湖北民族大學林學園藝學院,湖北 恩施 445000)
【研究意義】大豆起源于中國,栽種歷史悠久,地理分布廣泛,兼具糧食作物和經濟作物的雙重價值,是我國農業生產重要的農業產品[1-2]。因此,大豆種質資源的遺傳多樣性分析和種質資源創新利用具有重要意義。【前人研究進展】目前,在大豆種質資源遺傳多樣性研究中,SSR分子標記技術應用較廣泛[3-4]。DNA分子身份證技術以SSR分子標記技術為基礎,通過對SSR擴增多態性結果分析并進行數字化編碼賦值,得到獨一無二的數字編碼作為DNA分子身份證,具有準確性高、快速簡便的優點,對種質資源的知識產權保護具有重要作用[5]。目前,植物DNA分子身份證已廣泛應用于品種保護和種質資源鑒定中。唐玉娟等[6]對34 份廣東夏大豆材料進行了SSR檢測,并利用5個SSR引物構建其分子身份證,為廣東夏大豆品種的鑒定提供了依據。Zhang等[7]用SSR分子標記對中黃18、中黃68、中黃35、中黃13和菏豆13等5個大豆栽培種進行檢測,構建了進化樹,并進行了主成分分析,發現中黃18、中黃68、中黃35之間存在較大差異,而中黃13與菏豆13的親緣性較高。基于DNA分子身份證的廣泛應用和高通量測序的快速發展[8],田志喜團隊[9-10]從2 898份大豆種質中篩選了26個野生和栽培大豆,進行了遺傳多樣性分析和泛基因組學研究,構建進化樹并挖掘得到與性狀相關的重要基因,對育種具有重要意義。
【本研究切入點】光熱資源豐富、雨水充足的華南地區是大豆生產最具發展潛力的地區之一[11-12]。廣東省大豆品種資源豐富,但目前有關該地區大豆遺傳多樣性及DNA分子身份證的研究報道不多[6,13-14],涉及的品種數量太少。此外,對廣東省農家種大豆的品種來源和性狀鑒定方面的信息收集相對較少。【擬解決的關鍵問題】鑒于此,本研究采用30對SSR分子標記對收集的96份廣東大豆農家種資源進行遺傳多樣性分析,初步確定大豆資源的親緣關系,篩選核心引物并構建DNA分子身份證體系,以期為廣東省大豆種質資源遺傳評價、資源保護及創新利用提供參考。
供試96份大豆材料為幼苗期葉片,由廣東省農業科學院農業生物基因研究中心于全國第三次資源調查活動中從廣東省19個市37個縣市收集得到,樣品采集信息見表1。
1.2.1 DNA提取 選用CTAB法[15]提取植株DNA,采集幼苗期10株大豆葉片混合提取DNA并進行電泳檢測DNA質量,DNA保存于-20℃。
1.2.2 PCR擴增 大豆引物(表2)來源于Soybase數 據 庫(http://soybase.org/resources/ssr.php), 以等位變異片段≥3,擴增效率高,引物特異性好以及具有多態性為標準進行預篩選,從中得到了30對SSR引物,所用引物均由閱微基因技術有限公司合成。PCR擴增體系為10 μL,其中10×Buffer 1 μL,2.5 mmol/L dNTP 0.8 μL,Primer Mix(5 μmol/L),正、反 SSR引物各0.6 μL,HSTaq(5U/μL)0.1 μL,模板 DNA 1 μL,ddH2O補齊至10 μL。反應程序:95 ℃預變性5 min;95 ℃變性30 s、60℃退火30 s、72 ℃延伸 30 s,35個循環;72℃延伸 5 min,4℃保存。
1.2.3 PCR產物毛細管電泳檢測及數據分析 于96孔板中每孔加入ROX-500分子量內標0.5 μL和甲酰胺混合液8.5 μL,混勻后加入1 μL 經純化后的PCR產物,然后使用ABI3730XL測序儀進行毛細管電泳檢測。待電泳結束后,利用Genemapper 3.2軟件自動生成每個位點的圖譜文件,分析擴增片段峰值,讀取擴增片段大小。
根據一個引物一個基因位點,將不同引物不同資源電泳片段大小錄入到EXCEL中,用DataFormate2.7軟件轉化成POPGENE軟件所要求的格式后,使用該軟件分析計算等位變異片段數(A)、觀測雜合度(Ho)、期望雜合度(He)和Shannon 信息指數(I)。采用DataFormate2.7軟件對電泳數據進行轉化為“0”“1”格式二元矩陣,使用NTSYS-PC 2.1軟件計算遺傳距離矩陣[16],使用MEGA7軟件進行聚類分析構建NJ系統樹狀圖,并使用在線軟件iTOL(https://itol.embl.de/)優化。
1.2.4 DNA分子身份證構建 大豆種質資源SSR分子身份證的編碼,采用數字和字母表示,具體方法如下:根據每對引物擴增片段(等位變異片段)從小到大以阿拉伯數字1~9標注,9個以上的等位變異片段,以大寫英文字母A~Z 標注,若該位點在某個資源中無擴增記為0;每個引物位點占兩位,構建成數字與字母相結合的DNA分子身份證。將身份證編碼錄入條形碼生成器(http://www.t-x-m.com/)構建條形碼身份證。將大豆的基本信息、形態特征、生長特征、品質數據、DNA身份證編碼等文本信息錄入二維碼生成器(https://cli.im/),生成可供掃描的大豆DNA身份證二維碼。

表1 供試大豆資源信息Table 1 Information of 96 soybean resources

表2 SSR引物序列Table 2 List of 30 SSR primers
利用PCR擴增后的產物經熒光毛細管電泳后,準確獲取每對引物在不同材料的DNA片段大小和相應的毛細管電泳圖。由表3可知,采用30對引物對96份大豆共擴增出273個多態性等位變異片段,平均每對引物擴增出14.29個多態性等位變異片段。其中,引物Sat_258擴增出的等位變異片段最多(23.0個);引物Satt619、Satt256和Satt703擴增出的等位變異片段最少(4.0個)。30對引物檢測到等位變異片段數(Na)共273個,平均每對引物擴增出多態性等位變異片段9.1個。Nei’s多樣性指數(H)的變化范圍為0.4324~0.9348,平均值為0.7133;Shannon 信息指數(I)的變化范圍為0.8007~2.8763,平均值為1.5893;期望雜合度(He)的變化范圍為0.4345~0.9348,平均值為0.7138;多態性信息含量(PIC)的范圍為0.3891~0.9310,平均值為0.6786。一般認為,當PIC>0.50時可以認為該引物為高度多態性信息引物[17]。因此,所選的大部分引物為高度多態性信息引物,說明這些引物可用于大豆種質資源的鑒定和研究。
根據30對引物在96個大豆資源的多態性片段信息建立數據矩陣,由NTSYSpc 2.1e軟件用UPGMA的算法計算遺傳距離矩陣,然后采用MEGA7的Neighbour-joining算法構建系統發生樹[16],結果表明,96份大豆資源可以劃分為3個類群(圖1),第一個組類群包含47份大豆資源,第二個組類群包含32份大豆資源,第三個組類群包含17份大豆資源。結合聚類結果和原產地分析發現,3個組群同一地理來源的資源并沒有完全聚在一起,不同地區來源的資源發生了聚類,這說明收集的96份廣東省農家種大豆具有品種多樣性,各類群品種之間親緣關系較近,遺傳差異較小。
構建DNA分子身份證的最終目的是使用最少的SSR標記引物達到區分所收集的農家種大豆種質資源并賦予其可辨的分子身份證,同時選取的SSR引物需要滿足能區分最多大豆種質的原則。存在特異性位點的材料能通過單一的引物即可直接鑒定,但一般存在于少量的品種中。為了區分盡可能多的材料,通常采用多引物組合,直至將所有材料完全區分開。以30對引物的PIC指數(表3)為標準;選用PIC最高的引物開始篩選供試資源,再加入PIC第二高的引物組合;以此類推,直至篩選出可將全部供試大豆種質全部區分的引物組合,結果見表4。通過PIC由高到低組合,發現在30對SSR引物中用9對引物即可完全分離96份大豆。基于最少引物區分最多種質的原則,對9對引物進行精簡化,將分離種質數目較低的Satt197、Satt547、AZ302047引物在9對引物中剔除,發現Sat_258、Sat_351、Satt540、BE806308、Sat_164、Satt346 共6對引物組合即可將96個大豆資源完全區分。
為驗證上述6對引物分離96份大豆的可行性,根據這6對SSR引物的等位變異系數分別為23、16、11、13、17、8,按照引物組合能區分最多品種數 A=N1N2N3… Nn(N1、N2、N3… Nn為每對引物的觀測等位變異片段數Na)的理論值計算,結果表明6對SSR引物組合能夠區分最大品種數目的理論值為7 156 864個。因此該6對SSR引物可作為核心引物用于96份大豆DNA指紋圖譜身份證的構建。
采用上述6對核心引物構建了96份大豆資源的DNA分子身份證(表5);進一步將DNA身份證導入條形碼生成器,將大豆的資源信息、特征特性、產量表現、栽種措施及DNA身份證編碼等文本信息錄入二維碼生成器,成功構建了96份廣東大豆資源的DNA身份證二維碼。圖2為第43號大豆資源的DNA身份證結果示例。
SSR分子標記作為穩定、高效且多態性好的種質資源鑒評方法[18],有助于分析大豆的親緣關系與遺傳多樣性,并被廣泛應用于大豆種質資源鑒評研究中[19]。本研究利用30對擴增效果清晰、穩定的SSR引物檢測96份廣東省農家種大豆資源,結果顯示平均等位變異片段數(Na)為9.1個,平均有效等位變異片段數(Ne)為4.2657個,Nei’s多樣性指數(H)平均值為0.7133,Shannon 信息指數(I)平均值為1.5893,期望雜合度(He)平均值為0.7138,多態性信息含量(PIC)平均值為0.6786。根據30對SSR引物在96份廣東省農家種大豆資源中的多態性結果進行親緣關系分析發現,供試大豆資源可以分為3個類群,這3個類群并不完全依據地理劃分,聚類分析結果并不能用以判定品種的來源地,但該親緣關系說明所收集的96份農家種大豆具有資源多樣性,達到了廣泛收集農家品種的目的,為廣東省大豆品種選育積累了豐富的種質資源。

表3 30對SSR在96份大豆的遺傳信息統計Table 3 Genetic information statistics of 30 SSR pairs in 96 soybean resources

圖1 96份大豆樣品基于遺傳距離的Neighbour-joining系統發生樹Fig. 1 Neighbour-joining phylogenetic tree of 96 soybean resources based on genetic distance
本研究通過對96份大豆進行遺傳多樣性和親緣性分析,以PIC為指標對30對引物進行篩選,剔除分離率較低以及相似性過高的引物,得到可區分96份大豆的6對核心引物組合:Sat_258、Sat_351、Satt540、BE806308、Sat_164、Satt346。第三次全國農作物種質資源普查與收集過程中,我們已經收集了大量的大豆地方品種,為避免后期重復收集,可將這些核心引物應用于種質資源的甄別工作,推進種質資源的鑒評和利用。符小發等[20]通過對大豆品種的產量、成熟期、分枝等農藝性狀進行鑒評,利用聚類分析得到了產量相關的主成分因子。孔凡江團隊利用基因組學與生物信息學,發掘了野生大豆開花馴化過程中的關鍵調控因子Tof11和Tof12[21-22]。因此,可以對收集到的大豆資源開展SSR分子標記與農藝性狀相關研究的同時,結合基因組學、生物信息學等方法,進一步挖掘大豆農藝性狀的關鍵影響因子。同時核心引物也能對廣東省農家種大豆進行快速的指紋圖譜構建,對應相關DNA分子身份證信息以及鑒評性狀,為廣東省農家種大豆資源的保護提供有力支撐。本研究將DNA身份證導入條形碼生成器,錄入相關資源信息,成功構建數字化的96份大豆資源DNA身份證。將所得到的數據轉化為可視化的信息進行普及,不僅豐富了種質資源信息數據庫,也為種質資源的保護和創新利用奠定了重要基礎。同時,大豆資源DNA分子身份證的構建也有利于農戶的大豆生產相關栽培知識的宣傳,對大豆資源的保護與規范化種植具有促進作用。

表4 有效SSR標記引物組合對大豆資源的區分Table 4 Identification of soybean resources by effective SSR marker primer combinations

表5 96份大豆資源的分子身份證編碼Table 5 Molecular ID of 96 soybean landraces

圖2 第43號大豆資源DNA身份證條形碼和二維碼身份證Fig. 2 DNA ID barcode and QR code ID of No. 43 soybean resources
本研究收集了廣東省19個市37個縣市共96份農家種大豆種質資源,利用30對SSR引物進行檢測獲得相關多態性結果,通過聚類分析發現該96份大豆品種具有資源多樣性,并且可以分為3個類群。對30對SSR引物進行篩選后得到6對核心引物,基于該6對SSR引物的多態性結果構建了供試大豆的DNA分子身份證,進一步記錄相關品種性狀并轉化為可視化信息,為廣東省大豆種質資源的保護與鑒評積累了基礎,也為大豆品種的推廣與利用提供了重要依據。