田陽陽,軒貝貝,王正旭,劉 魁,郭建華,牟文君,戴華鑫,楊繼周,宋紀真,胡利偉*
(1.紅塔煙草(集團)有限責任公司,云南 玉溪 653100;2.中國煙草總公司 鄭州煙草研究院,河南 鄭州 450001)
我國煙草種質資源豐富,至2018年,我國全國煙草品種審定委員會共審(認、鑒)定了145個煙草新品種,其中審(認、鑒)定的烤煙品種達82個[1]。 目前我國烤煙種植主要集中于西南、華南、華北、東北等地區,主要植煙省份有云南、河南、貴州、山東等18個省(市、區)[2-4]。經過多年的發展,我國煙葉生產逐漸趨于穩定,并形成了相對穩定的煙葉產供格局。近3年,種植面積較大的烤煙品種主要有云煙87、K326、紅花大金元、云煙85、云煙97、中煙100等[5,6]。主栽烤煙品種的親本比較集中,親緣關系較近,如云煙87與云煙85為姊妹系,親本相同,均是以K326和云煙2號為親本雜交選育出來的;云煙97和云煙99的母本均為云煙85;云煙100的母本為云煙87,其形態學特征差異不明顯。多數研究表明我國烤煙遺傳背景狹窄,遺傳多樣性較低,利用傳統手段對烤后煙葉進行品種鑒定存在一定的難度[7]。
SSR熒光標記檢測技術是直接將熒光染料標記到SSR引物的5’端或引物內部的某個堿基上,然后進行PCR擴增,使每一個擴增產物都帶有熒光染料,熒光標記DNA片段在通過毛細管正極受到激光掃描時發射出特定波長的熒光,掃描儀獲取熒光強度,同時記錄激發時間,通過出峰時間計算出DNA片段大小,根據峰值高度計算出PCR產物的量[8-10]。 該檢測體系可以一次檢測多個不同PCR擴增產物,根據PCR產物攜帶的熒光顏色的不同分離出不同SSR位點的PCR產物[10,11]。擁有高通量、高準確率的ABI3730XL自動測序儀有96道毛細管,一次電泳能夠測定96個樣品,自動化流程較高[9]。再利用計算機軟件進行數據收集和分析,可以精確計算出各擴增核酸片段的大小,其分辨率可以達到1 bp,為分析主栽烤煙品種間的遺傳差異提供了較為可靠的技術手段,目前已被廣泛應用于基因型鑒定、遺傳多樣性分析、遺傳圖譜的構建等方面[12]。Bindler等[13]于2011年開發并報道了1張煙草SSR標記的高密度遺傳圖譜;國內童志軍[11]、陳雅瓊[14]、尹國英[15]、陳杰[16]、王慧穎[17]等對煙草的SSR標記進行了進一步開發和應用,使得SSR標記在烤煙上的應用已日趨成熟。黃莉莎等[7]利用SSR標記構建了煙草主栽品種的遺傳圖譜,為烤煙的遺傳多樣性分析提供了有效的SSR引物。陳芳等[18]篩選出了8對重復性好、多態性高的SSR引物,可將32份煙草種質資源分為4個大類。眾多的研究[19-21]充分表明了SSR標記在煙草品種的遺傳多樣性分析中有著良好的應用潛力。本研究在前期研究的基礎上篩選SSR引物,利用毛細管電泳檢測技術進行SSR分型,對主栽烤煙品種進行了遺傳多樣性分析,以期為烤煙主栽品種鑒定提供有效的方法和理論依據。
供試材料為紅花大金元、云煙87、中煙100、云煙97、翠碧1號、K326、KRK26和NC297等8個主栽烤煙品種的烤后煙葉DNA??竞鬅熑~樣品除NC297取自云南玉溪峨山產區外,其他品種樣品均取自玉溪世界煙草品種園。對烤后煙葉樣品進行紫外線照射20 min,以去除葉面DNA污染,并用液氮研磨,置于-80 ℃冰箱保存備用。
實驗儀器有PCR儀(Applied Biosystems)、電泳儀及電泳槽(北京六一儀器廠)、凝膠成像系統(Bio-Rad公司)、PCR儀(Bio-Rad公司)、3730XL DNA序列分析儀(美國ABI公司)等。實驗試劑有Taq PCR Mix預混液、λDNA/EcoRI+HindIII Marker、SSR引物。
通過查閱文獻以及前期實驗,委托上海生物工程有限公司進行引物合成與熒光標記,實驗中用到的引物及標記位點見表1。

表1 供試SSR引物對的序列信息
PCR反應總體積為25 μL,含有模板DNA 1 μL、正反向引物各1 μL、Taq PCR Mix 12.5 μL、無菌水9.5 μL。擴增程序為:94 ℃熱處理變性 5 min;接著進行兩輪的Touchdown PCR;94 ℃ 30 s、60 ℃ 30 s、72 ℃ 30 s,設置循環10次;接著將退火溫度降低至55 ℃,94 ℃ 30 s、55 ℃ 30 s、72 ℃ 30 s,循環20次;72 ℃延伸10 min。在反應結束后將PCR管置于-80 ℃冰箱保存。
吸取稀釋后的PCR產物作為樣品,將其加入到96孔板,做好標記,將96孔板用封板膜密封,以5000 r/min短暫離心。將10 μL內標LIZ500 (35~500 bp)和990 μL HIDI溶液充分混勻后,接著分裝入96孔反應板中,以5000 r/min離心數秒。將96孔板置于PCR儀上,變性程序設置為98 ℃變性5 min,完成后立即將96孔板置于冰上迅速冷卻,以10000 r/min 短暫離心。使用ABI 3730XL DNA序列分析儀進行毛細管電泳,檢測目的產物的片段大小。
采用Genemapper 4.0軟件對毛細管電泳結束后DataCollection 軟件收集的原始數據進行分析,比較目標峰與分子內標Genescan500-LIZ 的位置,確定不同樣品SSR擴增片段的精確長度(計量單位為bp)。對每個樣品進行獨立的3 次獨立重復實驗,取3 次重復的平均值,并四舍五入作為該樣品在該位點擴增片段的大小。通過統計毛細管電泳的檢測結果,將得到的離散數據按照相同位置峰圖的有無以“0”、“1”進行編碼,建立“0”與“1”二元數據矩陣。利用NTsys 2.10e軟件[22]對SSR的多樣性指標進行統計;基于SHAN算法進行UPGMA聚類分析[23];通過Tree plot模塊繪制遺傳聚類圖。
將SSR實驗中已擴增的PCR產物混合后進行純化,采用3%瓊脂糖凝膠進行電泳檢測,檢測合格后對PCR產物進行純化,接著使用文庫制備試劑盒(NEB公司,英國)構建文庫,采用Qubit?2.0進行文庫濃度測定。建庫流程如下:在每個樣品中加入末端連接酶、末端修復反應緩沖液和DNA樣品,進行末端補平和3’末端加PolyA尾巴。修復完成后保存于4 ℃。等上一步修復結束后,采用Agencourt AMPure XP磁珠純化試劑盒去除dNTP、引物、引物二聚體等其他雜質,于-20 ℃保存。對純化后的接頭連接產物進行PCR富集擴增,然后使用Agencourt AMPure XP磁珠純化試劑盒進行純化,于-20 ℃保存。對PCR產物的檢測采用Illumina Miseq測序平臺,讀長為150 bp,進行雙端測序。
采用Cutadapt軟件對正向測序的數據進行切割,切除上下游固定引物序列,僅保留中間部分序列,數據格式為 fastq;采用 Prinseq-lite 軟件進行質量控制[24];根據高通量測序結果,對大量測序數據進行排序分類,創建包含序列長度和頻率的輸出文件,并以毛細管電泳檢測數據為期望值,以NGS測序數據為觀察值,利用簡單重復序列識別工具SSRIT識別SSR基因座的結構組成。
為了研究上樣量對檢測信號輸出的影響,本實驗對不同濃度的PCR產物進行毛細管電泳檢測,將PT20213、PT20306、PT30028等引物對的PCR擴增產物稀釋成25、50、100、200、300、600 ng/μL 6個濃度梯度,進行毛細管電泳檢測,確定合適的上樣濃度,結果如圖1所示。PT201213的PCR產物在25、50、100、200 ng/μL濃度下都有熒光信號,在300、600 ng/μL濃度下則沒有熒光信號;PT20306的PCR產物在25、50、100 ng/μL濃度下都有熒光信號,而在200 ng/μL及以上濃度下則無信號;PT30028的PCR產物在25 ng/μL濃度下沒有熒光信號,在50~600 ng/μL范圍內都有熒光信號。因此,在本實驗中,當PCR產物濃度為50~100 ng/μL時,在絕大多數SSR位點的毛細管電泳能夠檢測到熒光信號。

圖1 不同PCR產物濃度對毛細管電泳檢測結果的影響
利用83對SSR引物對8個烤煙品種進行PCR擴增,根據3.0%瓊脂糖凝膠電泳檢測結果,對其中的33對SSR引物隨機進行熒光標記,并利用毛細管電泳檢測其擴增片段長度,確定NTGS66288、PT30250、PT30213、PT52573、PT30170等5對SSR引物為本研究的核心引物,這5對引物在8個烤煙品種中的毛細管電泳檢測結果如圖3所示,NTGS66288、PT30250、PT30170的PCR產物帶型單一,滑移峰較少,而PT30213、PT52573的PCR產物具有較多的滑移峰,但是主峰依然明顯,可以用于進一步分析。從毛細管電泳檢測的圖譜中可以看出,在5對SSR引物中,多數SSR引物對8個烤煙品種的擴增結果為單條帶,如引物NTGS66288;少部分的擴增結果為雙條帶,如引物PT52573。

圖2 熒光SSR引物擴增產物的毛細管電泳檢測結果
對帶型清晰、差異明顯的5對SSR進行多態性分析,5對SSR引物在8個烤煙品種材料中共擴增出13個條帶,都為多態性條帶,其片段大小處于104~203 bp,其在8個烤煙品種中PCR產物的片段長度差異在6~14 bp,平均每個SSR引物的多態性條帶數為2.6個,詳見表2。這5對引物的多態性良好,8個烤煙品種的0、1編碼矩陣如表3,能夠有效地將8個烤煙品種進行區分。

表2 SSR引物在8個烤煙品種的擴增產物及其片段長度 bp

表3 基于5對引物擴增的8個烤煙品種的0、1編碼矩陣
通過對8個烤煙品種的SSR標記數據進行統計,采用UPGMA算法計算8個烤煙品種間的遺傳相似系數并繪制遺傳聚類圖(圖3)。8個烤煙品種間遺傳相似系數分布在0.30~0.86,平均值為0.52(表4)。由8個烤煙品種遺傳相似系數獲得的聚類圖表明,當遺傳相似系數為0.761時,可將8個烤煙品種分為4個類群。云煙87與NC297首先聚在一起,說明兩者遺傳背景較近,遺傳相似系數為0.86;遺傳相似系數最小為0.24,出現在翠碧1號和中煙100這兩個品種間;中煙100、云煙97、NC297和云煙87聚為一類;K326、KRK26聚為另外一類;紅花大金元、翠碧1號與這兩個類群之間的遺傳距離相對較遠。

圖3 8個烤煙品種的SSR標記聚類圖

表4 8個烤煙品種間的遺傳相似系數
通過分析PCR產物的測序結果,利用簡單重復序列識別工具SSRIT識別SSR基因座的結構組成,NTGS66288、PT30250、PT30213、PT52573、PT30170等5個SSR位點的序列信息如表5所示。檢測結果顯示NTGS66288、PT30250、PT30213、PT52573、PT30170等5個SSR位點基因座的核心重復單元多為簡單二堿基重復和三堿基重復,其中二堿基重復以(AT)n和(TA)n為主,三堿基重復以(ATA)n、(TCT)n和(TAG)n為主。其基序重復次數在3~28次,基序長度介于9~84 bp。

表5 SSR位點的結構組成分析結果
對8個烤煙品種NTGS66288、PT30250、PT30213、PT52573、PT30170等5個SSR位點序列進行序列比對和分析,結果表明,在這5個SSR位點上,8個品種之間的差異僅為核心重復單元數量不同,其他區域序列完全一致,不存在SNP或者插入、顛換等差異,具體序列比對結果見圖4。

圖4 8個烤煙品種在5個SSR位點的序列信息
基于SSR標記在烤后煙葉中較高的重復性、可靠性以及特異性,SSR標記可以作為主栽烤煙品種遺傳多樣性分析的首選,篩選重復性好、穩定性高和多態性豐富的優質SSR標記是提高品種鑒定效率的關鍵。本研究從83對引物中篩選出5對SSR引物,結合毛細管電泳檢測技術對8個主栽烤煙品種進行遺傳多樣性分析,發現:5對SSR引物在8個烤煙品種中共獲得13個條帶,都為多態性條帶,其片段大小處于104~203 bp;烤煙品種間遺傳基礎相對狹窄,8個品種間的遺傳相似系數在0.30~0.86。因此,8個烤煙品種間遺傳相似性較高,遺傳背景接近,這與薛懷裕[25]、劉林等[26]的研究結果類似。
由于能分辨親緣關系極近的品種,SSR得到了越來越多的應用,但是其也存在著“復制滑移”現象,這種“復制滑移”現象可能與引物序列重復單元的構成有一定關系。在本實驗中,NTGS66288、PT30250、PT30170等引物對的PCR產物帶型單一,滑移峰較少,而PT30213、PT52573的PCR產物具有較多的滑移峰,但是主峰依然明顯,可以用于進一步分析。SSR位點復制滑移的發生頻率受很多因素的影響,變異很大,但有一個共同的特征,即發生概率較小,如果不加以控制,足以在群體中產生差異。本研究使用的部分SSR引物在經過PCR優化之后,依然會存在較多的滑移峰,如SSR引物PT30213和PT52573。因此,在遇到此類引物時,需要引起重視,首先應該進行重復實驗,多次優化PCR條件,或者采用其他擴增體系進行重復驗證,檢查內標或Ladder分型是否正確。
基于高通量測序技術的基因分型給物種分類及品種鑒定提供了更高的分辨率,但后期測序數據拼接繁瑣,對具有重復序列的SSR等位基因難以進行準確的測序分析,主要是因為在全基因組測序過程中,SSR的核心重復序列因基序的多次重復會導致測序出現大量堿基空缺[27,28]。因此,通過全基因組測序獲得完整的SSR位點的序列信息存在困難,而通過單管PCR擴增,并對PCR擴增產物進行高通量測序,對于獲得SSR位點的序列信息變得相對容易。本研究基于Hiseq測序平臺,對8個烤煙品種的SSR位點進行測序,探索了不同SSR位點的結構與序列差異,期望將長度序列多態性進階為DNA序列多態性。測序結果表明SSR位點的深度測序確實可以提供更詳細的烤煙遺傳多樣性信息,獲得更多的等位基因,提高遺傳標記的應用潛力。但是由于本實驗的測序位點較少,而且大部分SSR基因座間的序列信息差異屬于常規的簡單重復次數的差異,因此若要獲得更多堿基水平的SSR序列多態性則需要更多的SSR引物和大量的群體。此外在利用深度測序檢測SSR基因座的低頻突變中,測序提供了足夠的覆蓋率,但由于建庫過程不同,SSR引物存在模板偏好性,因此測序結果依然存在突變與測序錯誤的不可區分性。今后可以從SSR位點的序列差異入手,利用SSR標記的穩定性和下一代測序技術的高通量以及高分辨率,擴大特異引物的測序規模,尋找更多可穩定遺傳的序列突變,明確每一個品種的特征序列,為烤后煙葉品種的批量、快速鑒定奠定基礎。
本實驗確定的5對SSR引物(NTGS66288、PT30250、PT30213、PT52573、PT30170)可有效區分云煙87、云煙97、翠碧1號、紅花大金元、中煙100、K326、KRK26、NC297等8個烤煙品種,且8個品種之間的差異僅為簡單二堿基和三堿基核心重復單元數量不同,其中二堿基重復以(AT)n和(TA)n為主,三堿基重復以(ATA)n、(TCT)n和(TAG)n為主。