王楚彪,楊 艷,白衛國,林 彥,謝耀堅,盧萬鴻*,羅建中
1.國家林業和草原局桉樹研究開發中心遺傳育種研究室,廣東 湛江 524022 2.南京林業大學林學院,江蘇 南京 210037 3.湛江科技學院經濟與金融學院,廣東 湛江 524094 4.廣西國有東門林場,廣西 崇左 532199
粗皮桉天然分布于新幾內亞島南部和澳大利亞昆士蘭州北部,其不同種源的生物學特征和生長適應性均具有很大的遺傳差異[1]。在炎熱潮濕的熱帶地區,粗皮桉良好的抗病蟲害能力使其逐漸取代金合歡屬(Acacia)樹種,成為地區重要的造林樹種[2]。巴西、東南亞等國對粗皮桉進行了大量的引種和高世代改良[3]。國內系統的粗皮桉引種改良始于20世紀80年代,并于2011年在兩廣多地建立了其高世代育種群體[4]。粗皮桉在國內主要作為雜交親本用于開發桉樹優良無性系,并針對其開展速生、抗病蟲害等雜交育種理論研究。
摸清育種群體的遺傳親緣關系是推動粗皮桉群體世代改良的基礎工作。目前常用的表型數據分析方法很難精確估算家系的遺傳和環境分量。DNA生物信息學分析專業要求高,程序復雜且成本高。鑒于此,本研究計劃通過對比基于DNA分析的遺傳距離和基于NIRs分析的光譜距離間的關系,探索近紅外光譜技術用于粗皮桉群體遺傳基礎分析的精度和可行性。
研究對象為粗皮桉育種群體試驗中的23個天然種源(表1)。遺傳材料基本涵蓋了粗皮桉的天然原生地,即澳大利亞昆士蘭州(QLD, AUS)北部和新幾內亞島(New Guinea Island)南部(印度尼西亞(Indonesia)和巴布亞新幾內亞(Papua New Guinea, PNG))。兩地被大洋分隔,最近的海岸線距離約為150 km。在粗皮桉大田群體試驗中,每家系采集10~15片新鮮葉樣,每個種源采樣8~12個家系代表該種源。葉樣盡快置于-30 ℃冰箱,用于后續遺傳分析及NIRs信息采集。

表1 粗皮桉23個天然種源信息
手持式近紅外儀Phazir Rx(1624)(Polychromix, Thermo Scientific, USA)用于葉樣NIRs的采集。Phazir Rx波長范圍為1 600~2 400 nm,分辨率12 nm,單次掃描獲得100維向量數據,自帶背景校正,內置可編程的MEMS技術微衍射光柵。
1.3.1 光譜采集
光譜采集樣本與DNA分析樣本完全對應,每個家系選擇4~6片外形健康的葉片,置于ClassicLine干燥箱(BINDER,德國),設置60 ℃,72 h,以至絕干。用中藥打粉機粉碎后裝入透明自封口塑料袋。用Phazir Rx(1624)隔袋掃描5次,其均值代表該樣品的近紅外NIRs信息[5],每個種源共獲得8~12條NIRs。
1.3.2 NIRs數據的預處理和分析
經不同的預處理效果對比后,本研究對NIRs原始數據進行Savitzky-Golay平滑的二階導數預處理[6-7]。采用全交互式內部交叉驗證算法,建立目標種源的主成分分析(PCA)模型,通過簇類獨立軟模式(SIMCA)判別分析,統計對比種源到目標種源模型間的NIRs光譜距離。基于NIRs歐氏距離(Euclidean distance)按全鏈接算法(Complete linkage),對測試種源進行層級聚類(Hierarchical clustering)。根據樣本NIRs數據PCA的因子得分圖分析種源間的遺傳親緣關系及其遺傳變異。NIRs數據的預處理和分析均由The Unscrambler x10.4(CAMO, Oslo, Norway)實現。
1.3.3 樣本遺傳距離計算
通過全基因組重測序(Whole Genome Resequencing)方法獲得粗皮桉種源各家系的DNA信息,根據Kimura提出的核苷酸序列差異原理,使用Mega-X軟件估算粗皮桉種源間的遺傳距離[8-9]。
粗皮桉新幾內亞島7個種源間的平均遺傳距離為0.186,昆士蘭州16個種源間的平均為0.157(數據冗余,未列出)。表2為新幾內亞島與昆士蘭州2大區域種源間的遺傳距離。數據顯示,2大區域種源間的最小、最大及平均遺傳距離分別為0.229,0.370和0.295,明顯大于區域內種源間的遺傳距離。新幾內亞島種源A20659,S16120,S16121和S16122與昆士蘭州各種源間的遺傳距離均超過了0.300。2大區域內和區域間種源間遺傳距離的差異,說明區域分隔(海洋)明顯拉大了粗皮桉種源間的遺傳親緣關系。

表2 粗皮桉新幾內亞島種源與昆士蘭州種源間的遺傳距離
利用NIRs光譜距離可以從不同角度解析、印證樣本間的內在遺傳差異。表3為粗皮桉新幾內亞島種源與昆士蘭州種源間的NIRs光譜歐式距離。數據顯示,2大區域種源間NIRs平均光譜距離大小與其遺傳距離的大小趨勢基本一致,如種源S16120與昆士蘭州種源間的平均遺傳距離最大(0.370),兩者之間的平均光譜距離(0.220)也明顯大于其他種源間的光譜距離。偶有例外,S16122與昆士蘭州種源間的平均光譜距離就與其遺傳距離的大小關系相悖。種源A17854與昆士蘭州種源間的NIRs光譜距離偏大可能與其有效樣本偏少有關。

表3 粗皮桉新幾內亞島種源與昆士蘭州種源間的NIRs歐氏距離
因實際值太小,表中所列光譜距離為實際數值放大100倍后的結果。
圖1中粗皮桉天然種源的NIRs層級聚類顯示,23個種源的聚類效果在一定程度上印證了其遺傳距離、光譜距離的差異。巴布亞新幾內亞島的S16120,S16121和S16122與昆士蘭州種源間的遺傳距離和光譜距離均大于其他種源間的兩類距離,也基本顯示了與昆士蘭州種源的分別聚類。但23個種源并沒有完全按照巴布亞新幾內亞島和昆士蘭州2大地域分別聚類,來自巴布亞新幾內亞的種源A18197,A17854,A18199及A20659與多數來自昆士蘭州的種源聚在了一起。這或與幾個種源的海拔較低(<50 m),且兩大地域間的地理距離比較接近,地域間存在花粉、種子或傳粉媒介等某種形式的基因交流有關。

圖1 粗皮桉23個種源基于葉樣NIRs歐氏距離的層級聚類
由于巴布亞新幾內亞島種源與昆士蘭種源間的遺傳距離普遍較大,因此,主要列舉了2大區域種源間的PCA主因子得分聚類結果。圖2中巴布亞新幾內亞島內種源S16120與A18199間(a),及S16120與昆士蘭州種源A18750間(b)相同主因子的因子得分顯示,不僅不同地理區域的種源可以清晰聚類(S16120與A18750),同一地理來源的種源也可以清晰地區分(S16120與A18199)。對比種源間的遺傳距離大小及其PCA主因子的得分圖,遺傳距離小的種源間其因子得分有可能將其清晰地區分;而遺傳距離大的種源間,其因子得分有可能存在嚴重的重疊,這可能與種源內家系間的遺傳變異較大有關。研究中大多數種源間的PCA主因子得分都顯示出清晰的聚類,為免冗余,未一一展示。
圖2顯示種源S16120與B10(c)和S14339(d)不能清晰區分,這與它們之間具有較大的遺傳距離不符,可能是種源B10和S14339內家系間存在較大的遺傳變異,從其非常分散的因子得分圖也能看出。另外,圖2各種源因子得分的聚集度各不相同,B10和S14339的得分比較分散,而S16120,A18199和A18750的得分則相對集中,影響了種源間的相互區分。從遺傳角度也反映了種源內家系間的遺傳變異信息,分散可能表明其遺傳變異大,集中則表示遺傳變異小。

圖2 粗皮桉種源間的PCA因子得分圖(部分)


圖3 種源S16120與A17861的PCA分析中第一主因子不同波段的載荷(其他種源間因子載荷與此相似)
對比粗皮桉天然種源間的遺傳距離與其NIRs光譜距離間的關系發現,種源遺傳距離與其光譜距離間普遍存在正相關關系,但個別種源間的遺傳距離與其光譜距離呈負相關。種源NIRs聚類結果與地理距離間的關系也非完全對應,這印證了粗皮桉群體不同地域間的基因交流對其遺傳親緣關系有較大的影響。NIRs數據的PCA聚類顯示,遺傳或光譜距離大的種源間存在嚴重重疊,而遺傳或光譜距離小的種源樣本反而會清晰聚類,這既表明了NIRs信息的敏感性,也在一定程度反映了粗皮桉各種源內存在不同水平的遺傳變異。