焦 揚,葛慧玲
(東北農業(yè)大學理學院,哈爾濱 150030)
我國是李屬植物重要的起源中心,目前南北各省區(qū)均有種植。但目前我國李生產中存在的主要問題是栽植零星,長期沿用實生和分株繁殖,品種較為落后,忽視了地方良種的發(fā)掘、選育推廣與品種更新。為改變現狀,近些年我國從國外引進了歐亞系和北美系李子品種,在推廣國外品種的同時,我國又開發(fā)了國內的優(yōu)秀李種,如今在黑龍江省范圍內主要種植的李種就有三十余種。為了更好的推進優(yōu)秀李種的研究,對李雜交品種的譜系進行分類是十分必要的。一個雜交產生的新品種,其表現特征是更接近于父本還是母本,這一點,我們可以通過其花粉的特征進行判別[1-3]。
傳統(tǒng)的分析方法多為定性分析,對于李品種大量的觀測指標,要對其實現具體的定量分類是十分困難的,而聚類分析則可以解決這一問題[4-5]。首先通過因子分析來計算各指標之間的相關系數,從而選擇代表性較強的觀測指標作為聚類依據[6],通過特定的算法來計算各因素間的距離,再選擇特定的類的計算方法來計算因素與類、類與類之間的距離,從而將距離最接近的因素歸為一類。使用聚類分析方法,可以簡單的處理大量冗長的數據,實現精度較高的定量分析[7-9],并且可以明觀察到不同李品種之間的相似程度,對于李品種的譜系研究具有一定的幫助。
本次聚類分析選取的李花粉品種共有31種,均為黑龍江地區(qū)主要栽培的品種,見表1。
根據李花粉的主要紋飾特征[10],確定主要測量指標可分為以下幾類,見表2。

表1 聚類分析選取的李品種Table1 Plum breeds be used

表2 李花粉主要測量指標Table2 main physics elements of plum pollen
其中花粉無條脊的品種,其條脊寬賦值為0,花粉無穿孔的品種,其穿孔徑和穿孔頻率賦值為0。
以上31個品種,16項觀測指標構成的矩陣記為A,其中包含的元素為aij,i=1,2,…,31,j=1,2,…,16。由于矩陣的行、列數都比較多,為了簡化數據,降低矩陣的維數,應對數據進行必要的篩選。矩陣的行代表不同的品種,不能夠化簡,數據的列代表測量指標,希望能夠用較少的指標盡可能多的包含原始信息,而把代表性不強的指標剔除掉,這樣就可以減少矩陣的列數,達到簡化數據的目的。
為了降低觀測樣本的維數,對以上主要觀測指標進行篩選,采用因子分析法對數據進行因子分析。首先建立李花粉相似系數陣Q=(qij):

然后求矩陣Q的特征根λj及單位特征向量uj


采用SPSS軟件(13.0版本,下同)計算所得結果如表3。由方差貢獻率可知,前5個主成分的方差累計貢獻率已經達到了90.54%,可以認為其信息量足以代表原矩陣的信息。對因子載荷陣進行方差最大旋轉,我們得到了下面的正交因子見表4。
由表4可知,第一主成分在花粉赤道軸與極赤比指標上有較大載荷,它反映了花粉赤道軸的數據特征及極赤比;第二主成分在花粉穿孔頻率指標上有較大載荷,它反映了單位面積內花粉穿孔數量的指標;第三主成分在花粉條脊寬指標上有較大載荷,它反映了花粉條脊的寬度;第四主成分在花粉極軸指標上有較大載荷,它反映了花粉極軸的數值;第五主成分在花粉穿孔徑指標上有較大載荷,它反映了花粉穿孔的大小。

表3 李花粉紋飾觀測指標因子分析Table3 Factor analysis of plum pollen

表4 方差最大旋轉后的正交因子Table4 Orthogonal factorization
基于以上的因子分析結果,與實際情況相結合,我們選擇極軸平均值X1、赤道軸平均值X4、極赤比X7、條脊寬平均值X8、穿孔徑平均值X11和穿孔頻率平均值X14,一共六個指標作為聚類分析的主要指標。
以指標 X1、X4、X7、X8、X11、X14為基礎,對 31個李品種進行聚類分析,樣本距離的計算采用Minkowski距離法[11],設樣本之間的距離為dij(q),得到:

聚類方法采用Ward法[12],考慮樣本間的離差平方和最小。設將31個樣品分為類,記為G1,G2,…,Gk,用 Yi(t)表示 Gi中第 i個樣品,Nt表示 Gt中的樣品個數,Y(t)為Gt重心,則Gt中樣品的離差平方和為:

k個類的類內離差平方和為:

以上式計算得到的聚類結果如下,當選擇綜合聚類距離尺度為10時,31個品種整體上看可分為四類:
第一類:吉林黃干核、延吉李、大紫李、海林大紫李、小九三杏梅、長李15號、綏李三號、牡豐李、九臺晚李、長李84號、長李17號、龍園蜜李、躍進李、綏棱杏梅;
第二類:龍園秋李、矮甜李;
第三類:密山大紫李、綏陵18號、黃干核矮生、綏陵小黃李、巴彥大紅袍、黃干核實生、離核小黃李、烏蘇里李、牡紅甜李、綏陵紅、吉紅、大九三杏梅、綏陵大黃李、呼蘭大紅杏;
第四類:牛心李。
具體分類結果見圖1。以上的分類只是以數據為基礎的討論,并不一定與真實的李品種之間的親本關系完全符合。此外,聚類分析的方法多樣,其聚類結果受方法的影響較大,選擇Minkowski距離法和Ward聚類法是在進行大量聚類分析后選擇聚類結果與實際情況最為接近的一組。觀察以上的聚類結果,對于一些主要的李品種的親本關系可以進行初步的判定。
觀察以上的聚類結果不難發(fā)現,聚類結果中的第四類只有牛心李一個品種,牛心李是美洲李品種,從國外引進,果實呈卵圓形,其花粉與其他李品種的花粉相比,極軸與赤道軸都比較小,花粉表面無穿孔,可以從花粉的性狀上判別出該品種的特殊性,聚類分析將其單獨劃分為一類。
對于聚類分析結果中第二類,包含龍園秋李和矮甜李兩個品種。其中龍園秋李的親本為九三杏梅和臺灣李,矮甜李的親本為吉林六號和臺灣李,其中都包含臺灣李,這兩個品種被分為一類,說明這兩個品種在性狀上更接近于親本中的臺灣李。而同樣與臺灣李有親本關系的龍園蜜李被歸為第一類,則說明該品種在性狀上并不接近臺灣李。
對于其他的一些品種,牡紅甜李與巴彥大紅袍存在親本關系,被歸為第三類,同樣與巴彥大紅袍存在親本關系的牡豐李沒有與巴彥大紅袍歸為一類,說明其性狀更接近于另一親本七月紅李。牡紅甜李與牡豐李的親本同樣為巴彥大紅袍與七月紅李,但是聚類結果完全不同,說明這兩個品種是具有相同親本但性狀表現完全不同的。同樣,長李15號與綏李有親本關系,被歸為第一類。
如果只是單純的觀察各李品種之間的距離,可以對其品種的相似性有一個基本的判斷,比如,長李系列品種的15號、17號和84號,距離比較接近,同時被歸為第一類,說明以上三個品種的性狀是最為接近的;而黃干核矮生和黃干核實生,其距離則較遠,說明這兩種李品種的性狀差異較大。
根據聚類結果可以發(fā)現,聚類分析對于具有親本關系的李品種的劃分基本是正確的,其聚類結果可以認為是有效的。與其他研究者的研究結果類比,發(fā)現其結論基本一致[13-15]。對于某一品種其性狀是更接近于父本還是更接近于母本,可以從聚類結果得到基本的判斷。如果要進行更進一步的聚類,可以對每一小類進行單獨的、進一步的聚類,以得到更為精確的結論。對于新產生的李品種,同樣可以在原有聚類結果的基礎上進一步結合判別分析法進行類別的判定。

圖1 聚類分析結果Fig.1 Results of cluster analysis
本次分析采用了李花粉的有關數據作為聚類分析的標準,同時也可以采用李品種果實的數據進行聚類,例如果型、果重、香味、口感、可溶性固形物含量、總糖、總酸等指標,但是果實數據的各項指標大部分屬于低級別變量,即無序變量,無序變量對聚類結果的干擾較大,如何將其轉化為有序變量,實現聚類還有待進一步的研究。
[1]張樹軍,黃紹西,張紹鈴,等.李等15個李品種S基因型鑒定及其多態(tài)性分析[J].果樹學報,2008,25(3):338-342.
[2]梁宏偉,陳發(fā)菊,何正權,等.十二個李品種的花粉形態(tài)的研究[J].北方園藝,2008(12):5-8.
[3]仲崇海.黑龍江省李、杏的生產現狀和發(fā)展趨勢[J].中國林副特產,2006,82(3):74-75.
[4]胡國富,詹云,李成雁,等.寒地油豆角花粉電鏡觀察與聚類分析[J].東北農業(yè)大學學報,2010,41(7):79-83.
[5]張淑珍,徐鵬飛,靳立梅,等.野生大豆對大豆疫霉根腐病抗感反應及聚類分析[J].東北農業(yè)大學學報,2009,40(11):1-6.
[6]殷瑞飛,朱建平.數據挖掘中一種新的聚類方法-基于對應分析與因子旋轉[J].統(tǒng)計研究,2008,25(1):93-97.
[7]李淑華,邢紹凌,楊丹萍,等.聚類分析法在玉米種質資源中的應用[J].農業(yè)與技術,2008,28(5):43-45.
[8]胡興雨,陸平,賀建波,等.黍稷農藝性狀的主成分分析與聚類分析[J].植物遺傳學報,2008,9(4):492-496.
[9]夏富才,張春雨,趙秀海,等.早春草本植物群落結構及其聚類分析[J].東北師大學報:自然科學版,2008,40(4):109-114.
[10]劉海榮.黑龍江省抗寒李資源性狀描述及評價[J].黑龍江農業(yè)科學,2005(6):28-31.
[11]楊志奇,楊春剛,湯翠鳳,等.中國粳稻地方品種孕穗期耐冷性評價及聚類分析[J].植物遺傳資源學報,2008,9(4):485-491.
[12]孫海燕,王國強,蔡一林,等.西南地區(qū)常用玉米自交系的配合力及聚類分析[J].玉米科學,2008,16(1):29-32.
[13]劉威生.李種質資源遺傳多樣性及主要種間親緣關系的研究[D].北京:中國農業(yè)大學,2005:34-36.
[14]馮晨靜.李種質資源RAPD、SSR、ISSR親緣關系鑒定及遺傳多樣性研究[D].保定:河北農業(yè)大學,2005:31-32.
[15]楊紅華.李、杏屬間遠緣雜交及種質創(chuàng)新的研究[D].泰安:山東農業(yè)大學,2004:66-67.