李 飛, 王清連, 李成奇
(現代生物育種河南省協同創新中心,河南科技學院棉花研究所,河南 新鄉 453003)
品種(系)資源是棉花育種的重要基礎材料,合理利用品種(系)資源,選擇適宜的親本進行雜交是育種工作的關鍵。目前,中國種植的陸地棉品種均是由美國的岱字棉、斯字棉、金字棉等種質資源衍生而來,遺傳基礎較狹窄[1-3],限制了親本材料的有效利用。因此,對品種(系)資源進行客觀評價具有現實意義。主成分分析是一種利用降維的思想,在損失較少信息的前提下,把多個指標轉化為幾個相互無關的綜合指標的多元統計方法[4-8]。聚類分析是一種用于生物資源分類和親緣關系研究的多元統計方法[9-10]。近年來,同時利用主成分分析和聚類分析研究小麥[11-12]、水稻[13]、大豆[14-15]、黍稷[16]等作物種質資源的報道較多,在棉花上也有一些報道。Brown[17]對美國區域試驗棉花品種的農藝和纖維品質性狀進行了主成分和聚類分析,結果表明,來自密西西比河三角洲、中部和德克薩斯高平原地區品種的遺傳基礎高于來自東部、墨西哥和圣華金河地區的品種。孫長發等[18]調查了河南省春棉區域試驗棉花品種的17個數量性狀,用主成分分析法提取了累計貢獻率達90.10%的前4個主成分,聚類分析法將所有材料分為5類。許乃銀等[19]利用長江流域棉花區域試驗品種的纖維品質數據進行了主成分和聚類分析,從8個纖維品質性狀中提取了4個主成分,并將20個試點劃分為4個纖維品質相似亞區。上述研究均是以參加區域試驗的少數品種為材料評價種質資源,對棉花育種實踐的指導意義不大。本研究選用中國近年來育成或引進的172份陸地棉骨干品種(系)為材料,對棉花19個農藝性狀進行主成分分析和聚類分析,為深入評價陸地棉品種間(系)的遺傳多樣性和合理選配親本組合提供理論依據。
供試的172份陸地棉品種(系)中,64份來自黃河流域棉區,25份來自長江流域棉區,55份來自西北內陸棉區,18份來自北部特早熟棉區,10份為國外引進材料(表1)。所有材料均經過多代自交。

表1 供試材料的來源、數目及名稱Table 1 Source,number and name of experimental materials
分別于2012、2013年將172份材料種植在河南科技學院棉花育種試驗田。隨機區組設計,單行區,3次重復;行長5 m,行距1 m,每行14~16株,大田常規管理。對2年所有材料,分別考查株高、主莖長、主莖節數、總果枝數、有效果枝數、果枝長、果枝節數、苗期(出苗期~現蕾期)、蕾期(現蕾期~開花期)、花鈴期(開花期~吐絮期)、生育期(出苗期~吐絮期)、果枝始節、始節高度、單株籽棉產量、單株皮棉產量、單鈴質量、衣分、衣指和籽指等19個農藝性狀。將2年6次重復各性狀的平均值作為該性狀的最終表型值。
利用 Excel 2010進行數據基本整理。利用SPSS 19.0軟件將各性狀標準化后,采用降維的方法進行主成分分析,基于主成分特征向量矩陣和各農藝性狀的標準化值,根據公式F=Z·A計算各供試材料的主成分得分值,其中F、Z、A分別為主成分得分值矩陣、標準化矩陣和特征向量矩陣[18,20]。利用NTSYSpc 2.10e軟件將數據標準化后,計算歐式(Euclid)遺傳距離,以類平均法(UPGMA)對172份材料進行聚類[21]。
172份供試材料19個農藝性狀的描述統計結果列于表2。由表2可知,供試材料在19個農藝性狀上均表現較大差異,變異系數由大到小依次為皮棉產量、籽棉產量、果枝長、始節高度、有效果枝數、果枝節數、果枝始節、主莖長、株高、衣指、單鈴質量、衣分、籽指、主莖節數、苗期、蕾期、花鈴期、總果枝數、生育期。其中,皮棉產量變異系數最大(29.92%),其次為籽棉產量(26.37%),生育期變異系數最小(5.08%),說明棉花的產量受基因型和環境影響最大,生育期受基因型和環境影響最小。

表2 供試材料19個農藝性狀的描述統計Table 2 Descriptive statistics of 19 agronomic traits of experimental materials
對19個農藝性狀數據標準化后進行主成分分析,獲得19階遺傳相關矩陣及其特征值和特征向量(表3)。前5個主成分特征值大于1,累計貢獻率達到80.253%,可反映大部分遺傳差異信息。表4列出了各主成分中排名前3的代表性材料及其主成分得分值。得分值越高,材料受此主成分的影響越大。由表3和表4看出,第1主成分的特征值為5.856,貢獻率為30.822%;特征向量除籽指外均為正值,其中果枝長、生育期和果枝始節的特征向量較大,分別為0.759、0.816和0.799,說明第1主成分得分值高的材料表現為果枝長、生育期長、果枝始節位高,代表性材料有荊8891、魯棉21號和鑫秋1號。第2主成分的特征值為3.450,貢獻率為18.157%;有效果枝數、籽棉產量、皮棉產量和衣指的特征向量較大且為正值,株高、主莖長、果枝長、果枝節數、苗期、蕾期、花鈴期、生育期和始節高度的特征向量為負值,說明第2主成分得分值高的材料產量高、生育期短、株型較好,代表性材料有百棉5號、冀棉958和岱字棉15。第3主成分的特征值為2.607,貢獻率為13.719%;株高、主莖長、主莖節數和總果枝數的特征向量較大且為正值,說明第3主成分得分值高的材料植株高,主莖節數和總果枝數較大,代表性材料有晉棉9號、新陸早48號和新陸早33號。第4主成分的特征值為1.995,貢獻率為10.500%;衣分和籽指的特征向量較大,其中前者為負值,后者為正值,說明第4主成分得分值高的材料衣分低而籽指高,代表性材料有岱紅岱、烏干達3號和晉棉14號。第5主成分的特征值為1.341,貢獻率為7.056%;特征向量為正值且較大的性狀有株高、主莖長、始節高度、單鈴質量、衣指和籽指,特征向量為負值且絕對值較大的性狀有主莖節數、總果枝數、有效果枝數、果枝長和果枝節數,說明第5主成分得分值高的材料植株較高,鈴質量較高,衣指和籽指較高,代表性材料有新陸早28號、新陸早 11號和新陸早27號。

表3 19個農藝性狀的主成分分析Table 3 Principal component analysis of 19 agronomic traits

表4 各主成分中排名前3的代表性材料及其主成分得分值Table 4 Representative materials and their principal component scores of the top-3 in each principal component
對172份陸地棉品種(系)的19個性狀數據標準化后,進行了聚類分析。在遺傳距離為5.62時可將所有材料分為10個類群,不同類群材料農藝性狀的平均值見表5。第Ⅰ類群包括4個材料:kk1543、晉棉6號、錦棉2號和黑山棉,其中,晉棉6號和黑山棉來自北部特早熟棉區,錦棉2號來自西北內陸棉區,kk1543為前蘇聯早期品種。該類群材料植株較矮,果枝長度短,單鈴質量偏低,生育期較短,衣分和衣指較低。第Ⅱ類群包括47個材料,分別是新陸早1號、新陸早5號、新陸早2號、新陸早4號、新陸早51號、新陸早6號、新陸早9號、新陸早37號、新陸早38號、新陸早7號、晉中200、新陸早46號、拉瑪干77、新陸早8號、中棉所13、18-3、新陸早42號、新陸早10號、新陸早40號、系9、新陸早20號、新陸早13號、中棉所27、岱字棉16、新陸早19號、新陸早34號、新陸早36號、新陸早21號、中棉所22、新陸早22號、新陸早32號、新陸早45號、新陸早47號、新陸早15號、新陸早18號、新陸早23號、新陸早24號、新陸早25號、蘇棉16、新陸早35號、新陸早27號、新陸早28號、新陸早39號、新陸早31號、新陸早11號、新陸早26號、中棉所19。絕大部分為西北內陸棉區的新陸早系列,所有性狀表現均適中。第Ⅲ類群包括2個材料,新陸早3號和新陸早49號,表現為植株較高,果枝長度最長,果枝節數最多,籽棉產量和皮棉產量較低。第Ⅳ類群僅有1個材料新陸早48號,表現為植株最高,總果枝數最多,果枝節數較少,生育期短,始節高度最高,單鈴質量較低,衣分最高。第Ⅴ類群包括30個材料,來自西北內陸和黃河流域2個棉區,分別是新陸早12號、中棉所31、遼棉18號、晉棉5號、中棉所33、中棉所26、百棉2號、豫棉5號、遼棉10號、遼棉16號、中棉所30、中棉所64、中棉所37、遼棉4號、遼棉5號、豫棉12號、錦棉4號、遼棉7號、新陸早17號、新陸早30號、中棉所42、中棉所50、中棉所58、中1707、中棉所24、中棉所36、中棉所10號、中棉所20、豫棉7號、中棉所14。表現為植株最矮,果枝長度較短,果枝節數最少,生育期最短。第Ⅵ類群由12個材料構成,分別是新陸早29號、新陸早33號、石選87、晉棉24號、貝爾斯諾、中棉所18、遼棉8號、綠早254、錦棉5號、黔農465、晉棉9號、晉棉14號。表現為總果枝數較多,生育期較短,單鈴質量較高。第Ⅶ類群包括43個材料,分別是中棉所12、石遠321、江蘇棉1號、魯棉1號、魯棉研29、中棉所23、冀棉12、鄂棉3號、鄂沙28、陜1155、PPM8、新陸早16號、中棉所40、新陸中36號、泗棉2、蘇棉9號、贛棉8號、徐州142、豫棉21號、川棉56、鑫秋1號、新陸早41號、百棉5號、晉棉45號、冀棉958、國欣棉3號、邯鄲802、中棉所35、晉棉13號、晉棉29、陜2365、邯鄲885、蘇棉1號、晉棉36號、中植棉2號、岱字棉15、遼棉19號、百棉1號、魯棉21號、魯棉28號、泗棉4、遼棉23號、豫棉9號。大部分來自于黃河流域棉區,表現為有效果枝數最多,籽棉產量和皮棉產量最高,單鈴質量最高,衣分和衣指最大。第Ⅷ類群包括30個材料,來自中國四大棉區以及國外引進,區域差異較大,具有生育期最長,單鈴質量較高的特點,分別是中棉所15、湘棉3、鹽棉48、中棉所25、蘇棉10號、中棉所34、湘棉10號、洞庭1號、錦棉1號、汾無195、陜棉4號、鄂棉14、中棉所17、豫棉1號、錢江9號、泗棉3、冀棉7號、晉棉8號、冀棉1號、斯字棉2B、99M7、晉中169、烏干達3號、鄂荊1號、荊8891、魯棉4號、魯棉10號、魯棉6號、中棉所8號、蘇棉6號。第Ⅸ類群包括2個材料,蘇棉12號和美國的99M4,表現為總果枝數最少,生育期長,果枝始節最高、籽棉產量和皮棉產量較低。第Ⅹ類群僅有1個材料岱紅岱,表現為植株較矮,有效果枝數最少,生育期長,籽棉產量和皮棉產量最低、衣指最高。

表5 不同類群材料農藝性狀的平均值Table 5 Averages of agronomic traits of clustered materials
主成分分析是將多個復雜的原始指標轉化為幾個具有代表性的互不相關的綜合指標(主成分),每個主成分都是原始指標的線性組合,保留了原始指標的大部分信息,從而減小分析的復雜性[4]。Panthee等[22]收集了尼泊爾的179份大蒜材料,調查8個農藝性狀,主成分分析提取的4個主成分可以解釋超過86%的總變異。趙德新等[23]對55個茄子種質材料的18個形態學性狀進行了主成分分析,將18個性狀簡化為6個主成分,代表81.071%的遺傳變異。本研究利用主成分分析將棉花19個農藝性狀簡化為5個主成分,累計貢獻率達80.253%,反映了大部分遺傳變異信息。當前,中國人多地少,糧棉爭地矛盾日益突出。為協調糧棉發展,在確保糧食生產安全的前提下,培育早熟、高產的棉花品種至關重要。由本研究主成分分析結果可以看出,第2主成分得分值高的材料生育期短、產量高。因此,在進行早熟、高產育種時,可考慮第2主成分得分較高的材料,如百棉5號、冀棉958和岱字棉15。
聚類分析發現,一些生態區域相同,親緣關系較近的材料被聚在一起。例如來自河南省的百棉2號和豫棉5號在遺傳距離為1.91處被聚在一起,來自北部特早熟棉區的遼棉18號和晉棉5號在遺傳距離為2.14處被聚在一起,新陸早系列的新陸早15號、18號、23號和24號在遺傳距離為2.87處被聚在一起。說明本研究利用包括株高在內的19個農藝性狀對陸地棉種質資源進行聚類,具有一定可行性。同時,從聚類的10個類群中發現,一些來自不同生態區的材料被劃分在同一類群。如第Ⅰ類群的4個材料中,2個來自于北部特早熟棉區,1個來自于西北內陸棉區,1個為前蘇聯品種;第Ⅷ類群包含了來自中國四大棉區和國外引進的材料。說明陸地棉材料間的遺傳差異與地理來源關系不大,親本材料應從不同的類群中選擇,這與其他學者的研究結果一致[11,14,23-24]。聚類的10個類群中,第Ⅴ類群生育期最短、株高最矮(代表性材料有中棉所50、中棉所58、新陸早17號、錦棉5號),第Ⅶ類群籽棉產量和皮棉產量最高(代表性材料有百棉1號、百棉5號、冀棉958、錦棉1號、岱字棉15)。根據主成分分析結果,在棉花早熟、高產育種時,應從第Ⅴ、Ⅶ類群和第二主成分得分值高的材料中選擇優異親本材料。此外,結合材料系譜圖發現,同系列的陸地棉材料常選用同一個優異的品種作為親本材料,如新陸早42號和新陸早51號均以新陸早10號作為母本,這可能是導致中國陸地棉遺傳基礎狹窄的一個重要原因[25],因此需不斷擴大不同地區不同系列品種間的交流和加強國外引種力度,提高中國棉花遺傳多樣性。值得說明的是,本研究的聚類分析是基于表型數據,由于表型性狀容易受環境因素的影響,只有嚴格控制環境因素,才能得到準確的聚類結果[11]。結合表型數據與分子標記數據評價種質資源[26-29],將更有助于探明種質間的親緣關系,提高親本選配的預見性。
[1] 劉文欣,孔繁玲,郭志麗,等.建國以來我國棉花品種遺傳基礎的分子標記分析[J].遺傳學報,2003,30(6):560-570.
[2] CHEN G,DU X M.Genetic diversity of source germplasm of upland cotton in China as determined by SSR marker analysis[J].Acta Genetica Sinica,2006,33(8):733-745.
[3] 張小娟,何團結,陸徐忠,等.陸地棉SSR核心引物篩選及95份骨干種質的遺傳多樣性分析[J].棉花學報,2011,23(6): 529-536.
[4] 何亮.主成分分析在SPSS中的應用[J].山西農業大學學報,2007,6(5):20-22.
[5] 婁麗娜,王 輝,王 成,等.腌制蘿卜種質資源的遺傳多樣性[J].江蘇農業學報,2013,29(6):1421-1426.
[6] 趙一洲,李正茂,劉福才,等.粳稻鹽粳188航天誘變SP2代的性狀變異與選擇[J].江蘇農業科學,2013,41(6):58-61.
[7] 陳培峰,王建平,黃 健,等.太湖地區香稻品種稻米品質性狀相關和聚類分析[J].江蘇農業學報,2013,29(1):1-7.
[8] 孫菲菲,王 夏,王 強,等.南京地區白菜種質資源遺傳主成分與聚類分析[J].江蘇農業科學,2014,42(3):106-109.
[9] 康美玲,田忠景,張倩倩.利用醇溶蛋白電泳圖譜分析不同玉米品種的遺傳多樣性[J].江蘇農業科學,2013,41(10): 70-72.
[10]阮燕曄,郭 瑞,崔震海,等.利用SSR技術分析遼寧省32個骨干玉米自交系的遺傳多樣性[J].江蘇農業科學,2013,41(11):29-32.
[11]周麗艷,郭振清,馬玉玲,等.春小麥品種農藝性狀的主成分分析與聚類分析[J].麥類作物學報,2011,31(6):1057-1062.
[12]王繪艷,史雨剛,馬昊翔,等.30份春小麥品系主要農藝性狀的聚類分析[J].中國農學通報,2014,30(18):60-64.
[13]李培富,楊淑琴,馬宏偉.寧夏水稻主要農藝性狀的主成分及聚類分析[J].中國農學通報,2006,22(12):162-166.
[14]李向華,常汝鎮.中國春大豆品種聚類分析及主成分分析[J].作物學報,1995,24(3):325-332.
[15]羅 珊,康玉凡,濮紹京,等.黑河地區55份大豆品種資源農藝性狀和營養成分的聚類分析[J].大豆科學,2009,28(3): 421-425.
[16]胡興雨,陸 平,賀建波,等.黍稷農藝性狀的主成分分析與聚類分析[J].植物遺傳資源學報,2008,9(4):492-496.
[17]BROWN J S.Principle component and cluster analysis of cotton cultivar variability across the US cotton belt[J].Crop Science,1991(31):915-922.
[18]孫長發,趙 暉,陳榮江.棉花新品種產量品質性狀的聚類分析與綜合評價[J].西北農業學報,2010,19(4):77-81.
[19]許乃銀,陳旭升,狄佳春,等.長江流域棉花纖維品質的區域特征研究[J].棉花學報,2003,15(4):221-226.
[20]陳榮江,張萬琴,王文峰,等.棉花數量性狀的因子分析與品種的聚類分析[J].福建農林大學學報:自然科學版,2009,38 (3):225-230.
[21]張 鵬,張海洋,鄭永戰,等.芝麻種質資源因子分析及聚類分析[J].中國油料作物學報,2008,30(1):71-78.
[22]PANTHEE D R,KC R B,REGMI H N,et al.Diversity analysis of garlic(Allium sativum L.)germplasms available in Nepal based on morphological characters[J].Genetic Resources and Crop Evolution,2006(53):205-212.
[23]趙德新,孫治強,任子君,等.茄子形態學性狀主成分分析及聚類分析[J].河南農業大學學報,2009,43(4):393-397.
[24]陳華萍,王照麗,魏育明,等.四川小麥地方品種農藝性狀與品質性狀的聚類分析[J].麥類作物學報,2006,26(6):29-34.
[25]郭志軍,趙云雷,陳 偉,等.陸地棉SSR標記遺傳多樣性及其與農藝性狀的關聯分析[J].棉花學報,2014,26(5):420-430.
[26]ZHANG Y X,ZHANG X R,CHE Z,et al.Genetic diversity assessment of sesame core collection in China by phenotype and molecular markers and extraction of a mini-core collection[J/OL].BMC Genetics,2012,13:102[2012-11-15].http://www.biomedcentral.com/1471-2156/13/102.
[27]LI G S,ZHANG L J,BAI C K.Chinese Cornus officinalis:genetic resources,genetic diversity and core collection[J].Genetic Resources and Crop Evolution,2012(59):1659-1671.
[28]BAI C K,WEN M M,ZHANG L J,et al.Genetic diversity and sampling strategy of Scutellaria baicalensis germplasm resources based on ISSR[J].Genetic Resources and Crop Evolution,2013 (60):1673-1685.
[29]耿立格,王麗娜,張 磊,等.河北省綠子葉黑豆種質資源表現型和ISSR標記遺傳多樣性分析[J].植物遺傳資源學報,2010,11(3):266-270.