陳庭木 徐波 陳子巖 邢運高 王寶祥



摘要:為了建立水稻耐旱性判定適用且簡化的標準,通過對175份水稻資源在水旱2種環境下的種植試驗,系統測定地上部與根鮮質量及其他重要農藝性狀,以旱、非旱環境性狀比值作各性狀脅迫系數,采用多種統計方法分析旱脅迫敏感指標,采用3種分類方法試圖對所研究資源作耐旱性最優分類。結果發現,以旱處理地上部與根鮮質量為分類變量分為5類,利用輪回選擇算法與多元方差分析方法結合,能對耐旱性作最優分類。最終篩選出5份耐旱性強的資源,其中三二矮與鴨血糯為優秀耐旱資源,可供耐旱選擇使用;建立一個簡易耐旱性標準,旱處理環境下地上部鮮質量達45 g以上,根鮮質量達1.5 g以上。
關鍵詞:水稻耐旱性;脅迫效應;動態聚類;最優分類;輪回選擇算法
中圖分類號:S511.01 ? 文獻標志碼: A ?文章編號:1002-1302(2021)10-0052-05
發掘水稻抗旱資源、提高水稻抗旱能力、研究水稻抗旱機制已成為目前稻作研究的熱點之一[1]。旱稻獲得最高產量時,比水稻約可節約30%的灌溉水量,節水潛力巨大[2]。旱稻育種離不開水稻的耐旱性鑒定,而耐旱性鑒定離不開適當的指標選擇及準確分類。湯圣祥等研究指出,旱稻育種要求稻根系發達,根粗而長,吸水能力強,另外還要葉片角質層厚,氣孔應變能力強[3]。胡運高等研究指出,播抽歷期、株高、單穗質量3項指數的變化與品種耐旱能力關系密切[4]。馬廷臣認為,耐旱性與根系關系密切,與湯圣祥等結論相一致[3,5]。張燕之認為無論采用何種指標,育成高產品種才至關重要[6]。唐清杰等篩選鑒定出一批1級耐旱的野生稻資源[7],陸崗等用人工干旱和極限干旱后復水2種處理相結合的方法,篩選出(5)6013、紅早糯、雙桂1號、南京11/(5)6145、黃谷等31份耐旱性強的種質材料[8]。對耐旱性鑒定數據的有效分類,是準確判定水稻耐旱性的前提。
目前,統計分類研究中有系統聚類及動態聚類2類方法,前者經過近百年的發展,已經完善,其中主要包括8種系統聚類方法,聚類效果最好的是最小離差平方和法(WARD法)。孔憲旺等采用系統聚類法將20份種質聚為3個組群,其中第Ⅱ組群屬理想的苗期耐旱種質[9]。系統聚類法計算結果穩定,但有不可克服的缺點,達不到最優分類的目的;動態聚類法相對而言更有優勢,動態聚類主要代表為K-MEANS聚類法,在多個學科被廣泛采用,其計算速度快,但不穩定,不同的初始分類方案會有不同的分類結果,達不到全局最優[10-11]。黃麗娟等研究了最小組內平方和法對單指標變量作最優動態聚類及縮張算法,實現多元指標最優動態聚類[10-11]。多元指標最優聚類采用協方差陣跡作為分類優化指標,不利于克服變量間的相關性及量綱不同的干擾,陸林花等研究了遺傳算法對動態聚類算法的改進,但遺傳算法因早熟收斂的特性,不能穩定地達到全局最優,可能陷入局部最優[12-14]。陳庭木等研究了一種新的進化算法——輪回選擇算法,計算結果更穩定,能穩定達到全局最優解[15]。基于陳庭木等的算法,將目標函數改寫成基于多元方差分析的類間差異指標VA,將分類中心作為待求參數,以VA最大化為標準,不斷施行進化計算,直到分類方案VA收斂到極大值結束。筆者對175份水稻資源進行耐旱性鑒定,并應用新的最優動態聚類方法研究耐旱性的最優鑒定,以期為水稻耐旱性鑒定及育種提供理論支持及育種材料。
1 材料與方法
1.1 材料與試驗考察指標
以連云港市農業科學院引進的175份水稻資源進行耐旱性鑒定,并以正常栽培作對照。試驗于2019年于江蘇省連云港市農業科學院東辛農場試驗基地進行。干旱脅迫試驗在旱池中進行,每個品種種1行,行長 133 cm,行距 30 cm。返青后停止灌水,當土壤體積含水量達30%時開始灌水,灌到土壤含水量飽和為止,不留水層,直到土壤體積含水量再次達到 30%;以此循環,直到蠟熟期停止。其他管理措施同一般水田[16]。
系統測定了地上部鮮質量、根鮮質量、株高、穗長、有效穗、總粒數、結實率及千粒質量在正常栽培及干旱栽培條件下的表現,計算各指標的脅迫指數,以各指標脅迫指數平均計算綜合脅迫指數。
1.2 分析方法
采用3類分類方案。
1.2.1 以水稻干旱脅迫條件下地上部鮮質量及根鮮質量2個指標作二元系統聚類,采用馬氏距離作樣本間初始距離,并以WARD法作系統聚類,以分為5類的分類方案對每個指標作方差分析。
1.2.2 以水稻地上部鮮質量及根鮮質量脅迫指數2個指標作二元動態聚類,設定分為5類,對分類中心共10個參數作優化計算,以尋找使所有樣本在分為5類時,類間差異最大化的分類方案作為最優方案。計算各樣本與各分類中心的馬哈拉諾比斯距離,以最小距離為歸類標準,形成分類方案,以單因素多元方差分析計算各類間的多元指標差異,以差異最大化為分類方案選擇標準,在每代進化計算中對考察樣本集合僅保留較佳的指定個數(如100個),下代進化計算以上代較優分類方案為基礎,再次通過雜交、突變2種變異手段形成新的分類方案,并完成較優分類方案的篩選。如此重復每代變異計算,直至分類方案收斂到指定標準形成最優分類方案。以上在陳庭木等研究成功的一種進化算法——輪回選擇算法[15,17-18]基礎上,改進目標函數計算規則與數據輸入輸出模塊而成,目標函數使用分類方案的類間協方差矩陣與總協方差陣的行列式值的對數比作返回值。本方法采用計算數學與多元統計分析結合的精確分類方法,減少了人為分類造成的分類偏差,做到更精準地分類,類間差異極大化,做到分類回判率100%,遠高于傳統多元分類方法。
1.2.3 以水稻在干旱生長環境中的地上部與根部鮮質量2個指標作二元分類,設定分為5類,對分類中心共10個參數作優化計算,方法同“1.2.2”節。
1.3 分析軟件
采用Excel 2010作基本統計與分析平臺,用于概括統計、主成分因子分析(待申請軟件著作權)與作圖。采用單因素重復觀察模型作方差分析,最優動態聚類方法采用陳庭木等編寫C+ +類庫(軟件著作權《連農統計類庫軟件V1.0》編號:2016SR266205),相關分析等采用文獻[17]的方法。數據交換接口采用C+ +類庫(軟件著作權《連農DSML文件讀寫程序軟件V1.0》編號:2017SR562716)處理。最優多元動態聚類分析采用陳庭木等研究成功的輪回選擇算法基礎類RSBase繼承,采用C+ +編程擴展成新的進化算法類RSMclassify計算(待申請軟件著作權)。
2 結果與分析
2.1 水稻各指標表現
由圖1可知,各指標在脅迫條件下生長均受到抑制,其中地上部鮮質量及根鮮質量受影響較大,其次為株高、總粒數與有效穗,結實率、穗長與千粒質量影響相對小。由圖2脅迫指數可知,根鮮質量受脅迫程度最大,其次是地上部鮮質量。鑒于根與地上部生長是其他指標形成的基礎,故耐旱性鑒定應當將根與地上部的生長作為首要考察因素。
2.2 主成分分析與因子旋轉分析
對8種脅迫指數進行主成分分析,前6個主成分的變異才占到變異的85%以上,顯示脅迫指數中的多重共線性不嚴重,各脅迫指數間相關性不強(僅地上部鮮質量脅迫指數與根鮮質量脅迫指數間,穗長脅迫指數與穗總粒數脅迫指數間有極顯著偏相關)。因子分析表明,經過5次因子最大化方差正交旋轉,獲得旋轉后因子載荷陣(表1),因子1主要由地上部鮮質量脅迫指數與根鮮質量脅迫指數構成,反映了脅迫指數28%以上的變異。結合圖2,選定地上部鮮質量及根鮮質量相關指標作為分類依據作進一步研究。
2.3 系統聚類分析結果
采用旱脅迫地上部鮮質量及根鮮質量2個指標,以馬氏距離作聚類距離,采用最小離差平方和法作系統聚類,表2顯示在5類向4類并類時,并類距離急劇增加,所有分類方案的多元方差分析均極顯著。由表3可知,以旱脅迫狀態下的根鮮質量評判耐旱性更為關鍵,此結論與前人研究結果[3,5]相同。將類342判為耐旱類,共18個樣本,類339判為不耐旱類,5類總趨勢為根弱則地上部相對弱,且脅迫指數也低; 根強則脅迫指數也相對高。相對于一般分類要求,系統聚類結果較為理想,且計算結果也穩定,方法確定,結果唯一。
2.4 地上部鮮質量與根鮮質量脅迫指數最優二元動態聚類分類結果
由表3可知,采用動態二元聚類有極明顯效果,脅迫指數在類間差異達到了極大化,地上部鮮質量脅迫指數、根鮮質量脅迫指數類間方差分析F值分別為90.295 5、252.574 8, 脅迫指數分化極大,但地上部及根鮮質量分化不理想,均不是最高,分化程度不如采用旱脅迫下地上部及根鮮質量的系統聚類所得分類結果。過分強調脅迫指數選擇對耐旱性選擇有利,但不利于選擇旱脅迫下豐產品種,此與前人研究結果[6]相似。與系統聚類共同趨勢是無脅迫生長量越大,耐旱性越差。
2.5 脅迫條件下地上部鮮質量與根鮮質量最優二元動態聚類分類結果
對脅迫條件下地上部鮮質量與根鮮質量作最優二元動態聚類,由表5可知,分類指標在類間差異達到了最大化,類間方差分析F值分別達到223.088 4、107.461 7,明顯高于上文2種聚類方法,歸屬于耐旱類別的品種在旱脅迫條件下地上部與根鮮質量要高于其他分類方法。本法篩選耐旱條件下的豐產品種,比脅迫指數選擇要直接且簡潔。本法篩選出2類耐旱品種類別,一種為強根中強地上部,一種為中強根強地上部。2類在地上部鮮質量上有顯著差異,但未達極顯著水平,且均極顯著高于其他類別。從耐旱根作用看,強根中強地上部材料更有價值,且材料份數少,這與前人研究結論[5]相似。從類4特性分析可知,強耐旱品種在無脅迫條件下,根生長量也較高且株高偏矮,有效穗與其他類差異未達極顯著水平。本研究可得出,耐旱品種選育應重視根生長量,沒有強根就沒有耐旱品種;株高宜偏矮,有利于節水,減少水分無效蒸發,可以間接提高品種耐旱性;有效穗應選擇較強的分蘗類型,穗粒數與千粒質量在各類間差異不大。這與前文2種分類方法有所不同,從穩產性角度說,過分強調大穗大粒不利,與普通育種相同。
本研究篩選出5個耐旱品種(表6),分別為三二矮、XX白稻、越粳618、橫縣畚禾、鴨血糯。三二矮品種非脅迫生長量不大,但脅迫條件下生長量最大,屬于典型的耐旱品種,株高適中,穗型偏大,適合與豐產型品種雜交而選擇豐產耐旱品種。鴨血糯屬于特種稻品種,株高適中,豐產性較好,適合選育耐旱特種稻品種。其他3個品種相對來說不如這2個資源。
2.6 3種聚類分析結果對比
3種聚類方法各有特點,其中系統聚類方法系成熟方法,聚類穩定,可以作圖分析各類間并類距離并判斷樣本間相似程度。人工直觀選擇適當的分類,但是否真的類間方差最大化,值得商榷。本研究中未達類間方差最大化且評出的耐旱樣本數過多。對脅迫指數作最優動態聚類,能使脅迫指數在類間差異達到最大化,但由于脅迫指數選擇不利于選擇旱脅迫下的高產品種,僅是選擇脅迫指數高的品種,而實質上很多是低產品種,在生產上難以利用。依據旱脅迫下地上部與根的鮮質量作為分類指標,采用最優動態聚類算法分類,能獲得更精確結果,更易篩選得到耐旱且豐產的品種資源,如三二矮、鴨血糯。
最優動態聚類分析,采用了一種計算智能算法,對設定分類數后的分類中心進行規劃求解,且以多元方差分析與計算智能相結合,篩選給定分類數下的最優分類方案,經多次試算,分類穩定,分類結果明顯優于系統聚類,是值得推廣的新聚類方法。
3 討論與結論
3.1 最優動態聚類法在樣本精確分類上的重要價值
動態聚類在生物學、經濟學、醫學及計算機圖像識別等多個領域有重要應用,但經典動態聚類如K-MEANS聚類結果不穩定,很難達到最優分類的目的。系統聚類分類穩定性較好,但類間方差分析顯著性達不到最優的目的。陳庭木等研究成功一種新的進化算法——輪回選擇算法,相較于傳統的遺傳算法,能更穩定地達到全局最優解[15,17]。受其啟發,將其開發的RSBase類改造成適合多元最優分類的計算機程序,向其中加入多元方差分析功能,找到全局最大類間差異的分類方案,經多次試算,本方法可穩定達到全局最優解,是一種可靠的分類方法,且能做到回判準確率100%,顯著優于一般多元統計分析中的系統聚類、K-MEANS動態聚類、逐步判別分析等統計方法,有廣泛的應用價值。由于采用多元統計方法計算分類方案及其統計參數,涉及大量矩陣求逆及乘法計算,計算用時較傳統動態聚類K-MEANS多,本次分類計算近2 h,但結果更精確且穩定,可用于對待研究事物精確分類,且對回判準確性有高要求的分類任務。不過以后還要加強算法改進研究,在保證算法穩定性與準確性前提下,提高計算效率。
3.2 水稻耐旱性鑒定與分類標準問題
水稻耐旱性鑒定是旱稻育種的核心,學術研究中多以脅迫指數判斷,脅迫指數研究要同時設定非脅迫與脅迫種植環境,工作量大,不利于水稻育種工作的進行。本研究中依據旱脅迫環境下根與地上部鮮質量作為選擇依據,不僅減少了一半種植工作量,還能簡化測定工作,貫徹“根”是根本才是旱稻選擇與育種的根本方略。本研究選擇出的2種代表型耐旱品種,可作為旱稻選擇的對照標準與雜交利用材料,可將在旱脅迫條件下,地上部鮮質量45 g以上、根鮮質量1.5 g以上,作為耐旱品種判定標準。
參考文獻:
[1]王一平. 旱稻種質資源遺傳多樣性研究[D]. 北京:中國農業科學院,2006.
[2]鄒桂花. 水、旱稻需水差異及后期抗旱性遺傳研究[D]. 武漢:華中農業大學,2007.
[3]湯圣祥,閔紹楷. 水稻品種改良技術講座(9)耐逆境育種[J]. 中國稻米,1998(3):38-39.
[4]胡運高,王 志,黃廷友,等. 水稻品種耐旱性鑒定的形態學評價指標研究[J]. 西南科技大學學報(自然科學版),2006,21(1):102-108.
[5]馬廷臣. 全基因組表達分析不同耐旱性水稻根系對不同強度干旱脅迫反應研究[D]. 武漢:華中農業大學,2009.
[6]張燕之. 水稻抗旱性鑒定方法與指標探討[J]. 遼寧農業科學,1994(5):46-50.
[7]唐清杰,嚴小微,徐 靖,等. 海南普通野生稻資源不同生長期耐旱性鑒定與篩選[J]. 福建農業學報,2017,32(2):130-133.
[8]陸 崗,蔡慶生,梁耀懋,等. 水稻種質資源苗期耐旱性鑒定初報[J]. 廣西農業科學,1998(4):7-8.
[9]孔憲旺,孫明茂. 水稻不同種質苗期耐旱性綜合評價[J]. 江西農業學報,2019,31(4):1-7.
[10]黃麗娟. 動態聚類新方法及最優聚類算法研究[D]. 揚州:揚州大學,2006.
[11]顧世梁. 實現動態聚類全局最優的一種算法[J]. 江蘇農學院學報,1996(1):57-65.
[12]陸林花. 一種新的基于遺傳算法的動態聚類算法[J]. 計算機仿真,2009,26(7):122-125,158.
[13]姜靈敏. 基于改進遺傳算法的動態聚類方法及其應用[J]. 科技管理研究,2005,25(11):217-219.
[14]謝全敏,夏元友. 基于遺傳算法的邊坡穩定性評價的動態聚類法[J]. 巖土力學,2002,23(2):170-172,178.
[15]陳庭木,方兆偉,王寶祥,等. 非線性回歸模型參數估計的輪回選擇算法[J]. 江蘇農業科學,2019,47(18):253-260.
[16]王寶祥,余劍鋒,徐 波,等. 水稻種質資源耐旱性鑒定與評價[J]. 北方農業學報,2018,46(5):1-8.
[17]陳庭木,徐大勇,秦德榮,等. 偏相關與通徑分析的EXCELVBA程序設計[J]. 農業網絡信息,2007(3):101-103.
[18]朱旭東. 水稻與陸稻的耐旱性及產量潛力的研究[D]. 杭州:浙江大學,2006.