陸國泉,彭 琳
(云南農業大學/云南省高校農業信息技術重點實驗室,云南昆明 650201)
自然界植物資源極其豐富,其中在《中國植物志》中記載的植物就達31 142種[1]。即使是一個資深的植物學專家也不可能鑒別出所有的植物,植物知識也往往存在著存放分散、不易檢索等特點,且經典分類學后繼乏人,相關的計算機應用也處于較低的水平[2]。因此,植物鑒別對植物知識的快速檢索具有重要意義。當下研究人員主要采用以下方法進行植物鑒別:人工鑒別法、人工輔助法(光譜法、色譜法、質譜法)及基于計算機圖像識別的方法。人工鑒別法往往需要植物領域知識的支持,對研究人員的素質要求非常高,因此適用面較狹窄;人工輔助法則須要進行大量的樣品采集、標本制作和較長時間的觀測,因此工作效率較低;基于計算機圖像識別的植物鑒別法大多選擇葉片作為鑒別依據,且不適用于葉部特征不明顯的植物,目前的應用水平較低[3]。基于傳統的形態學和統計數學形成了數量分類學[4],并利用該方法先后實現了繁縷屬的分類[5]、金銀花的選育[6]、山羊豆族植物的分類[7]以及中國傳統大菊品種的分級[8]。雖然基于數量的植物分類在多個方面實現了應用,但大多適用于少數品種的精確分類,不具普適性,且在計算機應用中的研究較少,尤其是將其作為信息檢索的依據。本研究首先使用正態云模型計算出植物各個形態的隸屬度,接著使用灰色關聯分析對植物進行綜合評價,最后根據綜合評分鑒別出植物的屬種信息。
本研究的植物知識來源于由中國科學院中國植物志編輯委員會歷時45年編撰而成的《中國植物志》,它是目前世界上最大型、種類最豐富的一部植物志,共收錄309科3 299屬維管植物[9]。由于該書采用數字的方式對植物進行描述,且大多附有植物照片,因此極其適合用作文本的知識來源,同時,該書中附帶的圖片也可以對結果進行檢驗。
根據科學性、可操作性、完備性、數據可獲性等原則[10]選取葉長、葉寬、株高、葉柄長及生境海拔作為評價指標。由于植物具有一定的生長周期,為了擴大應用范圍,本研究暫不選取花、果等形態特征作為評價指標;同時,植物在生長發育過程中,葉形也會不斷發生變化[11],因此也不考慮葉形作為評價指標。
由于時間限制,暫時不考慮將《中國植物志》中3 229屬植物作為本研究的研究范圍,本研究結合客觀的需求選取云南省種子植物特有屬125屬共246種植物[12]作為本研究的研究范圍,旨在為云南地區植物保護研究提供便捷的方法。本研究采用區間的方式來描述植物的外形特征,以Ex1、Ex2分別表示植物外形特征數據的下限、上限,然而《中國植物志》對一些植物的外形描述并沒有采用區間的方式而是采用單個數值L來描述。因此,經過對《中國植物志》的數值研究及植物領域專家的建議,對采用單個數值描述植物外形的區間統一設置為[L×(1-0.2),L×(1+0.2)]。對于無葉柄的植物,結合正態云模型的特點和實際應用將無葉柄植物的葉柄長的范圍統一設置為[0.000 1,0.000 7],實際測量的數字統一設置為0.000 4。對于爬藤類植物,默認其株高的范圍為[0.000 1,0.000 7],同樣將實際測量的數字設置為0.000 4。此外,對于未注明生境海拔的植物,根據該植物的分布地區將其生境海拔設置為[Hmin,Hmax],其中,Hmin為該植物最低分布地區的海拔,Hmax為該植物最高分布地區的海拔。
本研究隨機選取10種植物作為研究實例,其中包含了同屬不同種及不同屬的情況,具體數據如表1所示。

表1 植物外形特征數據
注:Ex1、Ex2分別表示植物外形特征數據的下限、上限。
本研究測試的地膽旋蒴苣苔位于紅河州元陽縣境內的小新街鄉,其海拔為753 m。經過外部測量,其葉長為5.7 cm,葉寬為1.9 cm,由于不具葉柄,因此其葉柄長為 0.000 4 cm,由于是藤類植物,因此其株高為0.000 4 cm。

1.4.2 植物隸屬度的計算 根據建立好的植物形態數據庫以及正態云模型,植物隸屬度計算步驟如下:


表2 植物外形特征的期望值及熵

表3 植物各個指標的隸屬度

表4 1~9比率標度的意義

表5 判斷矩陣

表6 各指標的權值
步驟二:利用灰色關聯分析法進行綜合評價。灰色系統理論是由鄧聚龍創立的一門學科,通過分析系統中各個因素的關聯程度來對事物進行綜合評價[26]。本研究定義Xi(i≥1)為每種植物的各個指標的隸屬度向量,通過比較排序將X0={0.782 7,0.637 6,1.000 0,1.000 0,0.850 4}定義為參考向量,然后計算出每種植物的各指標差值|Xi-X0|,如表7所示。

表7 植物各指標差值


表8 植物各個指標的關聯系數
根據公式Ge(i)=Xi·We計算植物的等權關聯度,其中,We=(0.2,0.2,0.2,0.2,0.2)T;利用公式Gw=Xi·Ww計算植物的加權關聯度。由表9可知,關聯度排名第1的植物名稱為地膽旋蒴苣苔,與實際結果相符。在加權關聯度中排名第2的植物為大花旋蒴苣苔,而在等權關聯度中排名第2的植物為鷺鷥草。根據《中國植物志》記載,大花旋蒴苣苔和地膽旋蒴苣苔為同屬不同種植物,表明使用層次分析法給各個指標分配權值明顯提高了植物鑒別的準確率。
由于不具備實地測量246種植物的條件,本研究設計了以下5組試驗:第1組測量值為Ex×(1-0.1);第2組測量值為Ex×(1+0.1);第3組測量值為Ex×(1-0.2);第4組測量值為Ex×(1+0.2);第5組測量值為Ex。定義準確率為P=F/A,其中,F表示準確鑒別出來的植物數量;A表示數據庫中所有植物的數量,即246種云南省種子植物特有屬。由表10可知,使用本研究的方法基本可以滿足植物鑒別的需求,只要鑒別人員掌握基本的植物知識便可以對植物進行無損鑒別。

表9 植物各個指標的關聯度及排序

表10 5組對照試驗鑒別準確率的測試結果
針對研究人員因不具備海量、完備的植物知識而不能識別每種植物的問題,本研究提出基于正態云模型的植物鑒別算法。該算法融合了植物數量分類思想,結合層次分析法和植物專家的意見對各指標進行權重分配,從而考慮了各個因素對植物鑒別不同的影響程度,最后使用灰色關聯分析法對植物的隸屬度進行綜合評價。結果表明,在鑒別云南省種子植物特有屬試驗中本研究的方法有效、可行。由于《中國植物志》是由80多個科研單位共計312位植物專家編撰而成,加之植物本身形態各異,導致一小部分植物的信息不完整,因此數據無法被錄入植物外部形態特征數據庫。同時,為了使本研究方法的通用性更強,本研究采用5個最基本的形態特征作為植物鑒別的指標。在以后的研究中,將聯合植物專家進一步完善植物外部的形態數據,采用更多的指標,從而提高植物鑒別的準確率,同時也會將本研究的方法引入到植物領域的信息檢索研究中。
[1]中國科學院中國植物志編輯委員會.中國植物志[M].北京:科學出版社,2004.
[2]馬金雙.中國植物分類學的現狀與挑戰[J].科學通報,2014,59(6):510-521.
[3]陳永富,劉 華,陳 巧.植物鑒別方法研究現狀與展望[J].世界林業研究,2014,27(4):18-23.
[4]張明理.植物數量分類學的流行方法[J].西北植物學報,1986,6(1):67-80.
[5]陳旭波,孟世勇,張小飛,等.石竹科繁縷屬與孩兒參屬的數量分類[J].植物學報,2014,49(4):432-439.
[6]張山山,黃璐琦,袁 媛,等.栽培金銀花農藝性狀的數量分類學研究[J].中國中藥雜志,2014,39(8):1379-1385.
[7]史傳奇,劉 玫,王 臣.東北豆科山羊豆族4屬植物葉形態特征及數量分類學研究[J].草業學報,2015,24(5):182-189.
[8]雒新艷,宋雪彬,戴思蘭.中國傳統大菊品種數量性狀變異及其概率分級[J].北京林業大學學報,2016,38(1):101-111.
[9]駱 洋,何延彪,李德銖,等.中國植物志、Flora of China和維管植物新系統中科的比較[J].植物分類與資源學報,2012,34(3):231-238.
[10]高明美,孫 濤,趙天燕,等.正態云模型在皖江地區土地生態安全評價中的應用[J].湖南農業大學學報(自然科學版),2015,41(2):196-201.
[11]黃文娟,李志軍,楊趙平,等.胡楊異形葉結構型性狀及其相互關系[J].生態學報,2010,30(17):4636-4642.
[12]馮建孟,朱有勇.云南地區中國種子植物特有屬的研究[J].生態環境學報,2010,19(3):621-625.
[13]李德毅,劉常昱.論正態云模型的普適性[J].中國工程科學,2004,6(8):28-34.
[14]劉常昱,李德毅,潘莉莉.基于云模型的不確定性知識表示[J].計算機工程與應用,2004,40(2):32-35.
[15]王迎超,靖洪文,張 強,等.基于正態云模型的深埋地下工程巖爆烈度分級預測研究[J].巖土力學,2015,36(4):1189-1194.
[16]楊朝暉,李德毅.二維云模型及其在預測中的應用[J].計算機學報,1998,21(11):961-969.
[17]張 楊,嚴金明,江 平,等.基于正態云模型的湖北省土地資源生態安全評價[J].農業工程學報,2013,29(22):252-258.
[18]李 陶,李付偉,李向新,等.地震災害風險的正態云模型綜合評價——以畢節市為例[J].中國安全科學學報,2015,25(10):166-171.
[19]Saaty T L.How to make a decision:the analytic hierarchy process[J].European Journal of Operational Research,1990,48(1):9-26.
[20]莊 倩.基于AHP的江蘇省高標準農田綜合生產能力評價[J].江蘇農業科學,2016,44(6):511-515.
[21]焦 藝,劉 璇,畢金峰,等.基于灰色關聯度和層次分析法的油桃果汁品質評價[J].中國食品學報,2014,14(12):154-163.
[22]王 青,戴思蘭,何 晶,等.灰色關聯法和層次分析法在盆栽多頭小菊株系選擇中的應用[J].中國農業科學,2012,45(17):3653-3660.
[23]楊天天,潘曉星,穆立薔.基于葉片圖像特征數字化信息識別7種柳屬植物[J].東北林業大學學報,2014,42(12):75-79.
[24]王麗君,淮永建,彭月橙.基于葉片圖像多特征融合的觀葉植物種類識別[J].北京林業大學學報,2015,37(1):55-61.
[25]Satty T L.A scaling method for priorities in structure[J].Journal of Mathematical Psychology,1978,1(1):57-68.
[26]鄧聚龍.灰色系統基本方法[M].武漢:華中科技大學出版社,2001:17-30.