王 彪 王 筠 屈軍樂
(1.深圳大學生命與海洋科學學院,深圳,518060;2.深圳大學光電工程學院,光電子器件與系統重點實驗室,深圳,518060)
雉雞(Phasianuscolchicus),頸部下方有一圈顯著白色環紋,為我國雉科(Phasianidae)中分布最廣的鳥類。目前已確定多達31個亞種,一些亞種從表型與遺傳上已適應于不同的地理區域(例如:寒帶、熱帶、干旱區、高原等),從而形成了各具特色的獨特群體[1]。群體間的差異可能是自然選擇、配偶選擇、群體歷史遷移等共同的影響[2-4]。近年來,動物學家通過形態分類和分子生物學手段對雉雞亞種的種群類型進行了較為深入的研究[5-6]。例如:Qu等[7]以線粒體DNA(mtDNA)控制區基因1 079 bp堿基序列為遺傳標記,研究了中國雉雞28個群體的分子生態(將我國雉雞群體分成3個進化支(clade),與依形態上劃分的“白翅組、準噶爾組、灰腰組”對應[8])。Liu等擴大了取樣的范圍,對全國13個亞種58個采樣點的483個雉雞樣本進行了線粒體DNA控制區和細胞色素b共1 625 bp的序列進行了分析,將全國的雉雞分為7個主要進化支,發現隨著適宜的棲息地的擴大,雉雞群體適應性產生的差異也在各亞種之間的形態上有所體現[9-11]。Kayvanfar等的研究確認了elegans亞種的分布范圍在中國云南西北部,在所研究的17個亞種中處于基礎地位,并且驗證了雉雞可能起源于中國東南部森林的假設[12-13]。
雉雞的亞種種群具有分布范圍廣、群體數量大、擴散能力弱等特點,在漫長的進化歷史中,形成了形色各異的亞種羽色圖案形態。通過對雉雞亞種羽色形態進行研究,能夠更精準地對其進行亞種分類,基于宏觀形態的類別又可以與微觀分子的進化進行比較分析,即可揭示種群遺傳格局和歷史動態,并能從另一角度理解自然選擇、種群歷史等對于雉雞遺傳格局及演化的不同影響[14-16]。同時,基于形態學的詳細分析可為基因與形態的關聯研究(genome-wide association study)提供更多的有用信息[3,17-19]。
雉雞亞種羽色形態觀察大多通過動物學家人眼進行,但有經驗的動物識別專家往往需要多年的經驗積累。對于雉雞這樣分布廣、數量大、亞種形態復雜易混的物種來說,識別準確難以實現。隨著數碼相機等觀察設備的更新換代,可以運用圖像數字化的技術對光線、角度、環境干擾等多種復雜因素的進行修正,明顯提高了野外采集雉雞羽色形態的圖像質量。通過實驗室計算機圖形的后期數字化分析,可以幫助更好地識別雉雞亞種,對物種鑒定進行輔佐糾偏。
實現數字圖形識別的前提是通過特征提取,將雉雞圖像區域與背景區分出來。因此,需要建立雉雞羽色數據庫,應用已有的信息進行輔助提取。另一方面,羽毛的樣式和顏色受遺傳與環境交互影響,是一些具有獨特紋理的圖案和一些不可描述的特征組合。圖像數字化處理:(1)基于像素的分割:利用像素外觀作為像素分配標簽;(2)基于區域的分割:主要通過尋找圖像之間的邊界來將圖像分割成區域;(3)基于圖像標記的分割:被定義于全局能量函數,但精準度取決于外觀和圖像梯度的識別[20-21]。特征提取后,需要用數字分類方法對圖像進行解析,這是一種基于模板匹配的動物圖像監測模型,并可通過基于顏色特征的支持向量機(support vector machine,SVM)對雉雞的分類特征進行聚類與描述。其中,K近鄰分類算法(K-nearest neighbor)、概率神經網路(probabilistic neural network)和符號分類器(symbolic classifier)是最有效的3種算法[22-26]。本研究通過以上3種算法,對大英博物館提供的25個雉雞亞種的標準圖片進行識別,探索數字識別在雉雞亞種鑒定中的可能性。
本研究的雉雞亞種外觀性狀圖像取自大英博物館館藏標本,共25個亞種,每個亞種2張不同角度的全身數碼圖片(圖1)。對圖片的處理包含圖像切割、特征提取、特征分析與聚類3個步驟。
首先通過TernausNet對圖形微切分割出色彩微格,并將其灰白化[27](圖2)。對于原始分割進行賦值、合并、再切割。在分割中,圖像的中心區域被稱為目標標記區域,圖像的邊界稱為背景標記區域。對數值矩陣進行標記:標記對象區域、標記背景區域和非標記區域[28]。提取對象輪廓及非標記區域被分配給對象區域或背景區域。
利用Gabor函數的濾波器微格對數字圖像模式進行分析,將有效表征的重復結構進行歸納,在空間域和頻率域的聯合不確定性之間進行折中[29]。基于頻率分析的數學特性通過Gabor函數來進行描述,將空間和頻率聯合的不確定性最小化。微格分析通過應用同一組尺度和方向選擇性的Gabor來完成的[30]。對圖像的過濾所應用的二維Gabor函數G(x;y)及其傅立葉變換G(u;v)可以寫成:
式中:波長(λ):以像素為單位指定,大于等于2,不大于輸入圖像尺寸的五分之一;方向(θ):Gabor函數并行條紋的方向,取值為0到360°;相位偏移(φ):取值范圍-180°到180°,分別對應中心對稱的center-on函數和center-off函數;長寬比(γ):空間縱橫比,Gabor函數形狀的橢圓率。操作程序可在github.com/mhaghighat/gabor獲取。
通過檢測重要特征來減少數據的維度,每個雉雞圖像所使用的特征選擇算法分為兩類:(1)過濾法:通過矩陣評估和選擇特征子集的數據特征,需要濾波器用作圖像預處理步驟;(2)包含法:使用機器學習算法的性能來評估每個算法候選特征子集,尋找最優化學習的特征算法。
聚類方式包括:
K近鄰分類算法是基于“最近距離(nearest neighbor)”的算法,通過R語言中的yalmpute程序包實現[31-33]。K近鄰分類算法采用向量形式測試樣本特征,找到每個訓練示例的向量的歐氏距離,作為最近距離。隨后,將標簽分配在測試樣本上,利用“平滑”假設,歸類聚合相同的微格模塊。
概率神經網路是3層結構的前饋網絡,來自貝葉斯決策網絡(Bayesian network),通過R語言中的PNN程序實現(https://github.com/chasset/pnn)。它基于訓練樣本的概率密度函數,使用相似的概率密度函數,針對每個測試向量單獨進行計算[34])。在輸入到網絡之前對向量進行同一化。隱含層每個分類含一個節點,輸出層具有用于每個模式分類的節點。
符號分類器使用提取的Gabor特征作為雉雞樣本的符號表示[35-36],通過R語言中的symbolicDA程序實現(http://keii.ue.wroc.pl/symbolicDA)。由于雉雞羽毛的特征在每個亞組中具有的類內差異較小,區分這些變化較困難。因此使用非常規數據處理,能夠更有效地區分并保存數據之間的差異。基于象征特征的算法適應于捕捉變化區間值的特征向量。
雉雞亞種圖像識別結果顯示了分割與特征提取的性能和效率,此步驟結果可直接影響到后面的聚類分析。在提取時,不同的種群呈現出不平衡的數據集。檢測的雉雞5大亞種類群,包括:黑頸雉雞(Phasianuscolchicuscolchicus)、橄欖腰雉雞(Phasianuscolchicustarimensis)、灰腰雉雞(Phasianuscolchicushagenbecki)、準格爾雉雞(Phasianuscolchicusmongolicus)和白翅雉雞(Phasianuscolchicuschrysomelas)(圖3)。總的來說,所有模型取得的識別效果并不好,主要在于雉雞的羽色過于接近。其中灰腰雉雞的利用概率神經網路(PNN)的識別精度最高,為62.3%。而橄欖腰雉雞和白翅雉雞則分別利用K近鄰分類算法(KNN)和概率神經網路(PNN)所獲得的識別度最低,僅有20.5%。
對完整雉雞圖像數據集的識別包含5大亞種集群一共25個亞種,但來自各大集群的亞種數目并不平衡,本研究依然采納所有亞種圖像進行分析驗證。結果表明雉雞在大的亞種類群中識別度較高。依然是概率神經網路取得了最好的效果,識別性能從19.2%到60.4%。最簡單的模型K近鄰分類算法性能較低。模型符號分類器也顯示了較好的結果。
本研究對圖像切割后的灰度微格的識別效率,繼而運用序列前向選擇法、序列后向選擇法、序列浮動前向選擇法和序列浮動后向選擇法等算法,對差異紋理特征進行提取和聚類,并進行了多重組合驗證[37]。這種驗證技術僅適用于K近鄰分類算法、概率神經網路和符號分類器的基礎構架設計。其模型具有預先訓練的權值,本研究的實驗結果顯示了完整的驗證結果。在數據模擬進行到40%時,數值就已趨于穩定,平均值穩定為(70.8±4.5),驗證了識別結果的可靠性。
在對雉雞亞種圖像識別的進一步驗證中,本研究將所有亞種圖片共50張對應的主要亞種類群進行比對,5個亞種類別為:黑頸雉雞、橄欖腰雉雞、灰腰雉雞、準格爾雉雞和白翅雉雞。在只考慮不平衡數據集的驗證中,每一類的所有圖像樣本被拆分為2組:預測亞種類群與目標亞種類群(表2)。同時,類群的判別應用了3種聚類模型。如果有2個以上判定為同一種,可認定為這一種。結果證明,本研究并沒有3個模型判定為3個不同類群的情況,因此50個實驗圖像都被歸集到相應的群組之中。其中,3個模型判定完全一致的占52.5%。通過這個3模型聯合驗證法,雉雞亞群的平均識別率已經達到了70%,最低的(即對于橄欖腰雉雞的識別)也在60%。

表1 圖像識別聚類的交叉驗證率

表2 3種模型綜合使用的圖片識別驗證
本研究測試了通過羽毛圖案對雉雞亞種類群進行識別的計算方法,主要依托K近鄰分類(KNN)、概率神經網路(PNN)和符號分類器3大函數。利用最大區域合并分割雉雞圖像,從分割圖像中提取Gabor特征,判別Gabor特征,然后使用3大算法進行特征選擇。對于所提出的方法的有效性,我們也進行了不同維度的驗證,包括對能采集到圖像資料的所有亞種(共25種)進行了分析,并在交叉驗證中混入來自圖冊或野外工作采集的圖片。同時,考慮了不同大小的亞種數據庫的差異,研究了非平衡狀況下效果分類的精度。實驗結果表明,概率神經網路(PNN)優于其他個體特征。
通過數字模型對雉雞亞種種群進行圖像識別證實了目前數字分類的難度。同時,通過比較可以清楚地發現概率神經網路(PNN)模型可以被較好地應用到圖片識別數據集之中。此外,K近鄰分類算法(KNN)的算法架構最為簡單,分類結果對于某些類群也顯示了良好的效果。而用符號分類器實現高性能,對圖像數字矩陣模型的平衡性有較高要求。對于雉雞羽色的識別,圖3顯示平衡數據集的性能結果并沒有其他2種算法表現好。本研究結果還顯示,對于25種亞群群體的圖像識別與人臉識別相比都有不同程度的性能退化,這可能是雉雞初始樣品集圖像大數據欠缺的原因。而分析過程中,初始樣本的分類結果也確認了本研究分析流程的可靠性,因而表明為未來研究需求還應采集更大量和高精度的樣本圖像。
在特定雉雞類群的識別方面,對于準格爾雉雞,3種算法K近鄰分類、概率神經網路和符號分類器顯示出非常接近的性能,這可能是由于準格爾雉雞在羽毛外觀形態上和其他幾類亞種類型的重疊度最高。在其他幾個亞種類群中,灰腰雉雞擁有反差最大的羽色特征,這也是造成在概率神經網路算法下,獲得最高識別度的原因。白翅雉雞在3種算法下的效率都不好,主要因為白色區域的識別度較差。而在實際野外采樣中,采集到的自然界的樣本可能更難形成被模型高效識別的數據集。
通過圖像識別聚類的交叉驗證,可以推斷出序列浮動后向選擇法的模型精度較低,而與訓練相比新數據集的序列前向選擇法可取得更好的驗證結果。因為K近鄰分類算法呈現了從61.7%到79.2%的變化范圍,表明結果可能出現了過度擬合。最重要的微格數值矩陣帶來了計算成本的極大不確定性,也是在實際應用中需要考慮到的。
本研究通過計算機圖像識別對羽色圖案各異的雉雞亞種類群實現自動化分類。雖然現在的識別效率還不夠精準,優化后的模型也只能對5個亞種大類進行識別,且成功率只有大約70%,但這對于野外物種的標準化采集與識別是一次重要的嘗試。系統性的數字識別會降低野外觀測的偏差,同時數字化提取出的信息也可以作為系統進化分析的重要原始數據。目前識別效率較低主要原因有:第一,目前用于優化模型的雉雞羽色形態的初始數據量仍不足。隨著對于雉雞的深入研究,以及有意識的采集高質量的圖片,一定會有更多的原始圖像數據積累。第二,數碼攝影的硬件局限,雖然現代的照相設備已經能達到很高的像素質量,但光線處理問題仍還存在瓶頸,有待于攝影硬件的技術突破。第三,本研究采用灰度微格進行分析,制約了顏色數字矩陣的轉換,一定程度上丟失了一些重要的形態信息,需要進一步的技術改良。第四,本研究采用的數據模型并非嚴格意義上的人工智能算法。相信現代計算科學的快速發展,會帶來更加高效率的數值算法,使得更好的圖像識別成為可能。再伴有越來越多的大數據收集與儲存,計算機視覺的深度學習技術能力肯定能在不久的將來,使得此探索性研究的功能與成果得到顯著性提高。