楊世強,喬 丹,弓逯琦,李小莉,李德信
基于Laplace逼近Gaussian過程的指節圖像中層偏移測度特征學習
楊世強,喬 丹,弓逯琦,李小莉,李德信
(西安理工大學機械與精密儀器工程學院,陜西 西安 710048)
在人機協調裝配中,為了準確描述手部位姿,需要精確的指節圖像特征提取與識別。為了豐富手部信息,提出了基于Laplace逼近Gaussian過程的多分類算法,以實現基于手部圖像的指節識別。在類別信息無關聯的假設基礎上,將中層偏移測度特征的學習轉化為對隨機量的學習;然后通過分析二值多分類高斯場上的后驗計算,給出了基于Laplace逼近Gaussian過程的多分類高斯過程學習算法;通過構造中層隨機信息的正定核函數,給出了基于Laplace的多分類高斯過程預測算法。最后,利用中層數據的分布學習與預測算法進行了指節圖像訓練學習和固定閾值的圖像識別。識別結果顯示,該方法具有一定的指節識別能力。
高斯過程;圖像識別;指節圖像;特征學習
隨著復雜機電裝備集成化、精密化與智能化程度的不斷提升,生產過程中的制造系統需進一步提高其敏捷性、適應性與可重復性,高柔性裝配技術對高效研發與精密制造有著重要意義[1-2]。在智能機器人技術的快速發展及其在制造系統中日益廣泛地應用這一背景下,智能化的人機協調裝配技術被認為是提高裝配系統柔性的有效方法[3]。基于機器視覺的人機交互協調裝配技術,將圖像分析獲得的人體裝配姿態、動作和意圖作為裝配機器人任務規劃的輸入信息,通過協作實現高效高柔性的裝配。手部圖像及其關聯包含手部裝配姿態的總體信息,因此圖像特征檢測手部生物結構是裝配操作意圖推斷的基礎[4]。
手勢識別主要有2個研究方向,①使用傳感器和探測器等外設工具實現手勢識別,該方法通過傳感器進行精確的手部位姿提取,實現較為精準的手勢識別,但不夠便捷,需要外部設備的支持。②使用拍攝圖像進行無標記的手勢識別,精確度不夠高,魯棒性與穩定性依然不足,需要進一步研究手部圖像特征檢測技術以提高其精確度與準確提取手部位姿的能力。
目前在圖像特征檢測領域涌現出許多新的識別技術,不同領域所使用的方法與其側重點各有不同,有些側重于特征提取技術,如DING等[5]利用雙重局部二值模式(double local binary pattern, DLBP)檢測視頻中的幀峰值;YAO等[6]給出了一種基于LLE的基于過濾器的特征選擇方法;在模型建立方面,文獻[7]將一個動作類別作為靈活的身體部分的空間配置數目進行建模,開發了一種層次化的空間SPN方法,模擬子圖像內各部分之間的空間關系,并通過SPN的附加層對子圖像的相關性進行建模;PANDA等[8]提出了特征驅動選擇分類算法(feature driven selective classification, FALCON),優化了機器學習分類器的能量效率;對于特征聚類的研究有助于圖像特征分類,LI等[9]在解決監控應用中的自動異常檢測問題中使用以無監督主成分分析(unsupervised principal component analysis, UPCA)為基礎的特征聚類算法實現自動選擇最優數目的聚類;JIANG等[10]提出了一種基于模糊相似度的自組織特征聚類算法用以提取文本特征,該方法運行速度快,可以比其他方法更好地提取特征;RAHMANI和AKBARIZADEH[11]提出了一種使用無監督特征學習(unsupervised feature learning, UFL)的譜聚類方法。
高斯過程(Gaussian process, GP)學習作為一種被普遍使用的特征識別方法,近幾年來眾多學者對其進行了廣泛研究。由于GP模型易于實現的特點,可以用來優化識別效果,SHIN等[12]提出了一個三維點云的實時分割算法,采用高斯過程提高了分割準確性,以減少過分割效應。GP同樣被用來排除異常與模糊的數據[13-14]。XILOYANNI等[15]運用了新穎的高斯過程自回歸框架,以學習手關節和肌肉活動的連續映射來計算預期的手部運動。JIANG等[16]將監督潛在線性高斯過程潛變量模型(supervised latent linear Gaussian process latent variable model, SLLGPLVM)用于特征提取,對高光譜圖像(hyperspectral image, HSI)分類。
基于膚色模型的圖像分割可初步解決手部的圖像定位問題,而如指形姿態、指節位置等表征手部生物結構的重要圖像特征仍需進一步識別。在手部半握及全握姿態下,對應于手部關節位置處的骨節結構,指節圖像的灰度分布在手指局部位置附近呈現不規則凸包結構,可將該非確定性不規則凸包作為指節圖像的一種隨機隱結構。文獻[17]以手指關節圖像為例,針對上述灰度結構模糊、特征隱含且抽取困難的一類隨機圖像,通過灰度分布的密度估計獲得圖像隱特征,利用該觀測建立圖像隱特征模式的學習與估計算法框架,給出了隨機圖像上偏移特征的提取與分析方法。鑒于隨機偏移集自身的分布復雜性,不同偏移參數區間所對應偏移特征間的差異比較大,且偏移參數越遠離標準值,其對應特征就越復雜,所以在對隨機圖像雙側偏移測度的學習過程中,特別針對偏移參數在區間[0.50,0.85]內的中層數據[17],需深入分析訓練圖像庫中實際偏移觀測的隨機分布特點,選用恰當的模型進行學習。本文通過對中層密度位置多標簽分布隨機場模型的學習,獲得條件偏移概率的等價密度估計。首先對中層偏移測度的分布進行訓練,并將其特征的學習轉化為了對隨機量的學習。然后,通過對二值多分類高斯場上的后驗計算,給出了基于整體訓練數據集的隱函數后驗更新,通過中層隨機信息的正定核函數構造,給出了基于訓練集的隱向量預測,通過對樣本進行試驗,驗證了算法的可行性。


(a) 第1類(b) 第2類(c) 第3類
針對隨機場上的多分類問題,考慮到不同的標簽值對應不同的水平參數區間,且標記類別值在有限離散空間為進行取值,同時圖像位置處對應多類別標簽間的關系并不是完全確定的,因此對所有類別標簽的隨機分布需進行統一建模與表示,才能較好地恢復中層數據分布的整體特征。本文利用GP模型[18],以觀測數據作為訓練樣本集,選用Bernoulli分布表示圖像固定位置處對單類別標簽的概率,以隨機場上類別標簽的概率結果作為訓練輸出。而3類標簽間的分布模式進一步包含有2類信息,其一為同一位置處狀態標簽的激活與轉換,其二是不同位置多狀態間的分布關系。針對前者,利用Gibbs形式表示標簽對應多項式分布中的參數關聯;考慮到學習過程復雜性的限制,假設不同圖像位置間的不同標記類無關,而同類標簽的聯合分布具有Gaussian特點,并利用Gaussian場函數表示同類別間的標記關聯,即

