高明柯 陳一民 張典華 蔣思宇 黃 晨
1(上海大學計算機工程與計算科學學院 上海 200444)
2(上海大學數碼藝術學院 上海 201800)
3(湖南科技大學數學與計算科學學院 湖南 湘潭 411201)
增強現實系統中電磁跟蹤器注冊精度校正研究
高明柯1,3陳一民1*張典華2蔣思宇1黃 晨1
1(上海大學計算機工程與計算科學學院 上海 200444)
2(上海大學數碼藝術學院 上海 201800)
3(湖南科技大學數學與計算科學學院 湖南 湘潭 411201)
針對電磁跟蹤器磁場空間數據之間的復雜的模糊關系,提出基于T-S模糊系統的BP神經網絡和最小二乘支持向量機相融合的方法對電磁跟蹤器的注冊精度進行校正。方法首先采用K-means對空間數據進行聚類分析,隨后在局部上采用T-S模糊系統進行預處理,再從全局上利用BP神經網絡進行訓練,根據最終校正精度動態調整BP神經網絡的訓練目標,初步校正后再采用最小二乘支持向量機進行求解。實驗結果表明,該方法適用于非線性空間數據校正,能有效提高電磁跟蹤器的注冊精度,有助于提高增強現實系統的交互精度。
增強現實 T-S模糊系統 BP神經網絡 最小二乘支持向量機 電磁跟蹤器 校正
增強現實AR(Augmented Reality)技術是近年來的一個市場熱點,有著廣泛的應用前景和巨大的市場潛力。增強現實技術融合計算機圖形學、多媒體技術、數字圖像處理等技術將計算機產生的虛擬物體或場景疊加在真實世界之中,實現了對現實世界的增強。1997年Azuma總結了增強現實技術的三大關鍵技術:跟蹤注冊、人機交互、虛實融合[1]。跟蹤注冊研究的是如何將虛擬物體或場景精確地放置在真實世界中,是增強現實技術的基本必要條件。跟蹤注冊技術主要分為基于視覺[2-4]、基于傳感器[5]和兩者混合[6-7]的跟蹤注冊。本文所涉及的為基于電磁跟蹤器跟蹤注冊。
通常,電磁跟蹤器在出廠前已進行了基于電磁原理的校正[8-10],但在實際使用過程中,當接收器距離電磁發射器變遠時,磁場仍然會有畸變,使得測量值與真實值之間的誤差隨之增大。因此,學者們根據應用的需求,研究測量數據與真實數據之間的關系,采用基于數據分析的方法進行校正,如擬合函數法、BP神經網絡[11]、空間網絡線性插值法[12]、三軸逼近-反距離插值法[13]等,以進一步提高應用的精度。擬合函數法雖然得到了工業界的認可,但其解析式在不少情況下難以或不能準確求解;BP神經網絡雖然適合大規模數據集,通用性強,但是其收斂慢,容易陷入局部最優;空間網絡線性插值法將絕對誤差限制在5 mm以內,但達不到本應用在精度方面的要求;三軸逼近-反距離插值法針對雙發射器磁跟蹤系統,擴大了磁跟蹤工作范圍,但其仍然是將數據之間近似為線性關系。本文在T-S模糊系統(TSFS)處理的基礎上,融合BP神經網絡(BPNN)和最小二乘支持向量機(LSSVM)各自的優點,彌補各自的缺點,對電磁跟蹤器的注冊精度進行組合校正,以提高增強現實系統的交互精度。
本文所涉及的六自由度電磁跟蹤器,是由發射器、接收器和數據計算模塊組成。電磁跟蹤器的工作原理是利用三軸線圈發射低頻電磁場,接收器感應并探測磁場的變化,利用發射和感應信號之間的耦合關系計算接收器相對發射器的方位。盡管電磁跟蹤器在出廠時已根據電磁原理進行過校正,但不可避免地存在其固有的不足。例如,環境的干擾,在檢測區域范圍內任何磁性物體都將干擾磁場的分布,包括永磁體、地磁干擾等,這些干擾都會造成不穩定的測量;其次,磁場強度會隨著接收器與發射器之間的距離的增大而下降;除此之外,還有測量誤差,儀器誤差等。
系統工作空間中共有4 200個測量數據和4 200個真實數據,其分布情況如圖1所示,其中點表示真實值,星號表示測量值。圖1顯示距離發射器(0,0,0)越遠,測量點軌跡形變越大。相鄰的測量點與真實點之間具有復雜的相互關系,組成一張復雜的關系網絡,表明測量點與真實點之間的復雜關系所導致的誤差具有明顯的非線性特征。這些誤差,會在一定程度上影響虛擬物體注冊的準確性,進而影響到交互的精確性。因此,需要尋求一種有效方法,分析數據之間的關系,并依據具體應用對精度的具體需求,對電磁跟蹤器的空間數據的非線性關系進行校正,盡可能地提高整個AR系統的三維注冊和交互精度。


圖2 測量值數據分區圖
從圖2可知,空間數據通過聚類分析最終被劃分為八個不規整區域,說明了數據之間的復雜關系,并不是“非此即彼”,是相對模糊的。因此本文提出采用T-S模糊系統針對每個區域進行模糊處理。
1.2.1 模糊集合
對于普通集合A,空間中任意元素x,要么x∈A要么x?A。隸屬度函數是表示一個對象x隸屬于集合A的程度的函數,常記為μA(x)。
論域X上的有限個對象x1,x2,…,xn的模糊集合A由隸屬度μA(x)來表征,其中μA(x)在實軸的閉區間[0, 1]上取值,μA(x)的值反映了X中元素x對于A的隸屬程度。模糊集合A可表示為A={(μA(x),xi)|xi∈X}。
1.2.2 T-S模糊系統
T-S模糊系統[14]是一種自適應能力很強的模糊系統,不僅能自動更新,還能不斷修正模糊子集的隸屬函數。T-S模糊系統采用“if-then”規則形式來定義,在規則為Ri的情況下,模糊推理如下:

(1)

模糊集的隸屬度函數為:
(2)

(3)
最后根據模糊計算結果計算模糊模型的輸出:

(4)
BP-神經網絡算法(BP-NN)是1986年由McCelland和Rumelhart等學者首次提出來的,實質為一種多層前饋式網絡,具有一個輸入層、數個隱含層(一層或多層)和一個輸出層。神經網絡通用性好,并行性強,適合大規模的數據集,但由于其學習速率固定,學習規則采用梯度下降法,因此收斂速度慢,訓練時間長,容易陷入局部最優。
1999年Suyekens等[15]所提出的最小二乘支持向量機(LSSVM)是支持向量機(SVM)的一個常用類型。 LSSVM算法把SVM的不等式約束轉化為等式約束,進而極大簡化了Lagrange乘子α的計算,也將二次規劃的難題轉化成線性方程組的求解,在保證精度的同時降低了計算復雜度[16],因此LSSVM收斂快,容易得到全局最優解,但不適合大規模的數據集。
組合預測是將各種預測方法的效果進行綜合,Bates等[17]也證明過2種及其以上無偏的單項預測可組合獲得優于各單項的預測結果,能提高預測精度。崔超等提出利用BP神經網絡降低模型維數與復雜度,將篩選的變量作為LSSVM模型輸入,實現了火電機組脫硝成本的快速預測[18]。周鑫等通過改進的BP神經網絡優化LSSVM模型參數的選擇,避免了人為選擇的盲目性,在退火爐內帶鋼延伸量預測中獲得了良好的精度[19]。張騰旭等提出LSSVM和BP神經網絡的最優加權組合模型,并應用在GPS高程轉換中[20]。
為了克服各自的缺點,發揮各自的優點,本文提出在T-S模糊系統對各局部分區的預處理基礎上,從全局上先進行BP神經網絡訓練,根據總體誤差精度動態調整BP神經網絡的誤差目標,通過初步校正降低樣本數據的非線性復雜度后,再進行最小二乘支持向量機校正。

2.1.1 隱含層神經元個數選擇
隱含層神經元個數對BP神經網絡的性能影響較大。若神經元個數較少,則網絡不能充分體現輸出和輸入變量之間的關系;若神經元個數太多,則會導致網絡學習時間變長,甚至出現過擬合的問題。針對數據量較多的情況,本文采用經驗公式l=2m+1進行計算。
2.1.2 學習率的選擇
BP神經網絡的學習率通常取值在0~1之間,過大的學習率將在學習過程中產生震蕩,且搜索補償太大可能會越過誤差曲面最小值。但是過小的學習率也會使網絡收斂過慢,權值難以趨于穩定。因此,本文提出動態學習率的方法,旨在訓練初期使用較大的學習率,并在誤差降幅趨緩時,改用較小的學習率,使網絡趨于穩定。設初始學習率為η0,tmax為最大迭代次數,ti為當前迭代次數,則動態學習率公式為:
(5)
2.1.3 權值更新法則
為了有效降低搜索停留在局部最小值的概率,本文采用沖量項α修改權值更新法則,使得本次的權值更新部分依賴于上一次迭代時的更新,帶動梯度下降法沖過局部最小值,不陷入其中,具體計算形式如下:

(6)

(7)
最小二乘支持向量機核心思想是預先選定非線性映射,將輸入向量映射到高維特征空間,然后在這個空間中構造最優決策函數。構造最優決策時,運用結構風險最小化原理,利用原空間的核函數替代高維特征空間復雜的點積運算。
設初步校正后一樣本對(Z,Y),Z=[z1,z2,…,zn]T,Y=[y1,y2,…,yn]T,zi∈Rd,yi∈R。
用非線性映射φ(·)將樣本的輸入空間Rd映射到高維特征空間RD:
φ(z)=(φ(z1),φ(z2),…,φ(zm))
(8)
根據結構風險最小化準則,確定模型參數w,b,在高維特征空間求解最優決策函數,即:

(9)
其中c是正規化參數,控制對超出誤差的樣本的懲罰程度;Remp是損失函數,w、b是權矢量和偏置量。
由于不同的應用有不同的精度需求,且BP神經網絡的初始權值是隨機的,導致每次校正的結果不盡相同,同時一味追求訓練誤差最小化將導致BP神經網絡出現過度擬合的現象,也增加了算法時間。因此,本文提出根據設定的最終校正誤差精度動態調整BP神經網絡的訓練誤差目標。
設BP神經網絡訓練誤差精度(MSE)目標為ξ1,最小二乘支持向量機的預測誤差精度為ξ2,應用需求精度為ξ,則:
(10)

算法組合校正算法

步驟2隱含層計算。根據輸入變量,輸入層和隱含層之間的連接權值和隱含層閾值,按照下式計算隱含層的輸出。

(11)
步驟3輸出層計算。根據隱含層輸出,連接權值和閾值,計算網絡輸出。

(12)
步驟4誤差計算。根據網絡預測輸出Ok和真實值Yk,計算網絡預測的平方誤差E。
(13)

(14)
(15)
步驟6如果達到最大迭代次數tmax或達到目標誤差精度ξg,則進入步驟7,否則返回步驟2。
步驟7初步校正。依據訓練的模型對樣本數據X進行校正,得到新樣本(Z,Y)。
步驟8最小二乘支持向量機校正。用LSSVM對BP神經網絡的初步校正樣本(Z,Y)進行最終校正。
1) 用非線性映射φ(·)將樣本的輸入空間Rd映射到高維特征空間RD。


數據采集過程在木地板裝飾的實驗室完成。電磁跟蹤器控制單元和測量主機放置在木質電腦桌上,發射器放置在木質升降測量臺,接收器在木質刻度板上測量。采集過程共測得2組數據,每組4 200個數據樣本,分別作為訓練數據和測試數據。
實驗中,BP神經網絡采用單隱含層網絡模型,該網絡具有3個輸入節點,7個隱含節點,3個輸出節點,隱含層傳遞函數采用tansig,輸出層傳遞函數采用purelin,訓練函數采用traindx,沖量項為0.9,學習率調整步長為0.1,BP神經網絡訓練誤差精度目標ξ1為0.1,最后精度為0.001,應用需求精度ξ為0.000 1。LSSVM核函數采用徑向基核函數,實驗效果如圖3所示。

圖3 正面校正效果圖
圖3中左圖為三維校正效果,右圖為正面校正效果圖。其中點為真實值,星號為校正值;校正效果清晰地表明,校正值與真實值基本吻合,沒有出現較大的偏移,也沒有飄移點。
為了證明校正方法的精度,本文采用相對誤差、均方誤差和最大絕對誤差作為評價指標。校正后的三個維度的相對誤差如圖4所示。圖4顯示Y軸維度上相對誤差最小,精度已經達到10-3,在點2 739處出現峰值,Z軸維度和X軸維度相對誤差精度在10-2,分別在點3 345和點3 901處出現峰值,Z軸維度相對誤差比X軸維度相對誤差小。由計算可知,均方誤差為1.578×10-4,最大絕對誤差為1.6 mm。

圖4 BPNN-LSSVM校正后的相對誤差
為了證明方法的有效性,本文單獨采用LSSVM和BP神經網絡進行校正,并與本文方法進行比對。 BP神經網絡的校正值與真實值基本吻合,有部分的校正點出現了偏移或漂移; LSSVM方法校正效果一般,尤其是遠離發射器的測量點校正后仍然成不規則弧形分布,噪聲很大。三種方法的誤差表如表1所示。

表1 三種方法誤差表
為了驗證校正方法在增強現實應用里的效果,本文將BPNN-LSSVM校正方法應用于實驗室增強現實系統中,并與原有電磁跟蹤器校正方法和BP神經網絡校正方法進行比對,具體效果如圖5所示。

圖5 不同方法校正后的AR效果
圖5顯示了原有電磁跟蹤校正算法、BP神經網絡校正方法和本文校正方法在AR系統中加載虛擬模型(冠狀動脈)后的不同視角下的效果。每種方法從上到下分別是正視近景、正視遠景、斜視遠景圖。從整個實驗過程分析,三種方法在近景場景下效果相當,但是在遠景場景下差別較大,尤其是在斜視遠景場景下。遠景場景下、原有方法和BP神經網絡校正方法的工作區間立體網格都出現了不同程度的偏移,其坐標系原點無法與電磁跟蹤器的右下角對齊;本文方法雖然在遠景場景下也出現了一定程度的偏離,但相對于原有方法和BP神經網絡校正方法已經有了較大的改進。
本文提出并實現了一種電磁跟蹤器空間數據校正方法。該方法通過K-means算法對數據進行聚類分析,在局部上采用T-S模糊系統對空間數據進行預處理,在全局上通過融合BP神經網絡和最小二乘支持向量機對預處理后的數據進行組合校正,獲得了較好的數據校正效果,滿足了應用的需求,提高了AR系統中模型注冊的精度,有利于提升虛實交互的精度。
[1] Azuma R T.A Survey of Augmented Reality[J].Tele-operators and Virtual Environments,1997,6(4):355-385.
[2] 高君宇,楊小汕,張天柱,等.基于深度學習的魯棒性視覺跟蹤方法[J].計算機學報,2016,39(7):1419-1434.
[3] Yu L,Ong S K,Nee A Y C.A tracking solution for mobile augmented reality based on sensor-aided marker-less tracking and panoramic mapping[J].Multimedia Tools and Applications,2016,75(6):3199-3220.
[4] 嚴玉若,陳一民,黃晨,等.基于非線性尺度空間的無標記注冊方法[J].計算機工程與設計,2016,37(1):206-210.
[5] 姚爭為,陳一民,陸意駿,等.增強現實系統中磁力跟蹤器互干擾抑制的研究[J].中國圖象圖形學報,2010,15(12):1833-1841.
[6] 賀長宇,劉越,王涌天.用于增強現實手術導航系統的光學-慣性混合跟蹤方法[J].計算機輔助設計與圖形學學報,2016,28(3):513-519.
[7] Maidi M,Ababsa F,Mallem M,et al.Hybrid tracking system for robust fiducials registration in augmented reality[J].Signal,Image and Video Processing,2015,9(4):83-90.
[8] Sadjadi H,Hashtrudi-Zaad K,Fichtinger G.Simultaneous localization and calibration for electromagnetic tracking systems[J].International Journal of Medical Robotics & Computer Assisted Surgery,2015,12(11):705-711.
[9] Bien T,Rose G.Algorithm for calibration of the electromagnetic tracking system[C]//Ieee-Embs International Conference on Biomedical and Health Informatics.IEEE,2012:85-88.
[10] Hummel J,Figl M,Birkfellner W,et al.Evaluation of a new electromagnetic tracking system using a standardized assessment protocol[J].Physics in Medicine & Biology,2006,51(10):205-210.
[11] 豐艷,王明輝,陳一民,等.增強現實系統中磁力跟蹤器的校正[J].計算機工程,2006,32(10):28-30.
[12] 李啟明,陳一民,黃詩華,等.增強現實系統中磁力跟蹤注冊的精確性研究[J].計算機工程與設計,2009,30(24):5785-5789.
[13] 黃晨,陳一民,徐升,等.增強現實系統中大范圍磁跟蹤注冊問題研究[J].計算機工程,2012,38(14):290-292.
[14] Takagi T,Sugeno M.Fuzzy Identification of systems and its applications to modeling and control[J].IEEE Transactions on Systems,Man,and Cybernetics,1985,15(1):116-132.
[15] Suykens J A K,Vandewalle J.Least squares support vector machines classifiers[J].Neural Networks Letters,1999,19 (3):293-300.
[16] Gencoglu M T,Uyar M.Prediction of flashover voltage of insulators using least squares support vector machines[J].Expert Systems with Applications,2009,36(7):10789-10798.
[17] Bates J M,Granger C W J.The combination of forecasts[J].Operational Research Quarterly,1969,20(4):451-468.
[18] 崔超,楊婷婷,劉吉臻,等.基于BP網絡變量選擇與LSSVM結合的鍋爐脫硝經濟性建模[J].中國電機工程學報,2015,35(24):6413-6420.
[19] 周鑫,王超,楊琦,等.基于改進的最小二乘支持向量機的退火爐內帶鋼延伸量預測[J].軋鋼,2015,32(3):60-63.
[20] 張騰旭,劉立龍,周淼,等.基于LS-SVM和BP神經網絡組合模型的GPS高程擬合[J].桂林理工大學學報,2014(3):505-509.
RESEARCHONCORRECTIONOFREGESTRATIONACCURACYFORELECTROMAGNETICTRACKERINAUGMENTEDREALITYSYSTEM
Gao Mingke1,3Chen Yimin1*Zhang Dianhua2Jiang Siyu1Huang Chen1
1(SchoolofComputerEngineeringandScience,ShanghaiUniversity,Shanghai200444,China)2(CollegeofDigitalArts,ShanghaiUniversity,Shanghai201800,China)3(SchoolofMathematicsandComputingScience,HunanUniversityofScienceandTechnology,Xiangtan411201,Hunan,China)
Aiming at the relationship among the spatial data of the electromagnetic tracker is complex and fuzzy in magnetic field, the fusion method which combined of BP neural network and least squares support vector machine based on T-S fuzzy system is proposed. This method corrects the registration accuracy of the electromagnetic trackers. First, k-means algorithm was employed in the cluster analysis, and then T-S fuzzy system was used to pre-process the spatial data in local. Second, training was used by BP neural network in global and the training target of BP neural network was dynamically adjusted by the final correction accuracy. At last, least squares support vector machine was used for solving after preliminary correction. Our results indicate that this method is applicable to nonlinear spatial data correction, which can effectively improve the registration accuracy of electromagnetic tracker and to help improve the accuracy of an interactive system with augmented reality.
Augmented reality T-S fuzzy system BP neural network Least squares support vector machine Electromagnetic tracker Correction
TP391
A
10.3969/j.issn.1000-386x.2017.10.020
2016-11-29。上海市科技創新行動計劃項目(16511101200);上海市科委國際合作項目(12510708400)。高明柯,講師,主研領域:增強現實,手勢交互,數據可視化。陳一民,教授。張典華,講師。蔣思宇,碩士生。黃晨,博士生。