謝宏 楊環



摘要:為更加實時、精確地識別運輸設備的位置信息和特殊貨物的位置信息尤其是朝向信息以提高工作效率,利用仿真實驗對室內物體進行定位和朝向判斷的探究。利用天線陣列布置室內環境,在考慮電磁波極化特性的基礎上利用信道傳播模型進行建庫;利用隨機森林進行朝向判斷后通過不同的深度學習模型進一步實現定位。實驗結果表明:該模型不僅能實現朝向判斷,而且其定位誤差比僅利用深度學習模型的定位誤差降低約0.14 m。
關鍵詞:室內定位; 隨機森林; 深度學習; 極化特性; 信道傳播模型
中圖分類號:? TN925
文獻標志碼:A
An indoor location method combining random forest with deep learning
XIE Hong, YANG Huan
(Information Engineering College, Shanghai Maritime University, Shanghai 201306, China)
Abstract:
In order to identify the position information of transportation equipment and the position information of special goods, especially the orientation information, so as to improve the working efficiency, the simulation experiment is used to explore the position and orientation of indoor objects. The indoor environment is arranged by the antenna array, and the channel propagation model is used to build the database on the basis of considering the polarization characteristics of electromagnetic waves. The random forest is used to judge the orientation and then the location is further realized by different deep learning models. Experimental results show that the model can not only achieve orientation judgment, but also its location error reduces by about 0.14 m compared with that only using the deep learning model.
Key words:
indoor location; random forest; deep learning; polarization characteristic; channel propagation model
0 引 言
在移動設備和互聯網高速發展的時代,定位技術的發展推動了各行各業的進步,在倉儲物流、機械加工、家電加工等大型制造業搬運區域,各種無人車等機器設備被引入運輸作業中,節省了大量的人力,提高了工作效率。全球定位系統(global positioning system,GPS)雖然能夠對室外定位技術提供強有力的支撐,但GPS信號因受到建筑物的遮擋而無法到達室內,且室內環境存在信號干擾、多徑和非視距等的影響,因此室內定位一直是學者們廣泛研究和關注的問題。
基于測距的定位方法有接收信號強度(received signal strength,RSS)、到達時間(time of arrival,TOA)、達到角度(angle of arrival,AOA)和到達時間差(time difference of arrival,TDOA)算法。TOA或AOA算法要求收發端具有嚴格的時鐘同步,而且AOA算法需要接收端電路能夠準確獲得入射波角度,它們都對接收端提出了較高要求[1]。隨著機器學習的廣泛應用,RSS算法受到研究者的關注,如:李瑛等[2]通過神經網絡擬合RSS與坐標的關系,進而實現定位。隨著深度學習的興起,研究者們將深度學習應用于室內定位上,如:文獻[3-4]利用深度置信網絡(deep belief networks,DBN)模型對RSS指紋的特征進行訓練和測試來實現定位;孫晶[5]使用路徑-損耗模型對室內環境進行建模,利用DBN無監督地學習RSS特征,然后利用歐氏距離進行定位。上述文獻利用DBN模型對RSS指紋信息進行訓練和測試,其定位效果比傳統算法模型的好,但DBN模型在表示數據內部特征方面有一定困難,而且學習過程較慢,不合適的參數會導致局部最優解。文獻[6-7]提出先利用自編碼器(autoencoder,AE)進行RSS特征提取形成指紋庫,然后利用鄰近法進行匹配定位,但是由于鄰近法定位方式很大程度上依賴樣本的疏密,對定位精度的提高有限。以往文獻有很多關于物體定位的研究,但對于物體在某一位置的朝向以及物體的朝向對定位精度的影響缺乏研究。在實際環境中由于電磁波的極化特性,接收端的RSS會受到收發端天線朝向的影響,從而說明物體的朝向會對定位精度造成一定的影響。另外,一些特殊貨物,如不可倒置的裝有液體的包裝容器、大型設備等,也需要對朝向進行判斷。如果能夠實時有效地確定物體或設備的位置和朝向,那么一方面可以為無人車等進一步的路徑規劃提供基礎,提高工作效率,另一方面可以對貨物進行實時監控。
針對以上問題,本文提出一種基于隨機森林(random forest,RF)和深度學習的室內定位方法,分為離線訓練和在線定位階段。離線訓練階段:利用信道傳播模型建立數據庫,并根據朝向的不同進行深度模型訓練。在線定位階段:利用RF算法進行朝向判斷后輸入不同的深度學習模型。本文方法既可以對標簽的朝向進行判斷,又可以對標簽進行更精確的定位。
1 定位系統中指紋數據集的建立
1.1 天線傳播模型的建立
天線向空間輻射電磁波,電磁波是以波動形式進行傳播的電磁場。天線發射和接收的信號符合弗里斯傳輸公式。貝爾實驗室的FRIIS給出了一個用來計算兩根天線之間發射功率P1與接收功率P2關系的公式(假設發射天線與接收天線極化匹配):
式中:G1(θ1,1)和G2(θ2,2)分別是發射天線和接收天線的增益;r為發射天線與接收天線的間距;λ為電磁波的波長,λ=c/f,這里c為電磁波波速,f為電磁波頻率。如圖1所示,發射天線和接收天線任
意放置,假設發射天線和接收天線的單位極化矢量
分別為β和ξk,來波方向矢量為αk,求解接收天線接收功率的方法如下:
式中:fsαkαk和frαkαk分別為β和ξk在αk方向上的增益;A為發射功率。
從上述表達式可以看出,第k組天線接收功率與θ1和θ2有關系,或者與收發天線各自的極化方向與兩者連線的夾角有關。因此,即使標簽在同一位置,只要極化方向不同,接收天線所接收的關系也是不一樣的,需要建立映射關系進一步進行分析。
1.2 指紋數據庫的獲取
數據集建立的主要方法有實地測量法和傳播模型法。采用實地測量法獲取的數據集一般較為準確,但當服務區域范圍比較大時比較費時費力,尤其是當服務區域發生變化或者更換成其他服務區域時,數據集要重新采集。
采用構建傳播模型的方式獲取數據集的好處在于過程比較快,不受限于固定的區域。當區域發生改變時,數據集更新也更加方便。傳播模型主要有路徑-損耗模型和信道傳播模型。本文使用構建傳播模型的方式得到指紋數據庫。以往的研究一般使用經驗模型得到指紋數據庫,本文要解決的是位置和朝向的確定問題,路徑-損耗模型不適用,因此采用信道傳播模型。具體方法是利用天線陣列進行信號的接收,利用考慮天線極化的弗里斯傳輸公式,得到每個標簽的坐標以及每個坐標處的4個朝向、12根天線接收的信號,記入指紋數據庫。
2 算法介紹
2.1 RF原理
RF在2001年由BREIMAN提出,是一種建立在統計理論基礎上的組合分類器。RF分類器的基礎是決策樹分類器,RF由多棵決策樹構成,其決策結果由多棵決策樹分類結果的眾數決定。RF的基本構建流程是:假設由特征向量樣本構成的原始訓練集合為Y={X1,X2,…,XN},應用bootstrap方法有放回地每次從Y中隨機抽取k個樣本,抽取s次,構成自主樣本集{Tj}j=1,2,…,s,其中Tj={Xj1,Xj2,…,XjN}。假設每個特征樣本Xi具有m個屬性(特征分量),隨機抽取{Tj}中每個Xji的z(z RF由于具有上述特點,在一定程度上避免了過擬合問題,在分類方面得到了廣泛應用。影響RF分類性能的主要因素是:森林中每棵樹的分類強度和樹間的相關度。在訓練中,RF模型需要設置的參數比較多,但在實際使用中主要調節的參數就是決策樹的個數和最大特征個數。其調節過程如下: (1)其他參數保持默認值,對決策樹的個數從小到大進行遍歷;(2)選擇使得分類結果正確率最高的決策樹的個數R;(3)保持決策樹的個數以及其他參數不變,改變參數最大特征數;(4)選擇使得分類結果正確率最高的最大特征數M;(5)利用最優的決策樹個數R和最大特征數M進行分類。 2.2 深度學習 深度學習的概念由HINTON等2006年提出。研究者對深度學習模型進行了多方面的應用研究,如人臉識別[8]、回歸預測[9-10]等,無一不展示了深度學習強大的學習能力。本文利用深度學習對復雜傳播模型進行模擬,按照朝向的不同,通過大量的訓練樣本訓練不同的深度學習網絡模型。 2.2.1 AE AE是神經網絡的一種,其結構與神經網絡相同。AE由一個編碼器(encoder)函數h=f(x)與一個解碼器(decoder)函數r=g(x)組合而成。編碼器將輸入數據轉換成一種不同的表示h,解碼器則將這個新的表示轉換到原來的形式。因此,AE的目的就是使得輸出與原始的輸入盡量保持一致。AE結構見圖3。 2.2.2 神經網絡算法 BP(back propagation)神經網絡一般由多層神經元組成的網絡結構構成。最基本的BP神經網絡由3層構成,分別是輸入層、隱含層和輸出層。每層都由多個神經元組成。同層神經元之間無連接,后一層神經元的輸出是由前一層神經元線性組合后進行函數運算得到的。一般情況下,3層網絡結構便可以表示任意非線性函數。網絡的訓練根據網絡的輸出與輸入的比較結果反向調節權值和閾值,從而使得網絡輸出更接近理論輸出。 2.3 算法過程 2.3.1 數據的獲取和處理 按照弗里斯傳輸公式,在考慮電磁波極化的情況下得出接收天線的信號強度。這里假設發射功率為P1=10 W,工作頻率為2 GHz,發射機增益為G1(θ1,1)=sin2θ1,接收機增益為G2(θ2,2)=sin2θ2。按照傳播模型得出信號強度。 假設:將n根天線接收信號表示為Ri=(Ri1,Ri2,…,Rin);主要考慮二維平面內的定位,z坐標值為定值,因此建庫時不考慮z坐標,天線坐標的位置可表示為(xi,yi);天線朝向序號為k(k=1,2,3,4)。數據庫中的第i條指紋就表示為{xi,yi,Ri1,Ri2,…,Rin,k}。 2.3.2 天線定位 天線定位分兩步:(1)利用RF算法進行朝向的確定;(2)用不同的深度學習模型進行回歸定位。定位具體方法為:(1)將數據隨機分為訓練集和測試集;(2)將訓練數據輸入RF分類器進行訓練;(3)將訓練數據按照4個朝向分為4組訓練數據,分別進行深度學習回歸定位的訓練;(4)將測試數據輸入RF分類器,按照分類結果輸入對應的深度學習模型進行定位。算法流程見圖4。 3 仿真結果及其分析 3.1 仿真環境 此次仿真是利用MATLAB R2015b完成的,在離線建庫階段利用天線的傳播模型對室內傳播信號的情況進行模擬。此次實驗對傳播介質、陣列的工作環境、信號以及噪聲都進行了合理的理想化假設。在5 m高的房頂選擇20 m×20 m的場地,在這個場地中央選取半徑為3 m的圓形區域,在圓周上均勻豎直放置6對天線,因此信號強度矢量的長度為12。以圓心為原點建立坐標系,z軸豎直向下。將標簽放置在地面上,并在同一位置朝向4個方向,其中x軸正向記為1號方向,x軸負向記為2號方向,y軸正向記為3號方向,y軸負向記為4號方向,每個方向上都得到一條信號強度信息。將位置坐標、信號強度矢量和標簽朝向作為一條指紋數據計入數據庫。 3.2 實驗結果 3.2.1 對測試數據進行方向分類 利用兩種方式進行分類,一個是RF分類器分類,另一個是BP神經網絡分類。比較兩種分類方式的分類效果,進而選擇較優的分類器。兩種分類方式對標簽朝向向判斷的準確率隨信噪比(signal to noise ratio,SNR)的變化情況見圖5。 從圖5可以看出當SNR從0變化到30 dB時BP神經網絡和RF分類器對標簽朝向判斷的準確率的變 化情況。1號、2號和3號方向RF分類器對標簽朝向判斷的準確率基本上都比BP神經網絡的高,僅4號方向RF分類器對標簽朝向判斷的準確率比BP神經網絡的略低。由圖5e可以看出,整體上RF分類器的分類效果明顯比BP神經網絡的好。因此,采用RF分類器進行分類,從而確定標簽的朝向。 3.2.2 利用深度學習進行定位 為研究物體朝向的確定對定位的重要性,在SNR為20 dB的情況下進行對比實驗: 方法一:將訓練數據按標簽朝向分類后分別輸入4個深度學習模型網絡,訓練完成后將按照朝向分類后的測試數據輸入對應的深度學習模型進行定位。 方法二:將訓練數據直接輸入深度學習模型網絡,訓練完成后將測試數據直接輸入深度學習模型進行定位。 將數據分為訓練集和測試集,先后進行兩次實驗,首先在不區分朝向的情況下直接利用深度學習算法進行定位,然后先區分朝向再進行定位。實驗結果見圖6。 比較圖6a與6b可知,區分朝向的深度學習模型的定位效果直觀上比未區分朝向的深度學習模型的好,前者比后者的平均定位誤差約小0.14 m。為更加有效地說明實驗結論的普遍性,隨機選取測試集,進行100次實驗,平均定位誤差見圖7。 由圖7可以看出,在100次實驗中,在先進行朝向分類,再利用不同的深度學習模型定位的情況下,平均定位誤差更低。 4 結束語 針對大型制造業、物流業等運輸設備和工作人員在識別貨物朝向和位置方面面臨的問題,提出一種基于隨機森林(RF)和深度學習的定位方法。先利用RF判斷標簽朝向再利用深度學習進行定位的方法較傳統方法顯示出了獨特的優勢,不僅能夠確定物體的位置而且能分辨物體的朝向。對不可倒置貨物,如電冰箱、裝有液體的包裝容器等,可以進行實時、準確的朝向判斷。該方法增加了物體朝向的判斷,因此在一定程度上增加了時間開銷,以較低的時間開銷為代價獲取更為顯著的定位效果對于實際定位情況具有更大的意義。由于在實際環境中室內信號的多徑、色散等會對信號接收造成一定的影響,下一步將使用實際的發射器和接收器進行實際測量并進行定位實驗,以期幫助倉儲物流行業、大型制造業、大型商場等對無人車、特殊貨物等進行位置和方向的監管。 參考文獻: [1]孫豫斌, 黃臻, 高瑞祥, 等. 基于RSS的可見光室內定位系統[J]. 儀表技術與傳感器, 2018(11): 80-84. [2]李瑛, 胡志剛. 一種基于BP神經網絡的室內定位模型[J]. 計算技術與自動化, 2007, 26(2): 77-80. [3]高歡斌. 基于深度學習的室內定位算法研究[D]. 成都: 電子科技大學, 2016. [4]GAO Lingjun. Channel state information fingerprinting based indoor localization: a deep learning approach[D]. Alabama: Auburn University, 2015. [5]孫晶. 基于深度學習和位置指紋的RFID室內定位算法研究[D]. 長春: 吉林大學, 2018. [6]李嘉俊. 基于深度學習的WiFi室內定位算法研究[D]. 廣州: 廣東工業大學, 2018. [7]薛偉, 陳璟, 張熠. 基于深度學習的WiFi與iBeacon融合的室內定位方法[J]. 計算機工程與應用, 2019, 55(1): 29-34. DOI: 10.3778/j.issn.1002-8331.1809-0143. [8]UDDIN M Z, HASSAN M M, ALMOGREN A, et al. A facial expression recognition system using robust face features from depth videos and deep learning[J]. Computers & Electrical Engineering, 2017, 63: 114-125. DOI: 10.1016/j.compeleceng.2017.04.019. [9]李彬, 彭曙蓉, 彭君哲, 等. 基于深度學習分位數回歸模型的風電功率概率密度預測[J]. 電力自動化設備, 2018, 38(9): 15-20. DOI: 10.16081/j.issn.1006-6047.2018.09.003. [10]MA Xiaolei, YU Haiyang, WANG Yunpeng, et al. Large-scale transportation network congestion evolution prediction using deep learning theory[J]. PLOS ONE, 2015, 10: 1-17. DOI: 10.1371/journal.pone.0119044. (編輯 賈裙平) 收稿日期: 2019-05-16 修回日期: 2019-07-31 基金項目: 國家自然科學基金(61550110252) 作者簡介: 謝宏(1962—),男,陜西漢中人,教授,碩導,研究方向為人工智能技術及應用系統,(E-mail)hongxie@shmtu.edu.cn 楊環(1992—),女,山東德州人,碩士研究生,研究方向為移動通信與無線接入技術,(E-mail)1269764506@qq.com