周明快,黃 巍,陳 濱,毛科技*
(1.浙江商業職業技術學院,杭州 310053;2.浙江省通信產業服務有限公司,杭州 310050;3.浙江工業大學計算機學院,杭州 310023)
隨著導航技術和基于位置服務應用需求的發展,室外環境的定位技術已經十分成熟。如GPS全球定位系統已經廣泛應用于室外環境的定位中,給人們的生活帶來了極大的方便。例如,汽車GPS導航系統的應用給駕駛人員提供了多種旅行的便利。然而,隨著人們生活環境的快速發展,僅僅室外環境的定位已經無法滿足人們日益增長的定位需求,室內環境下的定位技術和服務需求在近年來不斷地受到人們的關注。
由于室內環境的復雜性,一些成熟應用于室外環境的定位技術并不能靈活地應用在室內定位中。因此,更適用于室內環境下的定位技術不斷被提出,目前主要的室內定位技術有ZigBee[1]、紅外線[2]、RFID[3]等。這些技術都各有其優缺點,如Zigbee定位其信號強度信息受噪聲干擾大,穩定性較差;RFID技術不具備通信能力,很難與其他系統整合在一起。這些缺點使得室內定位技術的普及受到阻礙。隨著智能手機和各種便攜通信設備的普及,無線局域網(WLAN)[4]已經成為人們在室內日常生活中必不可少的部分。如果可以充分利用現有的WLAN設備方便及覆蓋范圍廣等特點,室內定位技術將會得到更加快速的發展和普及。
基于WLAN的室內定位根據定位目標是否攜帶設備分為有源和無源[5]兩種。由于實際條件的限制,大多數情況下,定位目標是無法攜帶有源設備的。例如自然災害的發生是無法預料的,在消防員進行受災人員的救援和搜尋工作時,無法要求搜尋目標攜帶相關有源定位設備。在這種無法預期的意外情況下,關于無源定位的研究是十分有必要的,因為其在人們實際生活中的應用更加具有可行性。主流的無源定位方法有基于接收信號強度RSSI(Received Signal Strength Indicator)[6]的室內無線定位方法。但是,由于信號強度只是對室內信道信息的一種大致粗略估計,并且RSSI信號的強度值會隨著時間發生波動,從而導致不穩定性。實驗研究表明,典型室內環境下一臺靜止接收機所接收到的RSSI可能出現5 dB波動[7],因此其并不完全適用于存在多徑效應的復雜室內環境下的精確定位。
近年來,研究人員提出了一種在物理層更細粒度的信道狀態信息CSI(Channel State Information)[8]來進行室內定位應用,可以通過估計每個子載波上的信道信息,從而在一定程度上可以區分室內環境的多徑成分。目前,CSI由于更精確的環境感知能力而被研究人員所廣泛關注,被逐漸應用于室內定位[9]中,如基于位置指紋庫[10]并結合機器學習方法[11]等。
雖然CSI應用越來越廣泛,但是當前基于WLAN的無源室內定位傳統方法中一般僅采用了CSI的幅度信息,導致在實際應用中定位效果并不能滿足實際要求,其準確率和穩定性還是欠缺的。實際上,在采集CSI信息過程中,我們還能夠測量到信道狀態的相位信息。所以,如何在定位過程中充分利用所采集信道狀態的幅度和相位信息,實現更為穩定的定位應用是十分值得繼續探索的工作。
本文針對傳統室內無源定位存在的一些問題,提出了一種同時采用基于WLAN的信道狀態信息的幅度和相位進行無源室內定位的方法,并增加了平滑去噪預處理,很好地解決了僅采用CSI子載波原始幅度值作為特征的定位方法準確率和穩定性問題。
采用信道狀態信息進行室內定位的系統主要流程結構如下圖1所示,主要包括CSI數據采集、提取CSI幅度和相位、CSI數據預處理、構建指紋庫、由所構建指紋庫調用不同機器算法估計出待分類數據所代表的位置。

圖1 總體結構框圖
傳統基于WLAN的無源室內定位方法主要是基于RSSI的,由于RSSI信號存在著信號不夠穩定、可靠性差等缺點,導致其實際定位效果不好。與RSSI相比,CSI則提供了一個更為精細的信道信息。一個典型的無線信道模型的頻域響應可表示為:
Y=HX+N
(1)
式中:X和Y分別表示發射信號向量和接收信號向量,H和N分別表示信道矩陣和加性高斯白噪聲。
當前的WLAN技術,如802.11n采用了正交頻分復用OFDM和多輸入輸出MIMO技術,其信道狀態信息參數可表示為H:
H=[H1H2…Hi]
(2)
Hi=|Hi|ejsin∠Hi
(3)
根據文獻[12]中的修改固件方法,普通WiFi設備可以獲得30個正交頻分復用的子載波上的信道狀態信息采樣,所以在式(2)中i=1,2…30。Hi是 CSI的復數表示形式,其中|Hi|和∠Hi分別是第i個子載波的幅度和相位信息。
基于無線信道變化而進行室內無源定位的方法主要依據以下原理:當室內人員處于不同位置時,會產生不同的多徑效應,從而對無線信道狀態產生不同的影響,即所測量的信道信息應符合以下條件:①在相同位置具有穩定性;②在不同位置具有區分度。如圖2(a)和(b)表示在同一位置和不同位置測得的CSI幅度值,可見CSI的幅度信息具有以上所要求的位置區分度和穩定性。

圖2 相同位置與不同位置的CSI
信道狀態信息H中的幅度參數|Hi|是目前大部分基于CSI進行無源人員定位算法中的基本物理量,其原因是由于幅度值相對比較容易提取和計算。然而,其中的相位部分∠Hi卻往往被忽略,這主要是因為原始的CSI信息在不同子載波下的相位呈現一種周期性變化,并且在多徑情況下往往隨機分布在[0,2π]范圍內。從室內無線傳播模型上分析,人員在室內不同位置會同時影響到無線信道的幅度和相位參數,如何充分利用采集到的CSI全部信息,以提供更多的人體位置變化對于信道影響的信息,從而滿足更高精度和更穩定性的定位需求是十分重要的,特別是利用其中的相位信息。因此,在提取原始的∠Hi數值后,我們對其進行線性變換[13],得到校正后的相位值,具體如式(4)所示:
(4)

室內無線環境比較復雜,數據采集過程可能受到各種情況的干擾,因此必須對數據進行預處理,其過程主要包括異常值處理、平滑去噪處理、標準化處理3個部分。
3.2.1 數據異常值處理
在無線信道狀態參數的實際采集過程中,由于環境和設備的原因可能出現隨機異常值。異常值對定位訓練模型的建立和數據測試階段都有較大的影響,因此我們需要事先對異常值進行有效處理。假設樣本數據測量次數充分,并且數據以正態或近似正態分布,我們基于3σ準則[14]進行異常值檢測。具體方法是如果單個子載波值與樣本子載波均值μ的差值在3σ以上,則用均值來替換該子載波值,即經過異常值處理后的數據分布在(μ-3σ,μ+3σ)區間內。
3.2.2 平滑去噪處理
經過異常值處理后,我們觀察到同一個子載波不同樣本點的數據波動大,我們分析這應該是由于環境中不穩定的噪聲波動所引起的。為了弱化噪聲波動的影響,我們利用滑動平均濾波器對經過異常值剔除的數據進行平滑,其原理如式(5)所示:

圖3 平滑去噪處理
(5)
式中:m為可調整的平滑窗口大小,n為數據包序號,i為子載波序號。在平滑去噪處理時,如果設置平滑窗口m越大,信號會越平滑,然而細節信息會損失更多。圖3中虛線部分是平原始數據,而實線是平滑處理過后的數據。圖3中很明顯的展示了平滑的作用,實線部分能明顯展示數據的總體規律,有效的去除了由于環境不穩定造成的噪聲和波動誤差。
3.2.3 標準化處理
由于提取出的幅度和相位特征之間數值差別很大,這會對實驗結果產生很大的影響,所以我們需要對其進行標準化處理。原始特征數據經過數據標準化處理后,各指標處于同一數量級,減小了由于特征間的數值差異引起的不一致性,適合進行綜合對比評價。我們采用的是Z-score標準化處理方法,具體原理如式(6)所示:
Fnew=(xold-μ)/σ
(6)
式中:Fnew表示經過標準化處理后的特征,xold表示標準化處理前的特征,μ和σ分別代表該特征所有樣本的均值和所有樣本的標準差。
當經過預處理后,將每個位置點的30個幅度特征和30個相位特征結合成60個特征,構建成一個t×60的特征向量,其中t表示該位置點的訓練樣本數量。F可用如式(7)所示:
F=[A1A2…A30P1P2…P30]
(7)
式中:Ai和Pi分別表示經過上述3個預處理過程后的幅度和相位值,i=1,2,…,30。每個位置點的特征向量依次存入指紋庫,以備后續機器學習調用不同的算法對未知數據進行測試分類。
本文機器學習算法主要使用了支持向量機[15],并將其與貝葉斯網絡算法[16]和隨機森林算法[17]進行了準確率和時間效率的對比。
支持向量機SVM(Support Vector Machine)是一種基于統計學理論的機器學習算法。它通過尋求結構化風險最小來提高學習機泛化能力并實現經驗風險和置信范圍的最小化,從而在統計樣本量較少的情況下也能獲得良好統計規律。SVM是一種二分類模型,其基本模型定義為特征空間上間隔最大的線性分類器,即支持向量機的學習策略是間隔最大化,最終可轉化為一個凸二次規劃問題的求解問題。
實驗系統主要由接入點(AP)和監控點(MP)兩部分組成。我們利用兩臺筆記本分別作為AP和MP構建實驗平臺,此方法可以避免高速發送數據包所造成失真問題。
具體實驗設備為兩臺裝有Intel 5300網卡的筆記本電腦,其操作系統為Ubuntu 14.04 LTS。Intel 5300網卡提供了3根MIMO天線,理論上可以產生2×3=6條天線對鏈路,但實際中由于受到環境波動、設備工作狀態等因素影響,我們能夠穩定提取到的鏈路數為3根,因此本文選取線對1-1、1-2、1-3進行研究。
數據采集時,人體分別靜止站立于房間內不同位置,由MP采集來自AP的數據包。人體站立在不同位置采集點時對環境造成不同的影響,即AP所發射的無線信號在經過人體和物體的反射后最終被 MP 接收。我們從MP接收數據包中同時提取出包含人體處在不同位置的CSI幅度和相位信息。
實驗過程中AP的發包率為每秒50個,每個位置點數據采集的時間為20 s,理論上在每個位置采集點,我們可以采集到1 000個樣本點。但在實際情況時,存在丟包的可能性,所以并不是每個位置點采集到的樣本點都是1 000個,有些位置采集點可能會丟失少量的樣本點,但這并不影響實驗所收集數據的可靠性。
我們選取了2種不同的環境進行實驗,第一種環境是在較為擁擠混亂的小會議室中,第二種環境是在較為空曠的小教室中。此外,本文還給出了兩種實驗環境的平面圖如圖4所示。

圖4 兩種實驗環境平面圖
首先,實驗比較了僅用30個子載波的幅度值作為特征和用30個子載波的幅度和相位值同時作為特征在兩種環境下定位分類的準確率。此外,為了評估平滑去噪處理對實驗結果的影響,本文進行了僅用幅度不平滑、僅用幅度平滑、幅度相位結合使用不平滑、幅度相位結合使用平滑的四組對比實驗。我們采用了支持向量機SVM算法進行指紋庫的學習和分類,其實驗結果如圖5所示。

圖5 兩種環境下SVM分類效果
由圖5可以看出,在兩種室內環境下,如果僅用幅度作為分類特征,不論數據是否經過平滑處理,其人員定位的準確率都不如將幅度和相位結合使用后的準確率高,這有力的說明了增加CSI的相位特征信息有助于提升定位準確率;而在使用平滑處理后,無論是僅用幅度還是將幅度和相位結合都比未進行平滑處理的準確率要高,這也很好的證明了在機器學習進行特征提取前,對數據預先進行平滑去噪處理有助于提升定位效果。特別的,如果采用聯合幅度和相位作為指紋分類特征,并且通過滑動平均濾波器預先對數據進行處理,其檢測定位效果是最好的,如在實驗的環境2中天線對1-1在SVM算法下的檢測精度最高可達93.18%。
此外,我們以僅采用30個子載波的原始幅度值(即未經平滑處理)方法為基準,比較分析了本文所提出方法在兩個環境下的準確率提升度。環境1中,用本文提出方法比僅用30個原始子載波方法提升了12.4%,即從70.25%提升到82.65%;而環境2中,用本文提出的方法比僅用30個原始子載波方法提升了14.54%,由76.08提升到90.62%。這充分說明本文所提出方法對于改善定位的效果是十分顯著的。
為了說明我們通過增加相位信息作為特征的作用效果,本文以環境1中的天線對1-3分別在使用幅度、相位、幅度結合相位作為指紋特征時的混淆矩陣來進一步驗證。
由圖6~圖8可以比較看出,僅用幅度或者僅用相位作為特征時在某些位置點的識別可能效果不好。例如圖6中僅用幅度作為特征時,其位置4、9、10、13等的區分效果并不好,容易于相鄰位置點混淆。而在圖7中,這幾個位置點在僅用相位特征時的區分效果卻較好,因此我們可以通過使用相位特征來彌補這幾個位置使用幅度特征的分類準確度。當然在另一些情況中,也會存在僅用相位特征區分效果不好的情況,而此時幅度特征可能區分效果較好。因此,當將幅度和相位特征結合后可以大大改善和提高原先僅用單種類型特征區分不好時的位置點分類效果。

圖6 僅用幅度作為特征

圖7 僅用相位作為特征

圖8 相位幅度結合作為特征
實驗最后比較了3種常見機器學習算法在采用本文算法后的準確率和檢測時間平均值,實際結果如表1表示。

表1 不同分類算法下的準確率和時間效率對比
由表1可知,無論在多徑干擾嚴重還是較少的環境下,支持向量機SVM的準確率都是最好的。不過在實際應用中,并不能一味的追求準確率而完全忽略時間成本。如果當系統特別有實時性要求時,則推薦使用隨機森林算法。因為當指紋庫模型構建完成后,在環境1和環境2的幾種算法對比中采用隨機森林算法的檢測時間是最短的;而其中貝葉斯網絡算法的準確度雖然不高,但是其訓練/檢測的時間相對比較均衡。總而言之,在實際使用時要根據實際系統具體需求對機器學習算法進行合理的選擇。
①本文同時利用信道狀態的幅度和相位信息作為指紋特征,并通過機器學習方法進行無源室內定位。實驗結果表明,相比于傳統只利用幅度信息的方法,本文方法的定位精度有了顯著提高。
②在信號預處理過程中加入了滑動平滑濾波器對數據進行平滑,表明在增加相位信息和經過預先平滑去噪處理后,其定位準確率和穩定性都得到了改善和提高。
③此外,本文還比較了幾個不同機器學習算法的準確率和時間效率,結果表明在本實驗中SVM的準確率最高。但在實際使用中,我們應該根據自己的需求來選擇適當算法。
本文工作仍然有需要進一步深入研究的地方。如在實驗中可以增加可用天線對的數目,嘗試進一步提高準確率和穩定度。同時,還可以對移動目標進行定位,本文所研究的兩種室內環境下對靜止目標的定位方法為下一步工作提供了經驗基礎。
參考文獻:
[1] Cho H,Jang H,Baek Y. Practical Localization System for Consumer Devices Using Zigbee Networks[J]. IEEE Transactions on Consumer Electronics,2010,56(3):1562-1569.
[2] Feng G,Guo X,Wang G. Infrared Motion Sensing System for Human-Following Robots[J]. Sensors & Actuators A Physical,2012,185(5):1-7.
[3] Zhu W,Cao J,Xu Y,et al. Fault-Tolerant RFID Reader Localization Based on Passive RFID Tags[J]. IEEE Transactions on Parallel & Distributed Systems,2014,25(8):2065-2076.
[4] 陳兵,楊小玲. 一種基于概率密度的WLAN 接入點定位的算法[J]. 電子與信息學報,2015,37(4):855-862.
[5] Radmard M,Karbasi S M,Nayebi M M. Data Fusion in MIMO DVB-T-Based Passive Coherent Location[J]. IEEE Transactions on Aerospace & Electronic Systems,2013,49(3):1725-1737.
[6] 劉慶,吳哲夫,何熊熊,等. Min-Max節點定位算法的分析與改進[J]. 傳感技術學報,2012,25(8):1126-1131.
[7] Wu K,Xiao J,Yi Y,et al. Fila:Fine-Grained Indoor Localization[C]//Proc IEEE INFOCOM,2012:2210-2218.
[8] Wu K,Xiao J,Yi Y,et al. CSI-Based Indoor Localization[J]. IEEE Transactions on Parallel & Distributed Systems,2013,24(7):1300-1309.
[9] 吳哲夫,李嘉南,王中友,等. 無線信道傳感的朝向檢測研究[J]. 傳感技術學報,2018,31(1):90-96.
[10] Zhang Lei,Ding Enjie,Zhao Zhikai,et al. A Novel Fingerprinting Using Channel State Information with MIMO-OFDM[J]. Cluster Computing—The Journal of Networks Software Tools and Applications,2017,20(4):3299-3312.
[11] Li Xiaohui,Cai Xiong,Hei Yongqiang,et al. NLOS Identification and Mitigation Based on Channel State Information for Indoor WiFi Localisation[J]. IET Communications,2017,11(4):531-537.
[12] Halperin D,Hu W,Sheth A,et al. Tool Release:Gathering 802.11n Traces with Channel State Information[J]. Acm Sigcomm Computer Communication Review,2011,41(1):53-53.
[13] Wu C,Yang Z,Zhou Z,et al. PhaseU:Real-Time LOS Identification with WiFi[C]//Computer Communications. IEEE,2015:2038-2046.
[14] Zhang X L,Liu P. A New Delay Jitter Smoothing Algorithm Based on Pareto Distribution in Cyber-Physical Systems[J]. Wireless Networks,2015,21(6):1913-1923.
[15] Chih-Wei Hsu,Chih-Jen Lin. A Comparison of Methods for Multiclass Support Vector Machines[J]. IEEE Transactions on Neural Networks,2002,13(2):415-425.
[16] Ho J,Hwang W L. Wavelet Bayesian Network Image Denoising.[J]. IEEE Transactions on Image Processing,2013,22(4):1277-1290.
[17] 郭山清,高叢,姚建,等. 基于改進的隨機森林算法的入侵檢測模型[J]. 軟件學報,2005,16(8):1490-1498