蔡燁峰
(浙江越秀外國(guó)語(yǔ)學(xué)院,浙江紹興,312000)
隨著計(jì)算機(jī)技術(shù)的發(fā)展,各種網(wǎng)絡(luò)智能設(shè)備和傳感器的普及,使得計(jì)算機(jī)領(lǐng)域云計(jì)算硬件性能得到了進(jìn)一步提升,數(shù)據(jù)的各方面應(yīng)用也得到優(yōu)化。多維傳感器數(shù)據(jù)融合屬于一個(gè)新的研究領(lǐng)域,各種先進(jìn)的技術(shù)進(jìn)入人們的視線,為海量數(shù)據(jù)的融合與計(jì)算提供了新的思路,同時(shí)也為大數(shù)據(jù)的發(fā)展帶來(lái)了新的希望。在大數(shù)據(jù)背景下,多維傳感器數(shù)據(jù)融合技術(shù)在我國(guó)應(yīng)用到了多個(gè)領(lǐng)域,如農(nóng)業(yè)、軍事、醫(yī)療等。與傳統(tǒng)的單傳感器相比,多維傳感器數(shù)據(jù)融合技術(shù)在探測(cè)、跟蹤和目標(biāo)識(shí)別等方面都得到了加強(qiáng),整個(gè)系統(tǒng)的安全可靠性提高了,得到的數(shù)據(jù)準(zhǔn)確的更加高,同時(shí)其覆蓋率、實(shí)時(shí)性等功能也都得到了提高[1]。
多維傳感器數(shù)據(jù)融合的本質(zhì)是將各種類(lèi)型的傳感器進(jìn)行體系化處理,將傳感器獲取的各種不同類(lèi)型數(shù)據(jù)進(jìn)行統(tǒng)一、科學(xué)、有邏輯性的分類(lèi)和定義。隨著現(xiàn)代社會(huì)應(yīng)用傳感器的場(chǎng)景越來(lái)越多,傳感器獲取的數(shù)據(jù)類(lèi)型和數(shù)據(jù)量飛速提升,多維傳感器數(shù)據(jù)融合已經(jīng)成為大數(shù)據(jù)背景下數(shù)據(jù)分析領(lǐng)域最常見(jiàn)的概念。本文認(rèn)為,多維傳感器數(shù)據(jù)融合理念可以被定義為:一種采用計(jì)算機(jī)、大數(shù)據(jù)、云計(jì)算等手段對(duì)多種不同類(lèi)型傳感器獲取的海量數(shù)據(jù)信息進(jìn)行算法分析,將分析后結(jié)果進(jìn)行制備然后被數(shù)據(jù)監(jiān)測(cè)人員進(jìn)行統(tǒng)一定義、解釋、描述的數(shù)據(jù)融合方法。對(duì)于當(dāng)今數(shù)據(jù)應(yīng)用領(lǐng)域而言,多維傳感器數(shù)據(jù)融合能夠幫助數(shù)據(jù)分析人員獲得更科學(xué)且更具實(shí)用性的信息。
多維傳感器數(shù)據(jù)融合的原理與人類(lèi)大腦進(jìn)行多元信息分析處理的過(guò)程類(lèi)似,需要借助一定的平臺(tái)利用多種信息數(shù)據(jù)處理工具對(duì)信息進(jìn)行匯總和處理。多維傳感器數(shù)據(jù)融合是在各種傳感器的基礎(chǔ)上對(duì)數(shù)據(jù)進(jìn)行自動(dòng)支配、篩選、匯總和使用,將傳感器獲取的多維數(shù)據(jù)利用網(wǎng)絡(luò)平臺(tái)或者計(jì)算機(jī)硬件系統(tǒng)進(jìn)行保存、組合、描述[2]。多維傳感器數(shù)據(jù)融合過(guò)程如下:
(1)利用相應(yīng)算法對(duì)傳感器所輸出的多維數(shù)據(jù)進(jìn)行特征提取,得到多維傳感器數(shù)據(jù)輸出離散或連續(xù)的數(shù)據(jù)特征失量,算法會(huì)對(duì)這些矢量進(jìn)行說(shuō)明;
(2)將系統(tǒng)中N個(gè)(N≥2,具體數(shù)量取決于系統(tǒng)復(fù)雜程度)不同類(lèi)型的多維傳感器觀測(cè)目標(biāo)數(shù)據(jù)進(jìn)行收集和分類(lèi);
(3)將多維數(shù)據(jù)傳感器關(guān)于收錄數(shù)據(jù)信息的目標(biāo)進(jìn)行說(shuō)明,根據(jù)這些數(shù)據(jù)說(shuō)明將有關(guān)聯(lián)的數(shù)據(jù)統(tǒng)一進(jìn)行分組;
(4)對(duì)(1)獲得的各數(shù)據(jù)矢量進(jìn)行聚類(lèi)算法等識(shí)別分析,完成各類(lèi)型數(shù)據(jù)關(guān)于目標(biāo)的優(yōu)化說(shuō)明;
(5)利用融合算法將個(gè)數(shù)據(jù)適量?jī)?yōu)化目標(biāo)說(shuō)明結(jié)果進(jìn)行合成,得到多維傳感器數(shù)據(jù)的一致性解釋和描述。
多維傳感器數(shù)據(jù)融合是依據(jù)數(shù)據(jù)的信息含量進(jìn)行規(guī)劃分類(lèi)的,一般分為兩種:有損融合,是在數(shù)據(jù)融合保留全部信息的基礎(chǔ)上,通過(guò)遞減的方式(減少數(shù)據(jù)存儲(chǔ)量、數(shù)據(jù)分辨率等)進(jìn)行壓縮方式的傳輸;無(wú)損融合,該融合方式主要是在保留所有細(xì)節(jié)的前提下,去除冗余數(shù)據(jù)。如圖1所示,數(shù)據(jù)的融合操作步驟通常是由高到底依次為:決策級(jí)融合、特征級(jí)融合及數(shù)據(jù)級(jí)融合[3]。

圖1 數(shù)據(jù)融合的步驟
多維傳感器最底層的數(shù)據(jù)融合服務(wù)對(duì)象是最前端的數(shù)據(jù),通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行分析處理。多維傳感器在進(jìn)行圖像目標(biāo)識(shí)別工作時(shí),需要對(duì)底層的原始圖像像素進(jìn)行融合;數(shù)據(jù)級(jí)的融合工作通常會(huì)面對(duì)海量數(shù)據(jù),對(duì)海量數(shù)據(jù)進(jìn)行融合的時(shí)間、難度通常較高,且同時(shí)進(jìn)行數(shù)據(jù)級(jí)融合的抗干擾性要求較高。由于一般的傳感器數(shù)據(jù)采集穩(wěn)定性有所欠缺,通常還存在不確定性。因此這就要求多維傳感器在融合數(shù)據(jù)的同時(shí)需要具備一定的糾錯(cuò)能力。在該研究領(lǐng)域常用的數(shù)據(jù)融合算法一般為:代數(shù)法、Wavelet transform等。
大數(shù)據(jù)背景下利用多維傳感器進(jìn)行的特征級(jí)數(shù)據(jù)融合的主要工作是被監(jiān)測(cè)者的特征融合,該信息來(lái)源主要是傳感器采集的原始信息,從該信息中找出反映事物屬性的數(shù)據(jù),對(duì)其加以分析和整理,該步驟屬于多維傳感器數(shù)據(jù)融合的中間步驟。特征級(jí)數(shù)據(jù)融合的一般步驟包括:首先,系統(tǒng)會(huì)根據(jù)2.1部分獲得的數(shù)據(jù)級(jí)預(yù)處理結(jié)果進(jìn)行數(shù)據(jù)的特征提?。黄浯?,系統(tǒng)算法將會(huì)根據(jù)提取特征以后的數(shù)據(jù)特征對(duì)數(shù)據(jù)快速進(jìn)行特征融合;最后,系統(tǒng)會(huì)根據(jù)不同特征的數(shù)據(jù)級(jí)進(jìn)行區(qū)別性的數(shù)據(jù)屬性描述。
多維傳感器在基礎(chǔ)數(shù)據(jù)和中間步驟的基礎(chǔ)上,再對(duì)數(shù)據(jù)進(jìn)行特征提取、數(shù)據(jù)分類(lèi)及邏輯運(yùn)算處理,為多維傳感器的核心決策環(huán)節(jié)提供輔助[4]。決策及數(shù)據(jù)融合屬于多維傳感器中最高級(jí)別的數(shù)據(jù)融合,該過(guò)程具有容錯(cuò)性、實(shí)時(shí)性好的特征,在工作中當(dāng)氣體傳感器出現(xiàn)故障時(shí),該部分仍能工作出決策。決策級(jí)數(shù)據(jù)的融合步驟包括:首先,對(duì)決策級(jí)數(shù)據(jù)進(jìn)行預(yù)處理,剔除不屬于決策級(jí)數(shù)據(jù)的數(shù)據(jù)集、數(shù)據(jù)等;其次,對(duì)決策級(jí)數(shù)據(jù)進(jìn)行特征提取,得到不同特征說(shuō)明的決策級(jí)數(shù)據(jù);再次,對(duì)不同說(shuō)明下的決策級(jí)數(shù)據(jù)進(jìn)行說(shuō)明和融合;最后,對(duì)融合完成以后的決策級(jí)數(shù)據(jù)進(jìn)行再次說(shuō)明,得到完整的決策級(jí)數(shù)據(jù)融合結(jié)果。
深度置信網(wǎng)絡(luò)又稱(chēng)DBN算法是機(jī)器學(xué)習(xí)之神經(jīng)網(wǎng)絡(luò)的一種。深度置信網(wǎng)絡(luò)與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)在結(jié)構(gòu)方面和數(shù)據(jù)模型生成方面具有一定的相似性,都包含了隱藏層、標(biāo)簽神經(jīng)元、聯(lián)合記憶層等結(jié)構(gòu)。深度置信網(wǎng)絡(luò)數(shù)據(jù)融合算法具有應(yīng)用范圍廣、網(wǎng)絡(luò)可拓展性強(qiáng)等優(yōu)勢(shì),如今已經(jīng)成為數(shù)據(jù)融合算法中最為常見(jiàn)的算法類(lèi)型之一,被廣泛應(yīng)用于語(yǔ)言識(shí)別、圖像識(shí)別等領(lǐng)域。
圖2所示為典型的深度置信網(wǎng)絡(luò)結(jié)構(gòu)。在該網(wǎng)絡(luò)結(jié)構(gòu)中,聯(lián)合記憶層包含了標(biāo)簽神經(jīng)元、頂層神經(jīng)元以及隱含層神經(jīng)元等部分,屬于整個(gè)結(jié)構(gòu)的最頂層,類(lèi)似于人體的大腦;兩個(gè)隱含層位于結(jié)構(gòu)的中間部位,主要負(fù)責(zé)判定模型權(quán)重和生成模型權(quán)重等,相當(dāng)于人體的血管等;最下層的RBM層是受限玻爾茲曼機(jī),是一種基于數(shù)據(jù)集學(xué)習(xí)概率分布的神經(jīng)網(wǎng)絡(luò)模型,可以對(duì)數(shù)據(jù)模型權(quán)重進(jìn)行訓(xùn)練,得到所有不同數(shù)據(jù)權(quán)重模型中的最佳權(quán)重[5]。

圖2 BDN結(jié)構(gòu)
如圖3所示為深度置信網(wǎng)絡(luò)(DBN)算法訓(xùn)練過(guò)程。系統(tǒng)工作時(shí)會(huì)首先訓(xùn)練第一個(gè)RBM,通過(guò)算法確定第一個(gè)RBM的權(quán)重等參數(shù),將這一RBM的權(quán)重等參數(shù)作為訓(xùn)練第二個(gè)RBM以及后續(xù)其他RBM的依據(jù);其次,系統(tǒng)會(huì)根據(jù)第一個(gè)RBM的訓(xùn)練結(jié)果對(duì)第二個(gè)RBM進(jìn)行訓(xùn)練并將第二個(gè)RBM的訓(xùn)練結(jié)果與第一個(gè)RBM的訓(xùn)練結(jié)果進(jìn)行疊加,得到后續(xù)第三個(gè)RBM訓(xùn)練的依據(jù);最后,系統(tǒng)會(huì)根據(jù)第二個(gè)和第一個(gè)RBM的訓(xùn)練結(jié)果進(jìn)行多次后續(xù)數(shù)據(jù)的重復(fù)訓(xùn)練,如果對(duì)應(yīng)的神經(jīng)元打開(kāi)則設(shè)置為1,如果對(duì)應(yīng)的神經(jīng)元關(guān)閉則設(shè)置為0。

圖3 DBN訓(xùn)練過(guò)程
(1)DBN的訓(xùn)練過(guò)程可以被看作是多層 RBM模型的訓(xùn)練過(guò)程。DBN既可以被當(dāng)做用于判別RBM模型的神經(jīng)網(wǎng)絡(luò),也可以被當(dāng)作是一種生成多層 RBM的模型算法。DBN的訓(xùn)練過(guò)程是一種非監(jiān)督貪婪逐層法對(duì)多層 RBM進(jìn)行預(yù)訓(xùn)練從而獲得相應(yīng)權(quán)值的過(guò)程。
(2)DBN的訓(xùn)練過(guò)程是一種層次較為分明的過(guò)程。每一層的訓(xùn)練都需要在充分的數(shù)據(jù)向量基礎(chǔ)上進(jìn)行推斷隱層,然后將多種隱層進(jìn)行串聯(lián)從而得到一個(gè)DBN。在所有不同的DBN中,上一個(gè)DBN都是下一個(gè)DBN的訓(xùn)練基礎(chǔ);上一個(gè)RBM的隱層都是下一個(gè)RBM的顯層。
(3)神經(jīng)元是多維傳感器融合過(guò)程算法體系中的重要組成部分。DBN由若干個(gè)不同的神經(jīng)元層構(gòu)成,而構(gòu)成不同神經(jīng)元層的是DBN網(wǎng)絡(luò)結(jié)構(gòu)的可視層和隱層,二者之間通過(guò)神經(jīng)網(wǎng)絡(luò)連接,但層內(nèi)單元間不存在網(wǎng)絡(luò)連接,為相互獨(dú)立層。
從非監(jiān)督學(xué)習(xí)來(lái)講,其目的是盡可能地保留原始特征的特點(diǎn),同時(shí)降低特征的維度。從監(jiān)督學(xué)習(xí)來(lái)講,其目的在于使得分類(lèi)錯(cuò)誤率盡可能地小。而不論是監(jiān)督學(xué)習(xí)還是非監(jiān)督學(xué)習(xí),DBN算法本質(zhì)都是Feature Learning的過(guò)程,即如何得到更好的特征表達(dá)[6]。
隨著大數(shù)據(jù)的發(fā)展以及科研者的不斷研發(fā),多維傳感器數(shù)據(jù)融合已經(jīng)得到了一定的完善,數(shù)據(jù)融合的基礎(chǔ)理論、兼有魯棒性和準(zhǔn)確性的融合算法都有所提高。實(shí)現(xiàn)技術(shù)將不斷地得到更新,實(shí)際應(yīng)用將不斷地被擴(kuò)展。多傳感器數(shù)據(jù)融合技術(shù)必將不斷地走向成熟。