劉紅英
(廣州工商學院,廣州 510850)
微電子技術不斷提高的背景下,微機械傳感器也取得了較為優秀的成果。目前微機械傳感器被深入研究,截止到目前,微機械傳感器的類型大致分為七種,分別為微機械陀螺、微氣體傳感器、微機械溫度傳感器、微機械壓力傳感器、微加速度傳感器、微流量傳感器和其他微機械傳感器[1]。這些傳感器被廣泛應用到化學以及醫學等行業當中,通過應用到材料、設備等環節上,優化數據傳輸與技術控制效果,具有極大的應用前景。為了進一步掌握微機械傳感器的應用方法,針對微機械傳感器提出不同的個性化推薦算法[2]。這些現有的推薦算法被應用到各大網絡以及設備中,盡管能夠取得一定成果,但在及時性上還不夠完善,需要進一步優化。云模式是將云計算與搜索引擎結合使用的新技術,具有一站式解決問題的綜合能力,針對云模式的特點研究全新的微機械傳感器個性化推薦算法。
標準的特征項標簽能夠以更加全面的方式表達傳遞信息,能夠讓無線傳感器網絡中的節點之間快速識別,建立不同關聯度的鄰居關系。當微機械傳感器傳輸穩定的數據,也就是常規內容的數據時,設置常規內容與其對應的權重分別為xi和ωi,采用信息加權技術TF-IDF,衡量傳感器中數據的重要程度。其中TF用于描述詞頻,該數值越大越能說明內容出現的次數越多,有較高的重要性;IDF用于描述反文檔頻率,也就是出現次數較少導致詞頻較低的內容。通過上述分析過程,將標簽與TF-IDF方法融合,計算公式為:

式中:fij表示信息加權函數;M表示總文檔數;mi表示出現特征xi的文檔數;Wj表示文本。設置某一特征項信息的標簽為xj,根據上述公式融合特征項標簽,得到對應的權重為:

式中:xfij代表標簽xj被使用的次數;M表示總數據量;m表示觸發過標簽的數據量;Wi表示標簽集合。標簽的權重取值范圍在[0,1]內,當標簽被頻繁觸發,說明傳感器傳輸過大量同類內容,對于該標簽下的數據相當熟悉。但在整個網絡大環境中,傳感器還會面對即時性的信息,此類信息傳感器接觸的相對較少,甚至有的沒有接觸過,那么無線傳感器網絡中的節點,對于此類數據沒有對應的鄰居關系,無法接收鄰居消息,增大鄰居發現延遲,所以針對即時數據也需要計算對應的權重,加快對所有節點的喚醒速度,快速建立鄰居關系從而減少推薦延遲[3]。根據傳感器產生的瀏覽行為,針對收藏頁面、保存頁面、打印頁面、停留時間四項內容建立行為函數,公式為:

公式中:p表示傳感器接觸過的網絡頁面;其他函數與上述四項內容按順序一一對應。當這些函數的值為0時,說明沒有對該頁面執行數據記錄,反之則記錄了該頁面的數據。結合以上公式,得到特征項xj的權重為:

公式中:P表示包含特征項xj的頁面集合。將權重標簽的大小控制在[0,1]內,歸一化處理后的特征項標簽對應的權重為:

公式中:X表示特征項的集合。通過上述方法對穩定性數據與即時性數據建立標簽,讓傳感器通信范圍內的節點間快速建立鄰居關系,從而為個性化推薦提供更大的主動性。
無線傳感器網絡執行龐大的數據傳輸工作,盡管設置了不同的特征項標簽,也還是會影響節點之間建立鄰居關系的速度,利用云計算模式融合同屬性標簽并實時更新。已知云數據信息交互過程中,每一個簇頭節點具備初始數據感知能力,根據標簽實施分派,而后通過數據采集、相鄰節點身份認證、多通道通信等步驟實現數據的傳輸工作。假設簇頭節點的信息導碼通過下列公式獲得:

公式中:K表示簇頭總數;sat表示階段函數;S(ω)表示權重為ω的Sink節點;α表示鄰居標簽的特征相似度;η表示信息流特征;g1、g2分別表示穩定和即時數據數量。假設定量論域是精準的,則任意一個連通的云數據可通過G=(V,E,S)描述,其中V表示全部節點的總和;E表示期望、熵等參數的全局定義;S表示Sink節點[4]。整合云數據特征項,通過提取云數據的熵融合特征、分區預處理熵融合特征,實現云計算模式對海量標簽的融合。定義信息數據節點的信息為(ai,bi),以空間采樣分簇重構的方式得到X的空間結構,式為:

按照間隔粒度劃分空間結構,針對分區特征集提取同一類節點的信息熵,式為:

通過上述公式得到信息熵,實現對標簽的融合。同樣根據空間結構對特征進行混合匹配,從而達到實時更顯標簽的目的。云計算模式構建的簇頭相異粒度數據矩陣為:

綜合云自身的特殊性以及數據的相似性,以模糊計算為原則,設置標簽匹配模式,實時更新標簽,幫助鄰居節點之間快速識別與關聯。式為:

通過上述融合與匹配過程,實時更新特征項標簽,加快節點之間建立關聯,強化對節點的喚醒操作。
在獲得實時標簽的基礎上,利用聚類技術按照位置的遠近處理標簽,將位置近的標簽和位置遠的標簽劃分到不同的簇中,這樣在個性化推薦過程中能縮減項目搜索范圍,在考慮時序性的條件下,能改進算法的推薦效率。聚類過程如圖1所示。

圖1 聚類流程
根據實時標簽的聚類結果,將BP模型與RNN模型融合使用,解決個性化推薦過程中產生的時間序列問題。假設用戶行為在短期內發生頻繁變化,此時的特征項標簽也隨之改變,利用反向傳播算法(BP)在接收輸入數據與產生輸出數據之間,根據一定程度的誤差反向傳播,更新網絡內部的各種參數,該誤差值為:

公式中:J表示損失函數,用來描述誤差;R表示隱藏層;c表示神經元的偏置。循環神經網絡(RNN)具有可多次交互數據的能力,可以根據交互次數設置網絡空間層次,每一空間層代表一次交互過程。將二者融合使用,建立混合推薦模型。已知網絡的輸入是實際值,輸出是預測值,輸入向量的長度等于項目總數,所以讓BP與RNN分享相同的輸出層,合并輸出層后產生單一結果。則存在:

式中:b(J)i、b(J)0i分別表示合并輸出層和隨機輸出層的產出結果[5]。假設RNN的單元數為E,則傳感器推薦某一內容的概率為:

上述公式無需手動操作,而是通過神經網絡訓練實現,通過網絡層對數據的不斷采集、更新、匹配,實現微機械傳感器的個性化推薦工作。
本次測試選用的設備配置Intel Pentium 4處理器,操作系統為Windows XP,包括200G硬盤和4G內存。利用Java語言模擬實現,將帶有微機械傳感器的設備與互聯網平臺之間建立連接,檢查網絡是否穩定。利用SimPy設計一個針對離散事件的仿真框架,該軟件以生成器為基礎模擬實體,也就是將微機械傳感器的節點看作生成器,仿真個性化推薦操作。
根據推薦質量評價結果,判斷本文算法是否具有實用性;根據響應時間評價結果,判斷本文算法是否在短時間內能喚醒網絡通信節點;根據平均發現延遲評價結果,判斷本文算法是否能夠快速建立鄰居關系;根據節點能耗評價結果,判斷本文算法是否能夠主動喚醒更多節點,將額外能量開銷降至最低。推薦質量的評價將平均絕對偏差MAE作為衡量指標,所得的值越小越能說明算法具有較高的推薦質量。該值的計算公式為:

式中:Ai、Bi分別表示用戶評分的預測集合和實際集合。響應時間用RT表示,也就是目標發出推薦請求與傳感器產生推薦的時刻差值,計算式為:

式中:t1表示發出推薦請求的時刻;t2表示產生推薦結果的時刻。平均發現延遲用RTT表示,計算公式如下:

式中:t0、t3表示客戶端的發包與收包時間;t1、t2表示節點的發包與收包時間。設置每個節點平均能耗為E,則式為:

公式中:k為常數;d表示一跳的距離;i表示節點數,且i>2。測試設置2個對照組,分別為協同推薦算法和混合推薦算法。以對比測試的方法比較三組方法在四組指標上的評價差異,根據測試結果比較不同算法的性能。
本文方法根據推薦者、被推薦者和推薦目標三項參數,在特征項標簽的基礎上,利用云計算模式融合與實時更新標簽,如圖2所示。

圖2 云模式的應用
在融合同類型標簽的基礎上,通過實時更新標簽獲取實時數據,保證標簽都是不重疊的。本文研究的算法在此基礎上推薦個性化數據。
2.4.1 推薦質量測試
將本文算法與兩組傳統算法分別應用到同一型號的設備中,已知設備的微機械傳感器型號相同。利用該設備查詢信息,利用式(14)評價三組算法的推薦質量,結果如圖3所示。

圖3 推薦質量測試結果
根據上圖顯示的結果可知,三組方法的平均絕對偏差MAE均處于0.5以下,但本文算法的評價結果比兩組算法分別低了0.21和0.19,說明本文算法的個性化推薦質量更高。
2.4.2 響應時間測試
根據式(15)計算三組算法的響應時間,結果如圖4所示。

圖4 響應時間測試結果
根據圖4顯示的結果可知,本文算法的響應時間RT最短,面對500個通信網絡節點時,平均響應時間比協同推薦算法和混合推薦算法分別減少了24.1s和19.8s,說明本文算法在短時間內,能快速喚醒更多傳感器網絡通信節點。
2.4.3 延遲對比
已知傳感器網絡的能量有限,通常情況下的網絡節點會隨時進入睡眠狀態,比較三組算法的平均發現延遲,根據式(16)得到的結果,繪制圖5所示的實驗結果。

圖5 平均延遲測試結果
根據上述評價結果可知,在同樣的測試條件下,隨著節點數量的增加,本文算法的平均發現延遲RTT穩定在31~33s之間,協同推薦算法和混合推薦算法的平均發現延遲,分別在31~38s和31~40s之間,說明本文算法在快速響應的基礎上,將通信節點之間迅速建立鄰居關系,能夠以最快速度進入到工作狀態。
2.4.4 能耗對比
利用式(17)評價節點能耗并繪制實驗圖,如圖6所示。

圖6 節點能耗測試結果
根據圖6顯示的評價結果可知,面對越來越多的節點數目,本文算法能夠將節點能耗E始終控制在2.0×103以下,而協同推薦算法和混合推薦算法的節點能耗,隨著節點數目的增加而逐漸增多,說明本文方法能夠用最小的能耗喚醒更多的節點,將額外能量開銷降至最低。
隨著互聯網、互聯網技術的飛速發展,網絡資源變得更加復雜、多樣,如何從海量的數據中快速獲取目標信息,滿足不同使用用戶的需求,是現階段研究的重點問題。面對信息過載這一現狀,本文算法以推薦的及時性為研究目標,利用更多智能技術實現了對現有推薦算法的優化。但此次研究還存在不足,這種算法的及時性能得到提升,但對于推薦數據的準確性還有待驗證。今后在時間充沛的情況下,可以評價推薦內容的準確性,完善該算法的其他性能。