信海輝,張姍姍
(1.大連科技學院,大連 116052;2.大連海事大學,大連 116026)
隨著現代科學技術與互聯網技術的不斷發展,物聯網技術逐漸的被應用到現實生活中,并被越來越多的公司所喜愛,許多公司投入了大量的精力發展物聯網技術,不斷推動著物聯網技術的創新和發展,也使得物聯網技術成為現代互聯網行業的主流發展趨勢。然而,由于物聯網技術具有明顯的海量性與異構性等特征,使得物聯網技術發展過程中很難突破數據挖掘技術瓶頸,這對于發展物聯網技術具有非常大的阻礙。在這樣的背景下,云計算的出現為物聯網發展數據挖掘技術提供了更多的可能,這是因為云計算不僅具有更加寬泛的IT基礎水平,也擁有很好的數據挖掘整合水平。因此,加強云計算在物聯網數據挖掘工作中的應用非常有必要,將會引領社會發展的潮流。
目前,物聯網技術在數據挖掘方面面臨的困難主要體現在以下幾個方面[1]:第一,數據存儲較為分散,增加數據挖掘難度;第二,物聯網運行中數據資源龐大、傳感器節點數量較多,要求中央處理器具有非常好的硬件性能;第三,考慮到數據的類型和安全性,將全部數據放置到同一數據庫中非常不合理。為了不斷的解決這些問題,將云計算應用到物聯網數據挖掘中,一般情況下,該平臺主要涵蓋了以下幾個部分,分別是物聯網感知層、物聯網傳輸層、物聯網數據層、物聯網數據挖掘服務層[2]。
第一,物聯網感知層的主要工作范疇是在被控制區域設置一定數量的傳感器、攝像頭等不同類型的感知設備,通過這些設備的工作采集控制區域的實時數據,與此同時采集完成的數據在感知層會通過無線網絡進行信息傳輸,在將大量的數據資源整合到匯聚節點后發送給總服務器。第二,物聯網傳輸層的主要工作職能是充分利用各種網絡實現對采集數據的快速、高效、準確傳輸,確保檢測設備采集到數據能夠穩定的傳輸給總服務器。第三,物聯網數據層是實現物聯網數據挖掘的關鍵所在,采用科學、合理的方式儲存和處理數據是確保數據挖掘工作順利開展的前提保障,一般情況下物聯網數據層包含了數據轉換以及數據存儲兩大部分。第四,物聯網數據挖掘服務層功能的實現需要建立在數據準備模塊、挖掘模塊和個人模塊基礎上,也是物聯網數據是否能夠快速、準確挖掘的核心部位[3]。
實驗用臺式計算機(運行內存4G,128G存儲空間,操作系統Windows XP)一臺,并在計算機系統內設置3個虛擬機,之后在虛擬機上設置不同形式的節點,此外,每一個虛擬機的操作系統都采用Linux[4]。
在完成實驗準備階段后,對關聯實驗算法的相關數據轉變成PLM文件(容量為1024M),該過程的實現主要是利用C++程序代碼檢索重點詞語的形式完成的,再將轉換的PLM文件利用HDFS傳輸到模擬平臺中進行分別儲存。在結束上述工作后開始進行系統運行,根據系統運行狀況記錄相關數據,并關注實驗結果中的頻繁項集。
將不同大小的文件傳輸到運行系統中,得到了相對于的運行時間,如表1所示。

表1 文件大小與運行時間的關系表
對上表中的數據進行分析可得,在文件大小逐級遞增的情況下,新設計的Apriori算法實際效果較好,能夠滿足數據信息增大的環境下快速查找頻繁項集,所以可以確認新設計平臺能夠實現對龐大數據信息的挖掘。
綜上所述,基于云計算的物聯網數據挖掘是為了發展的主流趨勢,提高云計算在物聯網中的應用非常重要。從實驗驗證中可以看出新設計的Apriori算法實際效果較好,能夠實現對龐大數據信息的挖掘。