王瑾
摘要:研究物聯網海量異構數據存儲以及共享策略,能夠有效提高數據存儲以及數據共享的質量。基于此,文章首先簡單介紹物聯網信息服務系統的結構組成。其次,分析物聯網海量異構數據存儲的方法,其中主要包括知識密度的應用、預處理技術以及數據分布3方面內容。最后,研究物聯網海量異構數據共享策略,其中主要包括基于設計準則的數據共享策略、基于物聯網標識平臺的數據共享策略兩方面內容。
關鍵詞:物聯網;異構數據;共享策略
隨著時代的不斷發展,我國物聯網行業也得到了一定的發展,雖然目前該行業涉及的范圍較廣,但是整體上仍然處于發展的初期階段,在此過程中需要重點解決物聯網中信息存儲發展的智能化問題。目前物聯網在異構數據存儲共享的過程中仍然存在較多需要完善的地方,為了保證物聯網整體的發展質量,需要根據實際物聯網在發展過程中存在的問題制定解決方案,這種方式能夠保證物聯網信息存儲以及信息共享的質量。
1 物聯網信息服務系統的結構組成
在實際運行中主要可以將物聯網系統分為以下幾方面內容,分別為感知層、網絡層、數據層以及應用層。其中信息服務系統在數據層中,主要負責存儲大量的異構數據,并將其應用在各種服務中,最終達到提供多樣化服務的目的,同時也是物聯網正常運行的前提條件。在信息服務系統中,物聯網能夠實現信息采樣功能、智能追蹤功能、監控功能以及管理功能幾方面內容,由此可以看出新信息服務系統對物聯網正常運行的重要性。物聯網信息服務系統主要由安全控制系統、共享空間系統、數據接收系統以及數據存儲系統構成,其中感知設備以及網絡通過其中的數據接口進入到原始數據層中,原始數據、加工數據以及元數據共同組成系統中的共享空間。另外,本地應用、外部應用以及外部信息服務系統通過系統中的數據應用接口進入到持久數據存儲系統中,將其中包含的數據進行存儲。數據正是通過這種方式在信息服務系統中進行相互傳輸,不同系統板塊中對應的系統功能也不同,因此,能夠實現多樣化的信息服務。
物聯網在實際應用過程中具有多源異構、規模大、時空關聯性強、冗余度高等特點,目前研究的重點在物聯網信息服務系統中的時空關聯以及事件查詢等方面內容,已經取得了一定的研究成果。但是在海量異構存儲方面,仍然存在存儲性能低以及數據共享難度高等問題,不能達到物聯網數據存儲的要求,在實際應用過程中非常容易出現信息孤島等現象,嚴重影響物聯網的整體運行質量[1]。
2 物聯網海量異構數據的存儲方法
2.1 知識密度的應用
文件系統存儲技術在實際應用過程中經常采用分布式文件系統存儲的方式,在此過程中,需要在本地文件系統的基礎之上建立物聯網文件系統,這種建立方式能夠將物
聯網的存儲點相互連接。也就是說,將系統中獨立運行的節點相互組合,最終形成一個整體,并對其中的資源進行統一管理,這種方式能夠在統一時間為多個用戶提供數據文件,大大提高了數據傳輸的效率,同時還能夠有效控制物聯網中的空間動態拓展問題。但是為了保證數據的存儲質量,還需要對其中的知識密度展開分析,知識密度指的是完整表達特定信息的過程中,需要的數據量和原始數據量之間的比值,通常情況下用小數的形式表示。物聯網中知識密度的大小通常由知識對象決定。以網絡中的音頻傳輸為例,要想得到不同時間段音頻的大小,則需要確定音頻中的聲音序列。假如音頻的大小為1 kB,共占14個字節,則其中的知識密度就是0.0137。
2.2 數據預處理技術
數據預處理技術主要包括以下幾方面內容。
2.2.1 數據的分類處理
在此過程中的分類對象為系統中的原始采樣數據,主要被分為兩類,其中第一類為輕量級的數據,主要包括數據的數值型和字符型,這類數據在實際使用中的特點就是傳輸成本低、使用的空間小。另一類是多媒體數據,主要包括視頻數據、圖像數據、音頻數據以及信號數據等,這種類型的數據在實際應用過程中主要具有需要的存儲空間大等特點,在數據預處理的過程中,針對不同種類型的數據,需要采用不同的數據處理方式。
2.2.2 增加知識密度
這種方式是提高存儲質量的主要方式,該種手段經常使用在多媒體數據中,由于多媒體數據在存儲的過程中需要大量的空間,其中的知識密度較低,因此為了在保證存儲質量的同時,縮小存儲空間,必須對其實施量化處理,將其中有價值的部分提取出來,對其中的關鍵詞和關鍵信息進行處理,這種方式能夠大大提高數據的使用效率。
在此過程中需要將多媒體數據分為兩類,其中第一類為興趣值,該類數據指的用戶在一定范圍內最關心的數據值,例如在交通系統中,所對應的數據值為車輛的違規數量以及車牌號等,縮小有效數據的范圍。第二類為摘要值,這種類型的數據指的是多媒體數據的簡略描述,這種數據中的知識密度為0,通常情況下起到輔助作用。在實際生活中,要想判斷兩個圖片的相似程度,可以通過數據中的摘要值進行判斷。
2.3 數據分布
數據分布主要包括以下幾方面內容。
2.3.1 數據類型的劃分
數據存儲類型可以分為高集能存儲以及分離存儲,其中分離存儲需要設置一個主集群和一個副集群,這兩個集群在實際運行中具有較強的獨立性,各自包含一個數據庫。在此過程中,需要將多媒體數據存在其中的副集群中,采用這種存儲方式的主要原因是外界用戶對副集群的感知程度較低,在此過程中,這兩個集群可以實施數據傳輸。多媒體數據與輕量化數據表面上存在于兩個集群之中,但是在邏輯中仍然屬于一個集群。
2.3.2 數據庫
系統中采用的存儲方式主要為分布式,在此過程中存儲的數據達到一定數量時,必須實施數據分片,將其中的數據分布到不同的機器中,在這種方式中,集群的獨立運行能力較強,可以不依靠服務器進行數據存儲。另外,采用數據分片的方式能夠提升自身的數據存儲能力以及系統應用性能,但是在此過程中需要注意,需要根據實際情況制定科學的應用方案,否則會出現降低系統使用性能的現象。如果數據的規模較小,則不需要數據分片處理,避免出現時間浪費的現象[2]。
3 物聯網海量異構數據共享策略
3.1 基于設計準則的數據共享策略
在該種設計準則中,所有能夠被命名的數據都可以叫作抽象資源,其中主要包括網絡中的數據信息、連接信息、計算信息以及存儲信息、物聯網中的網關以及感知網絡等,涉及的范圍較廣。為了提高資源管理的質量,需要采用層次化管理的方式,其中主要包括實體級、應用級以及系統級3方面內容,實體級指的是其中的資源都是獨立的實體資源,其中主要包括對象資源、索引資源以及知識資源等。應用級指的是一些資源的結合體,在此過程中存在多個感知對象,其中一個集合體中的資源等級也相同。系統級主要指的是物聯網系統層中的數據資源。
在這種數據共享策略中,主要包括資源層級關系和資源類型關系兩種,資源層級關系中主要包括系統級、應用級以及實體級,其中信息服務系統數據屬于系統級,各個應用系統屬于應用級,各個數據實體屬于實體級。資源類型管關系中主要包括索引資源、對象資源、知識資源等,其中索引資源將數據信息共享到對象資源中,對象資源再將數據信息分別傳輸給感知數據以及知識資源,再由知識資源生成最終的數據。除了這種數據生成方式之外,索引資源可以直接將數據信息共享到知識資源中,由知識資源直接生成數據,以上兩種方式都能夠實現數據生成。
3.2 基于物聯網標識平臺的數據共享策略
利用這種方式能對物聯網中大量的數據資源進行標識管理,首先需要發現資源和定位資源,在此過程中需要確定系統中數據存在的位置,找出該資源生命周期中存在的所有資源,從而建立一個獨立的信息服務系統。在商品生命周期生產以及物流銷售環節中可以利用這種方式。利用物聯網中的異構標識,能夠對數據進行編碼,主要組成結構為標準碼加上物品碼,標準碼主要負責編碼格式的識別。其次,協調工作流程,在此過程中,主要的工作流程包括注冊信息、映射處理以及資源檢索,其中注冊信息主要包括資源得標識信息、物品中的標準碼以及數據的描述信息等。映射處理指的是在資源收集完成之后,采用統一資源標識符(Uniform Resource Identifier, URI)的方式對數據進行映射處理,保證信息注冊的完整度。最終,資源檢索指的是利用檢索系統對系統中的資源進行檢索,保證最終數據共享的質量。由此可以看出,在制定數據共享策略的過程中,需要根據實際情況制定不同的數據共享方案,采用這種方式制定的數據共享策略具有較強的針對性以及應用價值。除此之外,還要充分考慮其中的影響因素,降低其對系統正常運行的影響[3]。
4 結語
隨著人們對物聯網的關注程度越來越局,如何提高物聯網中數據存儲以及數據共享的質量,成為有關人員關注的重點問題。本文通過研究物聯網海量異構數據存儲以及共享策略發現,對其進行研究,不僅能夠提高物聯信息存儲的質量,同時還能夠實現實時信息共享。由此可以看出,研究物聯網海量異構數據存儲以及共享策略,能夠為今后物聯網異構數據存儲以及數據共享的發展奠定基礎。
[參考文獻]
[1]趙立波,李凌霞,王旭.物聯網海量異構傳感器采樣數據存儲與查詢處理[J].軟件導刊,2017(12):182-183, 187.
[2]王順.面向農業物聯網的異構數據存儲方法研究[D].鄭州:河南農業大學,2016.
[3]何鳳成.Hestus:—種海量異構物聯網數據存儲模型及其實現[C].合肥:第29屆中國數據庫學術會議,2012.