傳感器抓取各式各樣的數據,這些信息哪些有用?哪些是垃圾?哪些需要歸檔?哪些僅僅是需要短暫保留的中間信息?物聯網應該具備基本的分辨能力。
物聯網的第一階段是完善信息獲取途徑,通過各式各樣的傳感器抓取信息;隨之而來的,就是如何處理急速膨脹的數據。這些信息哪些有用?哪些是垃圾?哪些需要歸檔?哪些僅僅是需要短暫保留的中間信息?物聯網應該具備基本的分辨能力。
在日前舉行的“第八屆全球電子峰會”(Electronics Summit 2010)上,IBM Fellow(院士)、系統與科技事業部戰略聯盟副總裁及首席技術官Bernard S. Meyerson強調,建設物聯網,現在就應該關注如何處理紛繁復雜的數據,否則,當傳感器網絡越來越完善時,隨之而來的數據爆炸將讓企業淹沒在信息洪流中,無法自拔。
“物聯網讓物與物之間對話,但首先要研究傳感器如何與IT更好地對話?!?Meyerson認為,終端設備采集來的數據進入IT系統之前,就應該被智能地處理。IBM研發的流計算(Stream Computing)系統可以應對信息的爆增,包括網站、博客、電子郵件、視頻和新聞短片,尤其是物聯網時代傳感器收集上來的龐大信息流。
在通常情況下,數據分析的步驟是:首先搜集數據,將其存儲在數據庫程序中,然后再用模型對數據庫進行搜索。這種高度結構化的方式通常需要耗費很多時間。在流計算模式下,先進的軟件算法在數據流入的同時即對其進行分析,機器可以實時分析上百個數據流,讓用戶在短時間內對環境變化做出回應。
“可以設想一下,當智能交通深入應用時,駕駛員開車行進過程中,汽車可能會實時采集許多信息,有車速、溫度、交通流量、車輛間距等大量數據。當他來到一個路口時,其實最需要的是看到前方道路擁堵情況,可是傳感器采集來的各式各樣的數據會讓人迷惑不清,也增加了有效數據篩選的難度?!?Meyerson舉例說,這個時候的智能,就不是以數據量的多少來衡量的,而是在合適的時候告訴駕駛員該直行,還是右轉。
如今,泛在計算發展迅猛,網絡、傳感器、計算機等價格急速下降,為物聯網的建設提供了技術上的可能性。復雜的實時分析處理和大范圍的傳感器數據需要不同的處理進程相互交叉校驗,IBM云交付管理系統設計與處理的多樣性讓IT資產的利用率得到優化,比如使CPU使用率達到80%~90%。
除了基礎設施外,Meyerson認為,建設物聯網還必須著眼于“系統的系統”,就是要把各行業IT系統整合在一起,才能體現出多種多樣的可管理性。這也是處理高速膨脹的數據的另一個著眼點,即關注數據的流向。數據如何從眼前相對封閉的某個行業信息系統流轉到另一個應用系統,而且保證數據始終有效。在很多情況下,數據在產生它的系統中能發揮作用,但當進入另一個系統時,由于格式、標準、體系的差異,很可能它就變成了垃圾數據,無法發揮應有的效能。
物聯網要依賴數據,更要控制好數據!