江蘇經貿職業技術學院 阮衛華
近幾年,物聯網的概念已經深入到人們生活的很多方面,世界上很多國家已經將物聯網作為各國戰略性產業振興的一部分。物聯網(The Internet of Things,IOT)概念最早出現于20世紀90年代末的麻省理工學院,其定義是把所有物品通過射頻識別、紅外感應器、全球定位系統、激光掃描器等信息傳感設備與互聯網連接起來,進行信息交換和通訊,實現智能化識別、定位、跟蹤、監控和管理。物聯網最為核心的技術是無線身份識別(RFID)技術,通俗地講,也可以簡單地把物聯網認為就是物物相連的互聯網。
工業和信息化部于2012年2月14日發布的《“十二五”物聯網發展規劃》中提出,2015年我國要在物聯網核心技術研發與產業化、關鍵標準研究與制定、產業鏈條建立與完善、重大應用示范與推廣等方面取得顯著成效,初步形成創新驅動、應用牽引、協同發展、安全可控的物聯網發展格局。毫無疑問,如果“物聯網”時代來臨,人們的日常生活將發生翻天覆地的變化。
數據挖掘技術(Data Mining)也叫做知識發現,所謂數據挖掘就是從大量數據中發現對人們有價值的概念、模式和規律等,它是一個揭示出隱含的、先前未知的并有潛在價值的信息的過程。它是一門交叉科學,主要涉及數據庫技術、人工智能、機器學習、統計學、信息檢索和模式識別等領域,有十分廣闊的應用前景。隨著物聯網的發展,數據挖掘技術也必然會在物聯網得到廣泛運用。
作為一個完整的數據挖掘過程,其是個很龐大的系統,主要結構如圖1所示,主要分為以下幾個部分:
(1)確定業務對象。在進行數據挖掘之前,最重要的一步就是要明確業務問題并且弄清數據挖掘的目的,然后再找數據的來源。數據挖掘的來源很多,只要具備大量數據的來源都可以進行挖掘,雖然最后的結構是不可預測的,但要探索的問題必須是可以預見的,否則進行數據挖掘時是不會成功的。
(2)數據預處理。由于數據的來源很多,其中包含很多的數據信息,在確定了數據來源后,必須首先對數據信息進行數據預處理。數據預處理一般包括數據清理、數據集成、數據變換和數據規約四個處理過程。
(3)數據的轉換。將數據轉換成一個分析模型,這個分析模型是針對挖掘算法建立的,建立一個真正適合挖掘算法的分析模型是數據挖掘成功的關鍵。
(4)數據挖掘過程。對所得到的經過轉換的數據進行挖掘,除了完善從選擇合適的挖掘算法外,其余一切工作都能自動地完成。
(5)模式評估。解釋并評估結果,其使用的分析方法一般應作數據挖掘操作而定,通常會用到可視化技術。根據某種興趣度量,識別表示知識的真正有趣的模式。
(6)知識的同化。使用可視化和知識表示技術,向用戶提供挖掘的知識。
(7)用戶界面。最后需要將數據挖掘的結果展示給用戶,提供給用戶適當的操作界面進行操作,以得到相關的結果。

物聯網作為一門新興技術,發展還處于初級階段,在技術、市場、客戶等多個方面還面臨著諸多問題。在我國宏觀經濟調控政策的指導下,經濟快速增長的推動下,一旦物聯網大規模普及,小巧而又智能的傳感器加裝到無數的物品上,用于動物、植物、機器等物品的傳感器與電子標簽及配套接口裝置數量將大大超乎于尋常想象。因此,隨著物聯網在人們生活中各個方面的廣泛應用,已經為數據挖掘技術的運用奠定了基礎,主要有以下幾個方面。
對于是否是現代物流企業,最重要的衡量標準之一就是企業信息化程度的高低,因此對于現代物流企業來說,大力發展物流信息化,是現代物流企業的主要發展趨勢。以物聯網技術為依托,以企業的供應鏈作為基礎,構建企業的信息服務平臺,這將是第三方物流企業信息化的一個發展方向。在信息平臺建設中引入物聯網技術,借助物聯網技術的優勢,可以有效改善企業物流作業的配送業務和車輛運輸等系統的效率和準確性。
隨著近幾年企業對物流信息化的重視,投入了一定的資金進行物流基礎設施的購買和更新,為物聯網的應用提供了硬件方面的支持,同時,企業根據其自身的特點選擇相應的物流技術構建了企業的信息服務平臺。但在市場競爭中,物流企業必然會和不同的行業打交道,比如海關等,而不是一個單獨的個體,因此,建立一個物流公共信息平臺是必然的趨勢。同時,公共信息平臺的構建也為企業使用物聯網奠定了一定的基礎。
海量的數據積累是數據挖掘技術實施的一個重要的前提條件。不容置疑,物聯網已經處于數據爆炸階段,數據量已開始呈幾何級數增長,每天都會產生大量的數據。特別是超大規模數據庫在物聯網的使用,使數據被自動加速積累。對于如此巨大的數據,由于人們的能力有限,無法分析處理所有的數據,因此陷入了數據豐富、信息貧乏的局面。為了不讓數據被浪費,要從海量數據中找出對人們有價值的信息知識,只能依靠數據挖掘技術,通過專業機構的數據質量評價體系來實現。
由于物聯網的運用十分廣泛,不僅僅運用在物流管理方面,也被廣泛運用到了政府工作、智能交通、環境保護、公共安全、消防、工業測試、老人護理、個人以及個人健康等多個領域。國際電信聯盟于2005年的一份報告曾這樣描述“物聯網”時代的圖景:當司機出現操作失誤時汽車會自動語音報警;當主人出門時公文包會提醒主人需帶哪些物品;衣服會“告訴”洗衣機因衣服材質和顏色不同選擇什么樣的水溫和清洗方式等等。物聯網把新一代IT技術運用到各行各業中,使得各行各業操作更智能化與人性化。
不管是物聯網的運用,還是數據挖掘技術的運用,都離不開計算機技術的發展。日新月異的計算機硬件發展可以說始終是超越人類的應用需求,超越人類的需求欲望。在硬件方面已經生產出來強大的多處理器計算機,具有更快和更大的計算能力和并行體系結構,在軟件方面已經出現了超大規模數據庫,例如商業數據倉庫和計算機自動收集的數據記錄,為物聯網的運用以及數據挖掘技術的運用奠定了基礎。
目前,物流人才的缺少嚴重地限制了物流在我國的發展。我國現有的物流人才已經遠遠滿足不了未來物流業發展的需求。對此,國內物流企業要以自身為基礎,按現代物流的內在要求來加強企業員工的素質并強化其的服務能力,同時重視人才的引進,大力培養符合企業的高素質人才。
近幾年,我國一些高校也注意到這些問題,已經開始陸續設立物流專業,可是這樣的高校還十分少,但隨著物聯網的發展,相關的人才也比以前有了大量的增加,必將推動物流產業和物聯網的發展。
數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。從物聯網在企業中的廣泛運用可以看出,數據挖掘技術用于物聯網的條件已經基本具備,可以在以下幾個方面運用數據挖掘技術。
物聯網作為新興技術,其應用正在極大地改變著人們的生活,其在產品質量監督和管理方面的運用正日益受到人們的關注。目前我國的質量監管系統還不完善,層出不窮的奶粉作假、食品添加劑事件、工程不達標和藥品不合格,若由政府質檢部門直接干預,在物聯網技術的基礎上建立了追溯系統。隨著質量監管系統的使用,會產生大量的相關數據,通過數據挖掘技術可以從中找到影響質量的環節,幫助政府質檢部門改進內部質量管理。
對于物流企業來說,物聯網的普及及運用,為企業進一步降低成本帶來了新的機遇。物聯網的使用,使物流企業借助RFID和互聯網等無線數據通信技術,實現了每個商品的識別和跟蹤。所有的數據存放到數據庫中,可以通過數據挖掘技術發掘物流各個環節的潛在信息,比如運輸、倉儲和管理等環節,為企業管理者的管理提供必要的參考信息,能夠大大減少企業的物流成本,提高服務效率。同時,幫助企業發現每個部門的人員配置是否合理,以及車輛安排是否合理等問題,從而幫助企業管理者做出人員變動和車輛安排等一系列原本繁瑣冗余的決定。
成本的消耗是企業十分關注的一個問題,所謂成本是指產品的空間移動或時間占有中所耗費的各種人力勞動和物化勞動的貨幣表現,它的產生十分復雜,涉及企業運作的各個環節,因此,企業想要減少成本的支出是個十分復雜的過程。通過數據挖掘技術可以為企業合理分配資源提供信息,從而幫助企業減少成本的支出,降低總成本,為企業帶來更大收益。通過數據挖掘技術的關聯挖掘可以發現客戶和企業之間一些內在關聯,從而改進企業的一些環節,更主動、更好地為客戶提供相關服務。
對于企業來說,客戶對企業服務的滿意度十分重要,它可以從兩個方面來改善:主動服務和被動服務。主動服務主要是指信息服務的智能化,主動提供客戶需要的一些信息服務。被動服務主要是是指通過分析客戶需求信息,使用數據挖掘技術發掘客戶潛在需要的信息服務。兩者是相輔相成、相互依賴的關系。主動服務能夠為被動服務提供相關的數據,以便進行進一步的數據挖掘使用,而被動服務能夠為主動服務提供信息參考,以便企業增加新的服務項目。
隨著物聯網的廣泛應用,必然帶來海量的數據信息,如何查找出有用的信息是一個亟待解決的問題,而數據挖掘技術就是從海量數據中發現具備一定規律性并又難為人們通過簡單判斷而得到的知識。因此,如何更好地利用這些海量的數據信息,將是物聯網應用后的一個重要問題,而數據挖掘技術正是解決這個問題的一個很好的方法,將來一定會被廣泛運用到物聯網中。
[1] 魏光興,盧曉霞.基于物聯網的物流業發展對策研究[J].江蘇商論,2011(04).
[2] 董云鵬.數據挖掘技術在圖書館中的應用[J].現代情報,2006(11).