宋佳珍,羅 帥
(1.湖南外國語職業學院信息技術學院,湖南長沙410116;2.湖南農業大學信息科學技術學院,湖南長沙410128)
隨著我國食用菌產業的發展,食用菌電子商務等現代化的信息平臺也如雨后春筍不斷涌現。如中國食用菌信息網、中國蘑菇信息網、中國食藥用菌網、易菇網、天下菇行網等都是比較知名的信息網站平臺[1]。各種食用菌信息平臺為客戶提供了食用菌業內的供求信息、行業資訊、產品報價、人才招聘等服務,人們可以足不出戶完成食用菌資訊和商情的查詢,隨時掌握最新的食用菌信息。信息平臺的建設不僅能夠加強食用菌相關各企業之間交流,還可以促進彼此之間產業的合作,實現食用菌產業與其它相關產業之間的共同發展[2]。
食用菌信息平臺的建設極大在促進了食用菌信息的交流。但隨著各種海量食用菌信息的導入,人們已經不滿足于平臺所提供的數據存儲、統計和查詢等基本功能。希望從信息平臺獲得更高層次的知識和信息,也希望信息平臺能夠從海量的食用菌信息中找到更加有用的信息,為從事食用菌栽培、生產加工、銷售的管理人員提供高層的決策支持。從傳統的信息平臺數據應用提升到數據的挖掘,以獲取更多高層次的決策信息,發揮食用菌信息平臺的數據優勢,擴展食用菌信息的應用。對食用菌信息平臺的數據挖掘就是為了給決策者提供一些隱含的、未知的有用信息,為管理層提供輔助決策信息。其主要涉及的技術有數據庫、數據倉庫、數理統計和人工通知等多學科知識。
食用菌信息平臺主要用于針對食用菌銷售進行有效管理。通過信息化管理的手段,對食用菌信息進行科學的管理,并對相關的食用菌數據進行數據挖掘。運用數據挖掘技術從海量的食用菌數據中發現有用的信息并充分利用,發現食用菌企業和信息平臺運作的基本規律,預測食用菌價格等銷售市場走勢。從宏觀上把握食用菌企業和食用菌產品未來的市場發展方向,提升食用菌企業的經濟效益。
食用菌信息平臺的設計目標具體有:食用菌的商品信息、食用菌消費客戶信息、食用菌產品訂單信息、食用菌產品銷售信息、食用菌產品退貨信息管理、營銷情況查詢等。
食用菌信息平臺主要的功能模塊結構見圖1。
如圖1所示,食用菌信息平臺的用戶類型主要有食用菌的消費客戶、平臺操作員和決策管理人員,分別負責客戶資料的管理、食用菌產品和訂單的管理、決策查詢等工作。
客戶資料管理模塊:食用菌消費者通過用戶名和密碼登錄平臺,對客戶資料庫的相關內容進行操作,主要包括食用菌客戶的結款情況、食用菌產品資料查詢、客戶信息修改(更新)、食用菌產品的訂貨信息、購貨信息和退貨信息查詢等。
操作員管理模塊:操作員管理主要涉及食用菌產品的管理(包括食用菌產品的各類信息,如食用菌名稱、產品圖片、庫存數量、上下架情況等);客戶管理模塊主要負責客戶的增加、刪除和查詢等;食用菌訂單管理主要包括新訂單的生成、刪除訂單、修改訂單信息等;食用菌銷售信息管理包括了食用菌產品銷售的信息、庫存信息和銷售數據的查詢統計等;退貨管理主要負責對退貨詳情的查看、刪除以及信息入庫等。
決策管理模塊:該模塊主要功能是讓食用菌企業的管理者能夠通過信息平臺的相關信息,對食用菌銷售信息、訂貨信息等進行實時查詢,即時掌握最新的食用菌銷售數據和訂單相關信息。通過食用菌數據挖掘模塊建立食用菌數據倉庫,對信息平臺的相關信息進行數據挖掘,對平臺的食用菌數據進行二次開發,從而發現更多有用的信息輔助決策。同時,打印報表模塊也可以完成相關統計數據的報表打印和輸出工作。
目前,各種食用菌信息平臺已經初具規模,并且隨著我國食用菌產業的發展,近年來積累的食用菌信息也隨著時間的推移呈幾何級數的增長,平臺數據量的增加也給信息的管理提出了挑戰。大量的食用菌歷史數據包含了客戶、食用菌企業、食用菌產品和食用菌銷售等全方位的業務信息。傳統的數據庫已經難以滿足海量歷史數據的統計和分析,因此,需求建立數據倉庫來更好地滿足數據分析和數據挖掘的需要。
食用菌信息平臺的數據倉庫是面向決策分析的數據存儲方式[3],其主要面對的數據來源包括客戶信息、訂單信息、銷售信息、財務信息和庫存信息。將這些分散的信息數據加以整合,統一放置在數據倉庫并進行相應的數據處理。這樣不但可以讓決策管理人員隨時查詢食用菌的各類歷史數據,而且還可以讓食用菌信息平臺的各類用戶隨時進行統計分析。如進行縱向的企業歷史數據比較,橫向的食用菌企業間業務、訂單、銷售數據的對比等。從而從多個角度為決策管理層提供最新的數據分析結果,深入挖掘大量食用菌信息背后所隱藏的重要信息。
具體的各類信息來源載體有:1)食用菌信息平臺的歷史產品、銷售、訂單等數據;2)食用菌信息平臺的Web訪問記錄和平臺留言板、論壇等與客戶互動的信息;3)食用菌企業售后服務、供貨商、銷售商等上下游企業間的通訊記錄(如客戶回訪、供貨報價、推廣營銷、購買咨詢、進出口貿易、訂貨發貨信息等);4)食用菌產業相關信息:與食用菌產業相關的政策規章制度、食用菌最新前沿科技、與食用菌產業密切相關的木屑、培養基等原材料的供給情況、食用菌國際貿易市場的變化等。
2.2.1 數據倉庫主題設計
對食用菌信息平臺來說,數據倉庫的主題是指主要的決策分類。食用菌信息平臺通過食用菌產品的展示、信息的發布等將食用菌生產、銷售等環節連接起來,為客戶和食用菌企業之間提供信息的交流和溝通的渠道,并最終促進食用菌的銷售。因此按照食用菌信息平臺的主要功能,確定食用菌數據倉庫的主題為:1)食用菌銷售商主題。體現信息平臺為食用菌產品銷售提供支持的主要目標,包括銷售商的基本信息、銷售食用菌產品的基本信息等。2)食用菌產品主題。體現食用菌產品的各種信息,如食用菌產品供貨信息、訂單信息、庫存信息、銷售信息和退貨信息等。3)食用菌客戶主題。包括了食用菌銷售對象的特征等相關信息,如客戶的基本信息、客戶訂單和退貨信息等。
2.2.2 數據倉庫模型
食用菌銷售商、食用菌產品、食用菌客戶這3個主題的相關信息都存儲在不同的數據庫中,在食用菌信息平臺設計之初,這些數據庫是相對獨立的。但在數據倉庫中,通過公共鍵建立了這些數據庫之間的關聯,以便進行數據挖掘和數據分析。但這樣還不夠,在數據挖掘時需要建立一個統一的數據模型,將3個主題的數據庫進行整合,集合成一個可用于數據挖掘的數據倉庫模型。這個數據模型創建的過程主要包括數據抽取、數據轉換和數據傳輸等3個步驟,建立的數據模型為數據立方體模型。該數據倉庫模型主要包括食用菌產品、食用菌客戶和時間這3個維度,共同組成一個多維的立方體數據模型[4]。
食用菌信息平臺的數據挖掘過程見圖2。
如圖2所示,1)利用食用菌信息平臺的數據庫(歷史數據)建立數據倉庫;設計食用菌銷售商、食用菌產品、食用菌客戶等3個數據倉庫主題;建立多維的立方體數據模型;設計食用菌產品、食用菌客戶和時間3個維度,并對每個維度進行粒度(即數據統計的粗細程度)劃分。2)數據預處理,對不規范數據進行清洗、刪除不合格數據、補充修正有缺陷的數等。3)選擇合適的數據挖掘算法,完成食用菌決策信息的數據挖掘。
食用菌信息平臺的數據挖掘主要通過Microsoft SQL Server 2005數據庫管理系統中的Business Intelligence Development Studio(BIDS)來實現[5]。利用該平臺來創建食用菌信息多維數據集,選擇合適的數據挖掘算法來完成數據分析和數據挖掘。
新建一個Analysis Services的項目,再按照操作部分新建“數據源”,見圖3。
如圖3所示,選擇食用菌信息平臺的數據庫,依次創建定義多維數據集及架構、創建食用菌數據立方體模型,然后再進行生成“數據挖掘結構”。根據食用菌銷售中3個主題數據挖掘的需要,在Analysis Services中選擇關聯規則算法來進行食用菌信息的數據挖掘。再通過Analysis Services項目的部署就能夠建立實現食用菌信息平臺的數據挖掘功能,為食用菌管理層的提供輔助決策信息。
食用菌信息平臺在長期的運營和發展中,積累了大量的食用菌產品、客戶和銷售數據。海量歷史數據中隱含著許多重要的決策信息,可以為食用菌企業的管理層者提供可靠的輔助決策信息。深入挖掘食用菌信息平臺的海量數據,可以幫助食用菌企業在激烈的市場競爭中贏得先機,提高食用菌信息和食用菌企業的管理水平。
通過采用數據倉庫和數據挖掘技術,開發設計了食用菌信息平臺,將傳統的信息管理平臺中海量的歷史數據進行整合,建立了食用菌數據倉庫。并在SQL Server的聯機分析處理工具BIDS,利用關聯規則算法實現了食用菌信息的數據挖掘。從中發現更多食用菌信息中未知的、隱藏的有用信息。充分利用了食用菌信息平臺長期運營中積累的大量數據,為食用菌企業的管理去提供了更多的輔助決策信息。也從更高層次進行了食用菌數據應用,提升了食用菌信息平臺的應用價值。