苗 雷
(五大連池風景區勞動爭議仲裁院,黑龍江 五大連池 164155)
信息時代,數據成為一種寶貴資源,面對爆炸式信息增長,如何從龐大的數據流中找到有價值的數據,成為信息管理工作必須要考慮的問題。Web數據挖掘技術可以快速、精準搜集目標數據,為數據挑選、分析、利用提供技術支持。近年來,信息技術滲透到各個行業,Web數據挖掘技術也被廣泛應用于不同領域。熟練掌握該技術操作方法和應用技巧對提升信息化管理水平、挖掘數據潛在價值有積極幫助。
Web數據庫不僅提供了基礎數據存儲與分類功能,還支持交互式信息查詢。從數據使用者角度來看,利用Web數據庫可以更加精準獲取想要的數據信息,使數據利用價值得到進一步挖掘。從組成結構上來看,Web數據庫可以分為四個模塊,分別是支持數據存儲的服務器、支持數據調用的中間件、支持指令編輯與下達的Web服務器及用于數據展示的瀏覽器。使用Web數據庫技術時,用戶打開瀏覽器在人機操作界面上編輯指令(如檢索關鍵詞),系統從數據庫中進行快速匹配,將所有符合的數據按照相關性依次展示。
根據用戶需求挖掘相應的數據是數據資源化利用的基本步驟,也是決定數據利用價值高低的關鍵因素。云技術逐漸成熟,其提高了數據挖掘效率,AI技術的成熟則提高了數據挖掘精度。多種先進技術融合運用使得數據挖掘技術可以在極短時間里從海量數據中檢索到目標數據,為下一步整合、統計、分析、利用奠定了扎實基礎。數據挖掘流程包括用戶自定義數據檢索范圍或設定關鍵詞,讓系統明確檢索目標;新建數據庫,用于存放檢索、挖掘數據;執行程序,獲取數據,并將挖掘到的數據按照特定標簽進行分類;建立數學模型,進行數據分析。
隨著Web數據挖掘技術成熟及其在各行各業實踐應用,其已形成比較完善的技術體系,其中較為常用的有神經網絡法、決策樹法、遺傳算法、粗糙集法、關聯規則法等。以下為幾種主要的數據挖掘方法。
Web數據挖掘中,如果對檢索結果精確性要求不嚴格,又想在盡可能短的時間內完成檢索任務、獲取目標數據,可以使用粗糙集法。除了用于數據挖掘外,其在分析數據相關性等方面也有重要應用價值。基于粗糙集的Web數據挖掘技術優勢是算法簡單,檢索效率較高,通常不需要建立專門的檢索模型,簡化了操作流程,降低了技術難度。但是也存在明顯缺陷,如挖掘到的數據可能存在明顯的離散性,在后期進行數據分析時需要先進行處理,保證數據連續性,才能體現出數據利用價值。
模糊集算法是一種用模糊集合理論對實際問題模糊性識別、判定及決策的方法。一些數據系統相對復雜,模糊性較強,很多模糊集合理論都具有一種模糊屬性,這種模糊性可能導致結果失誤,因此數據挖掘技術實踐中,應在模糊理論及概率統計基礎上進行不確定性轉換。基于模糊集的Web數據挖掘應用優勢是可以根據用戶需要和數據特點靈活調控模糊性,獲得想要的數據,增強了數據本身可用性。該算法也存在缺陷,如需要提供較多參數,需要建立特定數學模型,編碼難度較大等。
數據挖掘與利用中,單一的數據可用價值不高,這就需要利用數據挖掘技術將數據收集起來,根據實際需求對特定數據進行分類、聚合,在資源整合基礎上,橫向或縱向尋找數據之間的關聯性,挖掘數據潛在價值。基于神經網絡算法的Web數據挖掘,其應用優勢在于擁有非線性學習能力,借助非線性預測模型更加智能化地對數據進行識別和篩選,保證所得數據的精準性,它抗干擾能力強,對防止數據信息失真也有一定作用。
數據挖掘技術已在諸多領域得到推廣,特別是在信息管理中應用效果較好,無論是在檢索目標信息、整合數據資源方面,還是在提高數據利用率、增強管理實效性方面均發揮了較為理想的應用價值。
搜索引擎需要在用戶提交檢索指令后,在盡可能短的時間內為用戶提供符合檢索要求的數據信息。使用Web數據庫數據挖掘技術在網頁建立的同時可以實現對相關信息內容的深度挖掘,通過提問方式對用戶歷史瀏覽記錄進行分析及處理,分析過程中可以對用戶提出的需求進行系統性回答。Web數據挖掘技術處理過程中可以對關鍵詞進行強化處理,不斷提高用戶信息檢索效率和引擎搜索準確度。隨著Web數據挖掘技術不斷進步,將不斷激發搜索引擎項目發展,為整個技術優化奠定良好基礎。
為用戶提供個性化、精準性服務是提高數據信息利用率的一種有效手段。基于Web數據挖掘技術可以根據用戶以往操作指令、數據檢索偏好等基本信息,在數據智能分析基礎上準確把握用戶需求,向用戶提供更加個性化的服務。如建立Web動態網頁,將數據挖掘結果在網頁上直觀呈現出來,滿足用戶個性化需求。多數情況下,用戶即使輸入關鍵詞進行檢索,最終挖掘到的匹配數據仍有幾十甚至幾百條。基于Web數據挖掘技術的個性化服務可以根據用戶操作偏好,優先展示符合用戶需求的檢索結果,為用戶進行信息管理提供更多便利。
在電子商務領域,數據不僅具有價值屬性,還通常與用戶個人隱私和企業商業機密相關,基于Web數據挖掘技術在提高數據利用價值、了解客戶真實需求、保障數據信息隱私安全等方面發揮了不可替代的作用。如電商平臺借助數據挖掘技術掌握每一名平臺用戶瀏覽信息、檢索記錄、購買訂單等,了解用戶需求,并在Web數據庫中給每個用戶建立獨立賬戶,當用戶登錄電商平臺后,系統可以根據數據分析結果為每個用戶提供個性化頁面展示,以提高銷售量和成交率。
大數據時代,信息管理工作要求已不僅僅局限于保證數據完整與安全,而是在此基礎上對數據進行整合與利用,充分挖掘數據本身價值,基于這一信息管理需求,Web數據挖掘技術得到了推廣應用。該技術能夠結合遺傳算法、模糊算法、神經網絡算法等,在數據挖掘中顯著提高檢索效率和結果精度,為信息管理提供更多便利。