熊君麗 曾珍珍 李鴻賓
(廣東科學技術職業學院計算機工程技術學院 廣東省珠海市 519090)
各類信息的產生和收集推動了信息時代的來臨,現代化社會背景之下要求企業能夠對各類信息進行深層次和實時分析,雖然當前一些系統能夠實現信息的檢索和存儲,不過用戶對信息分析和使用操作較為困難,基于這一情況,對于電子商務中數據發掘技術的研究便十分必要。
電子商務的本質,是企業在實際運轉期間運用數字化的手段交換獲取商務決策所需的網絡數據,或者依托于網絡數據提供一些業務活動組織策略的參考數據。現下我國已經廣泛推廣的網上訂購、網上廣告、網上支付結算等手段都可以歸結為電子商務形式。電子商務不僅包括安全可靠、方便快捷特點,還具有打破時間和空間限制,以及成本低廉等優點。其服務范圍包括商業之間的B2B,商業與消費者之間的B2C,以及商業與政府之間的B2G 三個范圍。
數據挖掘的本質,是從龐大的數據存儲倉庫之中挖掘一些能夠用于企業管理決策和運營決策制定的數據。我們如果從商業角度分析,可以將數據挖掘技術定義成一種產生于當前大數據時代的全新技術手段,可以實現業務數據分析、抽取和轉換,并且在進行處理中能夠將商業決策所需的關鍵性數據提取出來。數據挖掘一大亮點在于可以實現對預測模型的構建,這種模型并非傳統的回顧型模型。數據挖掘技術所擁有的強大功能能夠幫助企業在決策時獲取更多直觀的數據信息,進而在激烈的市場競爭大環境中占據更加優勢的地位。數據挖掘技術在一些層面明顯區別于傳統數據分析手段,比如在對信息進行挖掘之前并不需要進行一些明確的假設。這也決定數據挖掘出來的信息本身具有一定的未知性特點。如圖1 所示。
應用數據挖掘技術所挖掘出來的信息,有很多能夠為電子營銷活動的開展提供一些可以進行參考的有價值數據,數據挖掘技術在實際應用到電子商務領域之中能夠發揮出來的作用可以概括為以下幾點:
(1)通過對客戶活動規律方面的信息進行挖掘,能夠為電子商務憑條提供一些用于制定個性化服務內容的參考數據;
(2)將一些電子商務網站歷史瀏覽客戶和客戶瀏覽的規律挖掘出來;
(3)通過挖掘到的參考數據,電子商務網站研究人員可以有針對性的優化網站之中的信息;
(4)在對電子商務訪問人員信息進行挖掘之后,能夠使商家更加深入地了解客戶群體的具體需求。

圖1:數據挖掘過程

圖2:Web 電子商務推薦系統結構示意圖
在進行數據準備的階段需要進行的步驟分別是選取數據和對于數據預處理兩個環節。第一個步驟的目的在于確定任務操作的主要對象,也就是確定目標數據,此環節需要結合用戶們的實際需求抽取原始數據庫中一些數據進行使用;第二個步驟之中主要需要進行的內容包括消除噪聲,計算和推導數據庫中的缺值,以及消除掉那些重復的記錄。
該階段進行的第一步是要準確確定待挖掘的目標和知識類型,確定完成之后還要根據想要挖掘知識的類型選擇出合理地挖掘計算方法。最后嚴格按照之前所選出來的計算方法抽取數據庫中所需要的知識。
評估完數據挖掘階段獲取到的知識之后,不可避免還會有一些冗余和無關的知識內容存在。這時就要對這些無用的知識予以剔除。而且對于那些不能達到用戶們需求的知識也要重新進行挖掘。另外,因為數據挖掘最后需要提供給客戶,所以就要對挖掘出來的知識作出解釋,應用可視化等便于用戶理解的方式提供給用戶。
我們可以認為,上述數據挖掘整個過程在很多環節都會進行重復的操作,這也能夠促使挖掘出來的知識變得更加地精益求精,最終使剩余的知識能夠滿足用戶們的使用需求。
Web 電子商務推薦系統結構示意圖如圖2 所示。數據挖掘技術研究的本身是以人工智能技術為開發基礎。所以來的也是在人工智能技術中發展非常成熟的技術種類。在完成數據的分析處理之后所使用技術的數量和獲取信息準確度成正比例關系。在電子商務領域能夠應用到數據挖掘技術的層面主要包括:
(1)聚類分析。聚類分析的功能在于可以查找電子商務領域之中相關的Web 信息,并且能夠把那些特性相對接近的客戶歸類到一起。隨后按照各個客戶群的表現為企業制定和開發市場策略提供參考性的數據。Web 可以結合客戶群的需求為他們提供針對性的服務。
(2)關聯規則。通過關聯規則進行挖掘能夠將數據庫中各個信息集合之間的關聯找出來,應用這些關聯關系能夠輔助商務決策者制定出準確的決策。
(3)分類規則。分類主要是將一個類別的概念描述找出來,其主要代表著某一個類型所有數據信息,常常使用決策樹模式和規則的模式進行表示。分類的目的主要是向預先定義好的類別分配新的記錄。
(4)時間序列模式的發現。以時間順序為標準查看時間數據庫的時候,能夠在數據庫中找出一些時序較為相似的事件,按照著時間的蓄力,能夠搜索出大概率重復發生的模式,如此可以為客戶提供具有針對性和個性化特點的服務。
(5)偏差分析。分析在數據之中表現出來的異常現象和極端的現象,這個分析對象主要是一些缺乏規律性的數據,和一些與期望值偏離的反常數據。該方法所分析的內容主要是客戶在數據庫中出現的異常行為。由此不僅能為企業決策提供參考,還能應用到網絡安全性檢測的領域。
電子商務之中各個渠道都可能出現一些有用的商業信息,應用數據挖掘技術處理完這些數據信息之后,能夠從其中得出一個有利于制定針對某個特定消費客戶群,或者針對某一個特定客戶的定向營銷決策,通過這樣能夠保證電子商務營銷機制制定的準確性。以數據挖掘技術為基礎制定出來的電子商務營銷策略能夠發出一些與消費群體之前消費行為有所關聯的數據和信息類推銷材料。數據挖掘技術在我國電子商務營銷領域的應用,為市場競爭起到了一定的啟發性作用。我們常常可以看到一些廠商在街道上為潛在客戶群發放一些宣傳經營商品的廣告。這種不分對象發放廣告的行為常常會得到人們隨手將宣傳單丟棄的結果,一些真正對商品有需要的人卻很可能不能得到。
企業在挖掘商品銷售情況和用戶訪問記錄之后,可以整理出客戶日常訪問的規律,通過這樣能夠幫助企業制定一些針對特定產品的營銷方案。比如使用數據挖掘技術,可以對各種不同類型產品所采用的優惠策略進行仿真。之后再應用數據挖掘模型來模擬計費和出賬的過程,進而便能使優惠策略實施之后存在的問題直觀顯現出來。及時調整這些暴露出來的問題有助于提升促銷活動所帶來的經濟收益。
通過對客戶反饋情況和行為記錄進行挖掘,能夠為設計者改進網站提供參考。站點的內容質量和結構的合理性直接影響著站點對客戶的吸引力。在對站點上頁面內容進行安排和連接期間需要將那些具有一定信任度和支持度的商品擺放在一起,這樣往往能夠取得更好的銷售效果。
分析和統計電子商務網站中的各種數據能夠為系統性能的改進提供參考,同時有利于提升系統本身的安全性,并且能為決策者提供幫助。Web 服務質量和實際性能是一個影響客戶滿意度的重要參數。應用數據挖掘技術能夠找出客戶擁塞的記錄,并且能夠發現站點建設期間性能方面存在的瓶頸,站點管理人員根據這些獲取到的數據能夠對于網站內數據分布的策略和網絡傳輸手段進行優化和改進。另外,應用數據挖掘技術還能實現對網絡中非法行為的分析,準確定位系統之中存在的弱點和不足,并且為提升站點安全性和可靠性提供參考性的改進策略,最終充分保障電子商務開展過程的穩定性和健康性。
發展電子商務在一定程度上能夠推動社會信用水平的建設,通過對企業歷史數據記錄的差別進行統計可以將實際運營期間結果與期望值偏離的實例挖掘出來。這樣的結果對于降低企業運營和投資期間風險有著極大的幫助。另外,應用數據挖掘技術還能實現對企業日常經營情況的跟蹤,對于企業利潤收益進行分析,并且評估企業資產情況,能夠推動企業安全保障體系完善性的提升。另外,采取網上全程監控的方式能夠促進網上交易和在線支付安全管理水平的強化,對于數據挖掘所構建起來的信用評估模型加以利用,可以將交易歷史數據挖掘出來,進而找出客戶歷史交易數據呈現的特征,并且為客戶信譽度建立起級別,最終提升企業對于信用風險的甄別能力,以及對于信用風險管理的水平。
電子商務飛速發展的當下,電子商務領域的數據挖掘技術必然被廣泛應用。該技術的應用可以把數據成功轉化成知識,數據挖掘技術屬于數據管理和信息處理領域一個全新的技術手段,而且在近些年來得到了較高的關注度,并且有關人員對該技術的研究力度較大。在數據挖掘技術應用期間能夠實現對數據問題潛在關聯的探索和收集,將一些容易被忽略掉的因素發現出來。因此,對于解決當前時代背景下飛速產生的數據和貧乏信息量之間的矛盾有著良好的效果。通過數據挖掘能夠對客戶消費趨勢有所預測,并且能夠幫助決策人員對市場走向加以判斷,指導商家對銷售額進行提升,并且采取有力手段改善和企業客戶之間的關系,促進企業網站運行的效率,幫助網站管理人員對系統性能加以改進,最終保證企業在當前市場競爭大環境下具有更為健康和光明的前景。