曲小納
摘 要 隨著互聯網技術的不斷發展,“時間就是金錢”的市場規則下,如何主動獲知客戶喜好并開發其購買潛力,從中獲取一定的信息以提高電子商務企業的競爭力是一個迫在眉睫的問題。本文使用數據挖掘中的關聯分析方法,找出真正有價值的信息,來指導商業者的決策。
關鍵詞 電子商務 數據挖掘 關聯分析
中圖分類號:TP311.13 文獻標識碼:A
1 電子商務
電子商務指交易當事人或參與人利用現代信息技術和計算機網絡(主要是因特網)所進行的各類商業活動,包括貨物貿易、服務貿易和知識產權貿易。①它的飛速發展,促使經銷商和客戶之間通過互聯網進行交易,節省了大量的費用和時間。幫助企業經銷商收集了大量的數據,隨著電子商務的不斷發展,將這些大量數據轉化成有價值的信息,以達到企業增加收入,降低成本,使企業處于有利的競爭位置的目的。
2 基于關聯分析的數據挖掘
數據挖掘是從大規模的數據中抽取非平凡的、隱含的、事先未知的、有潛在使用價值的信息的技術,是屬于發現型的技術。它為解決此類各種應用問題提供了強有力的計算支持。數據挖掘所涉及的學科領域和方法很多,關聯分析是最常見的數據挖掘之一。
關聯規則就是從一種行為中發現與之相關聯的另一種行為,及A→B,并用一定的概率度加以保證。關聯分析發現的主要對象是交易型數據庫,一個交易一般有交易處理時間,一組顧客購買的物品,有時也有顧客標識號組成。由于電子商務的發展,銷售商可以方便地收集存儲大量的售貨數據。對這些歷史交易型數據進行關聯分析,則可對客戶的購買行為提供極有價值的信息。例如,可以幫助零售商(怎樣相互搭配銷售),通過關聯分析發現交易數據中常常隱含形式的規律,對于改進銷售業績等商業活動的決策是非常重要的。
3 關聯分析在電子商務中的應用
本文對關聯規則在電子商務中的應用進行討論,提出了關聯規則在電子商務中應用的步驟,得出了基于關聯規則的商品銷售模式。②電子商務中的數據不僅十分龐大、復雜,而且包含著許多有用信息。隨著數據挖掘技術的發展以及各種數據挖掘方法的應用,從電子商務數據庫中可以發現一些潛在的、有用的、有價值的信息來。通過對所積累的銷售數據的分析,可以得出各種商品的銷售信息。從而更合理地制定各種商品的定貨情況,對各種商品的庫存進行合理地控制。另外根據各種商品銷售的相關情況,可分析商品的銷售關聯性,從而可以進行商品的組合管理,以更加有利于商品銷售。
關聯規則挖掘問題就是首先確定所要挖掘規則的最小支持度與最小置信度,然后在交易數據庫D中找出具有用戶給定的最小支持度minsup和最小置信度minconf的關聯規則。③
3.1關聯規則發現算法描述
關聯規則挖掘問題可以劃分成兩個子問題:(1)發現頻繁項目集和生成關聯規則。相對于第一個子問題而言;(2)子問題相對簡單。因此,第一個子問題是近年來關聯規則算法研究的重點。
3.2數據描述及預處理
在電子商務中通過分類分析,得到客戶分類模式后,就可以針對不同類客戶的特點展開不同的商務活動,提供有針對性的個性化的信息服務;得到客戶的分類模式后,還可以對新的客戶進行分析,分析新的客戶屬于哪一個類別,從而有針對性的開展商務活動。
3.4 進一步計算置信度得出關聯規則
進一步計算置信度,如表4,中Lk為k-頻繁項目集,y為Lk的非空子集。
根據以上關聯規則,商家可以將牛奶、火腿、面包放在同一網頁上進行銷售,而果啤則應該放到另一個網頁上銷售,可以幫助管理者規劃市場,確定商品的種類,價格、質量等。
4 結束語
電子商務過程中的各種信息和數據是電子商務活動能夠更好的進行的基礎,通過選擇合適的數據挖掘技術來挖掘電子商務中有價值的信息,從而使企業在激烈的市場競爭中做出正確的決策,保持有力的競爭優勢。隨著數據挖掘技術的不斷發展,相信它在電子商務中的應用將促使其得到更快更高效的發展。
注釋
① 孫海峰.促進我國電子商務發展的思考.經濟師, 2007.
② 張愛國,數據挖掘在超級市場中的應用[J].農業網絡信息,2005(1):43-44
③ 薛薇,SPSS統計分析方法及應用[M].北京:電子工業出版社,2004.
④ 王國君,段立娟,王實,等.數據挖掘原理與算法[M],北京:清華大學出版社,2005.