張申
天津商務職業學院,天津 300221
隨著計算機信息技術的快速發展以及Internet的廣泛普及,電子商務獲得了極大的發展。經銷商通過各種商務網絡平臺或Internet與客戶進行交易,不僅大大節省了費用,而且也節省了時間和空間。雖然如此,但是電子商務因存在數據量龐大的問題而嚴重影響了其本身的發展。因此,如何在大量的數據中挖掘出有意義或價值的信息已成為當前亟需解決的重要問題之一。而數據挖掘技術是一種能夠有效的從大量數據中挖掘出具有價值信息的技術,它在電子商務中的應用能夠很好地解決這一問題。故而,對電子商務中數據挖掘技術的應用進行分析已成為當前研究的重要課題之一。
數據挖掘又被稱之為信息發掘,它是通過利用半自動化或者是自動化的方法來對數據中隱藏的具有價值或意義的信息與規則進行挖掘。同時,這也是一個從大量的、模糊的、不完全的、隨機的以及有噪聲的數據中提取有價值信息的過程。與傳統數據分析相比,數字挖掘的方式有很大的差異,且其所挖掘出來的信息具有可實用的、有效的以及先前未知的這三個特征。目前,數據挖掘的主要功能一般包括:通過利用概念描述來獲得廣義方面的知識、通過利用關聯分析來獲得關聯方面的知識、通過利用分類和聚類的方法來獲得分類方面的知識、通過利用預測方法來獲得預測類型方面的知識以及通過利用偏差檢測來獲得偏差類型方面的知識。
當前,數據挖掘技術的類型一般包括生物信息數據挖掘、數據倉庫挖掘、文本數據挖掘以及Web數據挖掘等。其中,Web數據挖掘是一門綜合性學科,它集統計學、信息學、數據挖掘以及Web技術為一體。同時,Web挖掘技術是在傳統數據挖掘技術的基礎上發展而來的,具有復雜性以及異構性等特點。一般而言,Web數據挖掘主要包括Web內容數據、用戶訪問數據以及Web結構數據這三種類型。其中,Web內容數據所采用的Web挖掘模式為Web內容挖掘模式,用戶訪問數據采用的Web挖掘模式為Web使用模式挖掘,Web結構數據采用的Web挖掘模式為Web結構挖掘模式。
目前,我國跨境電子商務主要包括兩種貿易模式,即企業對企業(business-to-business,B2B)和企業對消費者(business-to-consumer,B2C)。其中,B2B電子商務實質上仍屬于傳統貿易領域,現已納入海關的一般貿易統計中。而B2C電子商務的企業直接面對國外消費者,其銷售的商品以個人消費品為主,且一般采用快遞、郵寄以及航空小包等物流方式,目前大部分商品都沒有被納入到海關登記之中。本文以B2C電子商務為例來具體對數據挖掘技術在電子商務中的應用進行分析,其具體內容如下:
B2C電子商務是我國最早產生的電子商務模式,其產生的標志是8848網上商城的正式運營。所謂“B2C電子商務”,它主要是指企業通過利用各種商務網絡平臺(如,阿里巴巴、慧聰商務網、買麥網以及中國商品網等)或者是Internet技術直接與消費者進行信息、服務以及產品的交換,以此來達到完成商務交易的目的。一般而言,B2C電子商務所涉及的主要行業是網絡零售業,即消費者在相關商務網絡平臺上購買商品。這種模式不僅大大為企業和客戶節市了空間與時間,而且也使得交易效率大大提高。目前,中國巨蛋、卓越亞馬遜以及京東商城等是B2C電子商務模式的代表網站。
經過多年的發展,B2C電子商務模式的種類越來越多。目前,B2C電子商務模式的種類主要包括綜合商城、百貨商店、輕型品牌店、復合品牌店以及垂直商店等。其中,綜合商城和百貨商店是其最主要的兩種類型。在本質上,綜合商城屬于傳統商城。以淘寶商城為例,淘寶商城與傳統商城一樣,也具有完備的支付體系、龐大的購物群體、完善的誠信安全體系以及穩定的網絡平臺等。在實質上,淘寶并非僅僅只是出售商品,而是為消費者提供了一套較為完備的銷售配套服務。而百貨商店卻不同,其賣家僅僅只有一個,如亞馬遜。同時,百貨商店還必須根據消費者的需求而不斷豐富自己的產品線。此外,百貨商店還自備倉庫,并會將同一系列的商品庫存起來,以此來為消費者提供更快的客戶服務及物流配送。
經過多年的發展,數據挖掘技術已日趨成熟。目前,在B2C電子商務中,常用的數據挖掘技術主要包括四種,即序列分析、聚類分析、預測分析以及關聯分析。下面來對其進行具體的分析:
1.序列分析
在數據挖掘中,序列分析的作用主要在于對不同且具有先后次序的事件之間所具有的關聯性進行識別。以對消費者在不同時間段的購買行為進行分析為例,依據大量的數據研究分析顯示,在本次購買香皂的消費者中,在下次購買時會有75%的消費者選擇購買沐浴露。通過對消費者不同時間段的購買行為進行分析,能夠有效的幫助企業做出正確的營銷決策。目前,大部分目錄銷售公司都是運用序列分析的方法來對消費者的購買行為進行分析,以此來為下一次的商品目錄設計提供必要的參考依據。
2.聚類分析
在數據挖掘中,聚類分析是指以某些屬性為標準來對數據庫中的元組進行劃分,并劃分成不同的子集或者是組別。同時,在識別屬性上,每一個子集或組別的內部元組具有相似性;而不同的子集或組別的元組,則具有很大的差異性。基于此,聚類分析的作用主要在于能夠對客戶群進行細分。與預測分析相比,聚類分析在對元組進行劃分之前沒有預先設置組別,且其主要產生的是分組規則。
3.預測分析
在數據挖掘中,預測分析的設計運算是以預測分析模型為依據來實現的。在預測分析模型中,一般用因變量來表示假設的某種行為,用自變量來表示其他行為。其中,因變量隨著自變量的出現而產生,且隨著自變量的改變而改變。同時,兩者之間存在某種穩定的數量關系。基于此,就能夠通過對已知的數據進行分析來對可能發生的狀況進行預測。此外,數據挖掘中預測分析模型的構建,其主要目的是為了對客戶在營銷活動中的反應及其反應程度來進行探測。目前,邏輯回歸和決策樹是能夠進行預測分析的最主要的數據挖掘技術。
4.關聯分析
在數據挖掘中,關聯分析是其主要的功能之一,它可以在市場營銷的各個領域進行應用。其中,對消費者的購買行為進行關聯規則方面的分析是關聯分析的主要應用之一,其目的是為了對消費者購買商品時的行為模式進行探詢。通過采用關聯分析方法來對挖掘數據中的關聯性規則,能夠幫助企業采取適當的營銷方式對商品進行宣傳,從而有利于促進新產品的銷售。同時,這也有利于消費者發現新產品,從而進一步促進了新產品的宣傳與銷售。
一般而言,B2C電子商務數據挖掘的過程主要被分為三個階段,即數據準備、數據挖掘以及結果表述和解釋。其具體內容如下:
1.數據準備
在對數據進行挖掘之前,必須先對要挖掘的數據進行相關的處理,這就是數據準備階段。通常,數據準備階段被分為數據集成、數據選擇以及數據預處理這三個子步驟。其中,數據集成是在多個數據庫中合并處理所需要的數據,數據選擇是對提取的數據集合進行適合的分析,數據預處理則是對數據進行篩選、清理、變換以及過濾。這既能提高數據挖掘的質量,又能更好地克服數據挖掘工具本身所具有的局限性,從而為數據挖掘提供了必要的前提。
2.數據挖掘
數據挖掘階段的本質是進行實際的挖掘操作,它是通過根據挖掘目標來采取適當的挖掘方法的方式來獲得有意義的數據模式。目前,數據挖掘的方法主要包括知識發現、統計分析以及其他可視化方法這三類。其中,知識發現是通過數據搜尋的方法(如,人工神經網絡、規則推理以及決策樹方法等)來發現規律的,以此來得到一個有意義的數據模式。統計分析是通過采用數學模型和統計模型來對這些規律進行解釋的,其方法主要有因子分析、線性回歸、非線性分析以及有線性分析等。其他可視化方法在對多變量的圖形進行分析的同時,也會對多變量之間的關系進行顯示。這種方法不僅能有助于對之前挖掘的數據進行分析,而且還能夠提高數據挖掘的能力。
3.結果表述和解釋
結果表述和解釋是指在最終用戶決策的基礎上來分析已提取的信息,并將最有價值的信息區分離出來,且以決策支持工具的方式來將其提供給決策者。值得注意的是,這一階段的任務除了要將結果表達出來之外,還必須過濾處理相關的信息。若決策者對其提交的信息不滿意,則應重復上述的過程。
4.B2C電子商務的數據挖掘系統結構
數據挖掘能在電子商務中發揮作用,一定要把每個階段的據轉存到數據庫中,提取有效數據和電子商務的各種操作相互配合。

圖 B2C電子商務的數據挖掘系統結構
綜上所述,伴隨著電子商務的快速發展,市場競爭也日益激烈。而電子商務本身存在著數據量龐大的問題。因此,企業要在市場中獲得長久、穩健、健康的發展,就必須采取合適的數據挖掘技術來對電子商務中有價值的信息進行挖掘。由于本文篇幅有限,必然存在不足之處。故而,這還需要我們進一步對電子商務中數據挖掘技術的應用進行研究和探討。
[1]藺莉,潘浩.Web數據挖掘技術在電子商務中的應用[J].電腦知識與技術,2010,(4).
[2]戴菲.數據挖掘技術在電子商務中的應用[J].電腦知識與技術,2011,(21).
[3]邱璐.基于數據挖掘技術的Web電子商務應用與研究[J].中國電子商務,2014,(4).
[4]胡金娟.數據挖掘技術在個性化電子商務網站建設中的應用[J].漯河職業技術學院學報,2014,(5).
[5]韓英.淺談數據挖掘技術在電子商務中的應用[J].太原城市職業技術學院學報,2013,(4).
[6]王曉鵬.數據挖掘技術在電子商務管理中的應用研究[J].中國新技術新產品,2013,(18).