摘 要:本文通過對數(shù)據(jù)挖掘技術(shù)在電子商務(wù)領(lǐng)域的應(yīng)用現(xiàn)狀進(jìn)行調(diào)研,讓更多的人了解數(shù)據(jù)挖掘技術(shù),通過數(shù)據(jù)挖掘技術(shù)給企業(yè)帶來經(jīng)濟(jì)效益,促進(jìn)社會的發(fā)展。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù); 電子商務(wù); 載體
中圖分類號:TP311.13 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-3315(2013)02-173-001
Web數(shù)據(jù)挖掘在電子商務(wù)中的研究和應(yīng)用,已經(jīng)越來越受到人們的重視和關(guān)注,它的前景廣闊,勢頭良好。并且經(jīng)過各類電子商務(wù)網(wǎng)站的實(shí)踐以及經(jīng)驗(yàn)的證明,電子商務(wù)的優(yōu)點(diǎn)突出,它不僅價格低廉,而且交易方便,它吸引著無數(shù)的消費(fèi)者。對于電子商務(wù)網(wǎng)站來說,要了解到顧客的購買意向、吸引顧客的活動、了解顧客的購物行為心理。這些都是當(dāng)前需要研究的問題。通過數(shù)據(jù)的挖掘技術(shù)的應(yīng)用,我們就能夠從海量的數(shù)據(jù)信息當(dāng)中提取出那些相對來說比較有用的信息,來幫助商家對客戶進(jìn)行進(jìn)一步的理解,才能夠推出更多更為實(shí)惠的商業(yè)服務(wù)。并且通過數(shù)據(jù)的挖掘,瞄準(zhǔn)一個客戶群體,通過一些比較特殊的信息手段來進(jìn)行一次宣傳工作,以此來更大的對廣告的預(yù)算以及增加收入進(jìn)行減少,從而讓這一切都能夠自行完成。
一、數(shù)據(jù)挖掘流程
Web數(shù)據(jù)挖掘就是利用數(shù)據(jù)挖掘技術(shù),從網(wǎng)絡(luò)文檔和服務(wù)中發(fā)現(xiàn)和提取信息。與傳統(tǒng)數(shù)據(jù)和數(shù)據(jù)倉庫相比,Web上的信息是非結(jié)構(gòu)化或半結(jié)構(gòu)化的、動態(tài)的、并且是容易造成混淆的,所以很難直接以Web網(wǎng)頁上的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘,而必須經(jīng)過必要的數(shù)據(jù)處理。Web挖掘有以下幾個過程:
1.資源發(fā)現(xiàn)。任務(wù)是從目標(biāo)Web文檔中得到數(shù)據(jù),值得注意的是有時信息資源不僅限于在線Web文檔,還包括電子郵件、電子文檔、新聞組,或者網(wǎng)站的日志數(shù)據(jù),甚至是通過Web形成的交易數(shù)據(jù)庫中的數(shù)據(jù)。
2.信息選擇和預(yù)處理。任務(wù)是從取得的Web資源中剔除無用信息和將信息進(jìn)行必要的整理。例如從Web文檔中自動去除廣告連接、去除多余格式標(biāo)記、自動識別段落或者字段并將數(shù)據(jù)組織成規(guī)整的邏輯形式甚至是關(guān)系表。
3.模式發(fā)現(xiàn)。自動進(jìn)行模式發(fā)現(xiàn)。可以在同一個站點(diǎn)內(nèi)部或在多個站點(diǎn)之間進(jìn)行。
4.模式分析。驗(yàn)證、解釋上一步驟產(chǎn)生的模式。可以是機(jī)器自動完成,也可以是與分析人員進(jìn)行交互來完成。
二、Web挖掘的特點(diǎn)
Web是一個巨大、分布廣泛、全球性的信息服務(wù)中心,涉及經(jīng)濟(jì)、文化、教育、新聞、廣告、消費(fèi)、娛樂、金融、保險、銷售、電子商務(wù)等信息,內(nèi)容極其豐富,數(shù)據(jù)最大特點(diǎn)就是半結(jié)構(gòu)化;而傳統(tǒng)的數(shù)據(jù)庫中的數(shù)據(jù)結(jié)構(gòu)性很強(qiáng),即其中的數(shù)據(jù)為完全結(jié)構(gòu)化的數(shù)據(jù)。顯然,面向Web的數(shù)據(jù)挖掘比面向單個數(shù)據(jù)倉庫的數(shù)據(jù)挖掘要復(fù)雜得多,會面臨很多具體問題,主要有:
1.半結(jié)構(gòu)化數(shù)據(jù)。Web頁面以某種格式呈現(xiàn)的半結(jié)構(gòu)化數(shù)據(jù),其數(shù)據(jù)結(jié)構(gòu)不規(guī)則或不完整,復(fù)雜程度遠(yuǎn)遠(yuǎn)高于普通的文本文檔,其數(shù)據(jù)結(jié)構(gòu)隱含、模式信息量大、模式變化快。大量的文檔無任何排列次序,無分類索引。
2.Web是一個異質(zhì)、分布、動態(tài)的信息源。Web及其數(shù)據(jù)的更新、增長速度極快,也無固定的模式。Web上的信息幾乎都是隱藏的、潛在的、未知的,從Web上發(fā)現(xiàn)這些未知的信息和有用的模式,僅用傳統(tǒng)的基于關(guān)鍵字的檢索方式很難實(shí)現(xiàn),現(xiàn)在的搜索引擎尚不具備這些功能。
3.面對一個非常廣泛的形形色色的用戶群體。不同的用戶訪問Web的興趣、愛好和使用目的千差萬別,面對一個非常廣泛的形形色色的用戶群體,能否使用戶根據(jù)自己的愛好興趣定制網(wǎng)頁,甚至能否根據(jù)發(fā)現(xiàn)的用戶,自動為用戶定制網(wǎng)頁,從而提供個性化的信息檢索和查詢服務(wù)。
三、數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用
目前對于Web挖掘的對象和使用的方法層出不窮,但隨著電子商務(wù)網(wǎng)站的興起,電子商務(wù)將是未來Web挖掘的主要發(fā)展方向之一,因此它在各種商業(yè)領(lǐng)域都存在廣泛的使用價值。當(dāng)電子商務(wù)在企業(yè)中得到應(yīng)用時,企業(yè)信息系統(tǒng)將產(chǎn)生大量數(shù)據(jù),這些海量數(shù)據(jù)使數(shù)據(jù)挖掘有了豐富的數(shù)據(jù)基礎(chǔ),同時高性能計(jì)算機(jī)和高傳輸速率網(wǎng)絡(luò)的使用,也給數(shù)據(jù)挖掘技術(shù)提供了堅(jiān)實(shí)的保障。介紹以下幾個方面的應(yīng)用。
1.優(yōu)化企業(yè)資源
節(jié)約成本是企業(yè)盈利的關(guān)鍵。基于數(shù)據(jù)挖掘技術(shù),實(shí)時、全面、準(zhǔn)確地掌握企業(yè)資源信息,通過發(fā)現(xiàn)企業(yè)資源消耗的關(guān)鍵點(diǎn)和主要活動的投入產(chǎn)出比例,從而為企業(yè)資源優(yōu)化配置提供決策依據(jù)。通過對Web數(shù)據(jù)挖掘,快速提取商業(yè)信息,極大地提高企業(yè)對市場變化的響應(yīng)能力和創(chuàng)新能力,使企業(yè)最大限度地利用人力資源、物質(zhì)資源和信息資源,合理協(xié)調(diào)企業(yè)內(nèi)外部資源的關(guān)系,產(chǎn)生最佳的經(jīng)濟(jì)效益。促進(jìn)企業(yè)發(fā)展的科學(xué)化、信息化和智能化。
2.管理客戶數(shù)據(jù)
利用數(shù)據(jù)挖掘可以有效地獲得客戶。通過數(shù)據(jù)挖掘可以發(fā)現(xiàn)購買某種商品的消費(fèi)者是男性還是女性,學(xué)歷、收入如何,有什么愛好,是什么職業(yè)等等。甚至可以發(fā)現(xiàn)不同的人在購買該種商品的相關(guān)商品后多長時間有可能購買該種商品,以及什么樣的人會購買什么型號的該種商品等等。在采用了數(shù)據(jù)挖掘后,針對目標(biāo)客戶發(fā)送的廣告的有效性和回應(yīng)率將得到大幅度的提高,推銷的成本將大大降低。
3.評估商業(yè)信用
由于網(wǎng)上詐騙現(xiàn)象層出不窮,利用數(shù)據(jù)挖掘技術(shù)對企業(yè)經(jīng)營進(jìn)行跟蹤,開展企業(yè)的資產(chǎn)評估、利潤收益分析和發(fā)展?jié)摿︻A(yù)測,構(gòu)建完善的安全保障體系,強(qiáng)化網(wǎng)上交易和在線支付的安全管理。基于數(shù)據(jù)挖掘的信用評估模型,對交易歷史數(shù)據(jù)進(jìn)行挖掘,發(fā)現(xiàn)客戶的交易數(shù)據(jù)特征,建立客戶信譽(yù)度級別,有效地防范和化解信用風(fēng)險,提高企業(yè)信用甄別與風(fēng)險管理的水平和能力。
4.確定異常事件
在許多商業(yè)領(lǐng)域中,異常事件具有顯著的商業(yè)價值,如客戶流失、銀行的信用卡欺詐、電信中移動話費(fèi)拖欠等。通過數(shù)據(jù)挖掘中的奇異點(diǎn)分析可以迅速準(zhǔn)確地甄別這些異常事件,為企業(yè)采取決策提供依據(jù),減少企業(yè)不必要的損失。
可以看出,數(shù)據(jù)挖掘的研究和應(yīng)用受到了學(xué)術(shù)界和實(shí)業(yè)界越來越多的重視。我們希望數(shù)據(jù)挖掘能夠引起國內(nèi)實(shí)業(yè)界更多的重視,同時也希望能夠有更多的國內(nèi)軟件廠商進(jìn)入該領(lǐng)域,一起促進(jìn)數(shù)據(jù)挖掘技術(shù)在中國的應(yīng)用。