濮力
【摘 要】電子商務是伴隨著計算機技術發(fā)展起來的新興事物,而推薦系統(tǒng)的任務則是解決信息過載問題。針對當前的協(xié)同過濾算法所存在的缺陷,引入了網(wǎng)絡思想,解決了推薦系統(tǒng)現(xiàn)有的問題,可以在網(wǎng)絡數(shù)據(jù)的基礎上實現(xiàn)對用戶的個性化服務,有利于電子商務的進一步發(fā)展。為此,本文就基于網(wǎng)絡數(shù)據(jù)挖掘的個性化電子商務推薦系統(tǒng)進行了淺要探討。
【關鍵詞】網(wǎng)絡數(shù)據(jù)挖掘;個性化電子商務;推薦系統(tǒng)
【中圖分類號】C37【文獻標識碼】A【文章編號】1672-5158(2013)07-0109-01
引言
在信息化全方位發(fā)展的今天,電子商務之所以能在世界范圍內迅速發(fā)展,其優(yōu)勢在于方便、快捷、成本低、受限少。然而,電子商務也同樣存在一些必須解決的問題,就是用戶和商家之間的互選問題,即用戶對所需產品的挑選和商家對用戶所需的了解。通過網(wǎng)絡數(shù)據(jù)挖掘與電子商務的恰當結合,就可以很好的解決這一問題,對電子商務的發(fā)展起到了很大的幫助。
1 網(wǎng)絡數(shù)據(jù)挖掘
1.1 網(wǎng)絡概述
在社會生活中存在著關乎人們工作和生活的各種各樣的系統(tǒng),通過對其本質進行分析,可以得到一個抽象的包含眾多節(jié)點和連接節(jié)點的邊的網(wǎng)絡。網(wǎng)絡是復雜系統(tǒng)的研究工具,為復雜系統(tǒng)的研究提供了新的模式和思想方法。
1.2 網(wǎng)絡數(shù)據(jù)挖掘推薦算法
1.2.1 基于二部分圖網(wǎng)絡結構的推薦算法
因為系統(tǒng)的主體都是用節(jié)點來表示的,但是網(wǎng)絡中的節(jié)點可以是一個類型,也可以不是一個類型。節(jié)點的連接關系用矩陣表示,這類節(jié)點屬于單模式網(wǎng)絡;節(jié)點不是一種的類型,不同類型的節(jié)點之間才能連接的網(wǎng)絡稱為二部分網(wǎng)絡。
運用二部分圖結構的算法,把推薦的系統(tǒng)中項目節(jié)點看作是具備一定的,能夠分配出去的資源,同時可以把資源分配給其他看好的商品項目。
1.2.2 基于用戶關聯(lián)網(wǎng)絡的推薦算法
之所以可以將網(wǎng)絡思想引入推薦算法,是因為電子商務系統(tǒng)中的用戶與商品及用戶與用于之間具有關聯(lián)性,這種基于網(wǎng)絡的商務系統(tǒng)具有非常強大的適應性。主要思想就是:首先,建立用戶選擇的商品與評價信息之間的關聯(lián)圖,以權值計量。然后,在已形成的關聯(lián)圖中,按某商品的全部使用記錄,把該商品推薦給其它相關權值較大的用戶。
2 個性化電子商務推薦系統(tǒng)
2.1 個性化電子商務推薦系統(tǒng)的內容
電子商務是指有商務能力的實體,通過現(xiàn)代的電子技術來進行商務活動的過程。特別是現(xiàn)階段,電子商務所表現(xiàn)出的優(yōu)勢越來越明顯。現(xiàn)有的個性化推薦系統(tǒng)在主動為用戶提供所需的信息或服務的基礎上,更能同時滿足為企業(yè)謀利益的要求,能為企業(yè)大力發(fā)展?jié)撛谟脩簦簿褪强梢酝ㄟ^個性化推薦系統(tǒng)實現(xiàn)雙向推薦。
2.2 推薦系統(tǒng)的主要研究內容
2.2.1 信息的獲取以及模型建立
隨著因特網(wǎng)在全球的迅速發(fā)展,在準確獲取用戶信息的基礎上,包括用戶瀏覽行為等內容在內的交互式用戶信息獲取方式成為發(fā)展的趨勢,這就要求在獲取用戶信息時,要對信息提前進行分類。
模型建立和更新的數(shù)據(jù)來源于不同途徑得到的用戶信息數(shù)據(jù),并與其數(shù)量和質量密切相關,通過數(shù)據(jù)清理和轉換篩選出適用于建模的數(shù)據(jù)?,F(xiàn)階段常見的建模技術有:關聯(lián)規(guī)則挖掘、基于內容的過濾、聚類算法等。
2.2.2 推薦算法設計的有關研究
推薦算法有實時、準確、高效的特點,現(xiàn)在使用的主要算法都具有不同的適用領域,由于電子商務系統(tǒng)的使用率日漸增多,用戶數(shù)據(jù)庫的內容也越來越多,因此必須要在保證算法準確性的基礎上,同時對其實時性進一步研究。盡管新的設計正在不斷被推出,但都有一定的片面性,所以,想要得到較理想的推薦算法還需要進一步的研究。
2.2.3 評價推薦系統(tǒng)存在的問題
由于推薦系統(tǒng)的應用領域較多,并且不同的推薦系統(tǒng)的評價目的各異,另外,現(xiàn)在的評價指標大多只注重評價系統(tǒng)的單一特征,想對目前的推薦系統(tǒng)進行客觀的評價還是比較困難的?,F(xiàn)在常用的六種準確度評價指標有:預測準確度、排序準確度、半衰期效用指標、距離標準化指標、預測打分關聯(lián)、分類準確度。
2.2.4 一些應用方面的問題
研究推薦系統(tǒng)的目的就是使其能夠在不同的領域中取得應用,雖然推薦系統(tǒng)已經取得很好的應用效果,但其發(fā)展空間還是非常巨大的,如發(fā)展企業(yè)需要的潛力用戶、拓寬推薦系統(tǒng)應用領域等。
3 數(shù)據(jù)挖掘與個性化推薦系統(tǒng)
電子商務系統(tǒng)中的信息量非常巨大,并且保持與日俱增的趨勢,數(shù)據(jù)挖掘技術可以讓這些蘊含著非常有用的規(guī)則和模式的數(shù)據(jù)得到很好的運用,從而更好的提供個性化服務。
3.1 聚類分析技術
聚類就是把數(shù)據(jù)在無指導的情況下通過非預先設定方式進行分組劃分,這些數(shù)據(jù)之所以具有潛在性是因為它們都是在劃分過程中自動生成的。利用這種技術得到的數(shù)據(jù)更有關注意義,更適合于分析使用。在個性化推薦系統(tǒng)中,通過聚類技術將客戶按照不同的特征劃分成不同的部分,這就使得搜索工作的效率大大提高。
3.2 關聯(lián)規(guī)則技術
關聯(lián)規(guī)則就是在數(shù)量龐大的數(shù)據(jù)中找出項集中的有用規(guī)則,以其高效的性能和伸縮性而成為是一個很熱門的數(shù)據(jù)挖掘技術。但關聯(lián)規(guī)則也有它的不足之處,就是參數(shù)閾值設置時會影響規(guī)模的效率。
關聯(lián)規(guī)則中有兩個很重要的概念,即置信度和支持度。以商品銷售為例,關聯(lián)規(guī)則生成步驟如下:第一步,從所有銷售產品中找到全部的繁項集,這也是關聯(lián)規(guī)則挖掘的核心和熱點所在。第二步,生成關聯(lián)規(guī)則,在頻繁項目集中找到同時符合最小置信度和最小支持度的關聯(lián)規(guī)則。
3.3 協(xié)同過濾技術
協(xié)同過濾是現(xiàn)階段使用頻率最多、效果最好、最受歡迎的一項技術。該技術主要是針對用戶,通過搜索目標用戶得到用戶的行為偏好同時做出商品評價。通常所說的協(xié)同過濾技術主要指基于用戶的協(xié)同過濾技術,隨著對該技術的不斷研究和發(fā)展,基于商品項目的協(xié)同過濾技術也得到了不斷的提高。
3.3.1 基于用戶的協(xié)同過濾技術
該技術的研究對象主要是用戶,并且在現(xiàn)實生活中的使用率較高。即通過假設,把對某一商品具有相似評價的用戶列為相似用戶,并由此推斷歸結到一起的相似用戶對其他商品也會有相似的評價。
基于用戶的協(xié)同過濾算法實施步驟:(1)獲取用戶信息,即利用用戶—項目矩陣描述用戶所獲得的商品的信息,這是用戶信息獲取步驟中最主要的內容;(2)相似性的計算以及相似用戶集的產生,就是通過相似性計算得到與目標用戶相似的用戶群,得到符合相似用戶數(shù)的一定數(shù)量的相似用戶;(3)生成推薦結果,是在相似用戶集的基礎上,根據(jù)推薦方法生成推薦結果。
3.3.2 基于項目的協(xié)同過濾技術
基于項目的協(xié)同過濾技術的研究對象主要是商品項目。該技術就是用相似性計算,得到用戶評價的商品項目與目標項目的相似值。利用它們之間的共性,預測用戶對目標項目的評價值,通過這樣的方式來獲得同類商品信息。
結束語
電子商務推薦系統(tǒng)的應用領域非常之廣,特別是將網(wǎng)絡數(shù)據(jù)挖掘技術與其相結合,更好的符合了電子商務領域的用戶所需。本文系統(tǒng)地闡述了網(wǎng)絡數(shù)據(jù)挖掘和個性化商務系統(tǒng)以及他們之間的結合,探討了網(wǎng)絡技術在個性化商務系統(tǒng)中的應用。在今后的工作過程中,還應加強對基于網(wǎng)絡數(shù)據(jù)挖掘的個性化電子商務推薦系統(tǒng)的深入研究,以切實提升系統(tǒng)運行的安全性與可靠性。
參考文獻
[1] 張遠程,康永勝.基于swarm平臺和社交網(wǎng)絡的電子商務個性化推薦系統(tǒng)仿真模型的理論構建[J].計算機光盤軟件與應用,2012,(21):124-125
[2] 艾丹祥,左暉,楊君.基于三維協(xié)同過濾的C2C電子商務推薦系統(tǒng)[J].計算機工程與設計,2013,34(2):702-706
[3] 吳海彬,劉利民,劉曉莉,等.電子商務個性化推薦原型系統(tǒng)的設計與實現(xiàn)[J].內蒙古工業(yè)大學學報:自然科學版,2012,31(3):26-31