王炎
(陜西財經職業技術學院 管理學院, 咸陽 712000)
隨著電子商務的快速發展,越來越多的企業開始對網絡用戶的行為進行分析,通過用戶行為來對興趣愛好進行掌握,根據用戶的興趣愛好來為其進行個性化商品的推薦,在此過程中,能夠充分提高用戶交易的成功率,增強企業的盈利水平。用戶在使用互聯網的過程中,瀏覽記錄會被網絡進行自動識別并記錄,該項記錄會對用戶的行為分析提供基礎,在對行為分析過程中,數據的采集以及網站數據的提取至關重要[1]。
個性化的智能推薦系統可以通過對相關信息的過濾,將用戶感興趣的信息推薦給用戶,例如電影、音樂、書籍、圖片等。此次研究以電影為例,對數據挖掘技術下的智能推薦系統進行設計分析,最終目標為:結合用戶的喜好,推薦系統為其提供經過篩選之后的電影推薦列表,并且能夠及時更新。系統整體構架如圖1所示。
由圖1所示,該系統以三層構架結構進行設計,當用戶對需求信息發出指令以后,接口會將指令傳遞到中間層,位于中間層的搜索引擎會結合用戶給出的喜好信息與多媒體資料庫中的內容相匹配,產生符合用戶標準的媒體信息反饋給用戶接口。用戶對所推薦的內容滿意之后可以進行付費并瀏覽。本次所設計的智能推薦系統由用戶處理子系統、管理員控制系統與推薦子系統構成。

圖1 個性化智能推薦系統整體構架
1.1 用戶處理子系統:該子系統主要對用戶的個人信息進行收集,并且為用戶提供注冊、觀看視頻的相關信息等功能。包括列表推薦、熱點分析、分類列表、資料搜尋等。
1.2 管理員控制系統:對多媒體資料庫進行及時更新與維護,可以對用戶或媒體信息進行刪除,在搜索引擎上,可以對參數進行調整。管理員可以對用戶資料庫進行管理,對系統個性化信息進行自動更新。
1.3 推薦子系統:該子系統主要產生關聯規則,以最快的速度提供信息推薦。
數據挖掘技術下的個性化智能推薦系統的設計主要涉及個人信息的自我學習技術以及個性化特征分析技術[2]。
2.1 個人信息自我學習技術
該項技術主要是通過用戶對不同類型電影的點擊頻率來構建起個性化的瀏覽信息列表,對電極習慣與特性進行自我學習。在對電影進行推薦時,要根據電影自身與用戶的喜好關系進行推薦,所以需要對電影資料與用戶信息之間做出相應關聯。通過信息搜索技術,最終產生規則信息。用戶可以直接通過推薦系統來對規則庫中的資料進行使用,通過對比之后,給出正確的推薦信息。系統會將用戶每次選取的電影操作當作一次交易記錄,每個信息特征都當作一個項目,通過CBW算法能夠增進搜索速度,結合不同的用戶資料結構,快速的搜索出相關項目集[3]。針對多維度關聯規則舉個簡單例子:如表1所示。

表1 挑選記錄交易信息表
{(性別,男),(星座,巨蟹),(年齡,中年),(職業,教師),(居住,南部)}—{(類別,動作),(男主角,湯姆克魯斯),(電影點選記錄,點擊)}
其中代表的意義為:居住在南部的中年巨蟹座男教師通過點擊瀏覽了由湯姆克魯斯主演的動作片。
2.2 個性化特征分析技術
在智能推薦系統的構建中,個性化特征分析技術的應用主要是為了找出電影自身與用戶需求信息之間的關系,用戶信息包括性別、年齡、職業、興趣愛好等。電影信息包括導演、男女主角等。用戶行為包括試看、點擊、付費三種。通過個性化特征分析技術將這些信息形成相關聯的規則。個體關系如圖2所示。

圖2 推薦視頻與個人資料關系
推薦程序主要是對眾多條件的因素進行分析,針對需求給予最佳匹配。以較新的電影資源優先,其次為點擊率,點擊率較高的電影優先次序較高[4]。具體邏輯分析如下:
輸入:用戶的個人資料、交易記錄、多媒體資料以及關聯規則。
輸出:推薦的10部符合要求的電影。
處理:對電影推薦的流程處理如圖3所示。

圖3 系統推薦流程
當用戶登錄到瀏覽器之后,系統會分析用戶數據,判斷其是否為第一次使用,如果是第一次使用,系統會自動對用戶需求進行檢索,找到合適的關聯規則,通過關聯規則來推薦電影,如果找不到相關的關聯規則,會直接推薦給用戶最熱門的10部電影。如果用戶不是第一次使用推薦系統,那么系統會對與用戶適合的關聯規則進行搜索,一旦發現可用的關聯規則,會通過該關聯規則對電影進行推薦。如果搜尋不到關聯規則,會直接按照用戶的交易記錄來進行推薦。
3.1 根據關聯規則推薦
首先系統會檢查關聯規則右項的結論,當系統給出的結論為單向信息時,可以直接根據右項結論來進行推薦。如果結論為多項信息,則需要對信息進行分離,分離成單一的結論信息之后,針對每個單一信息推薦出10部電影,根據這10部電影之間的信息交集,來選出最符合用戶的五部電影做出推薦[5]。根據規則推薦電影流程,如圖4所示。

圖4 關聯規則推薦
3.2 交易記錄推薦
如果根據交易記錄進行推薦,那么需要從用戶的交易記錄中挑選出用戶最長看的五部電影類型,找出用戶是否對電影的某個信息有所偏愛,如果有,需要將該信息下的電影挑選出來,對電影類型進行分析,與之前的電影進行對比分析,最后集成為一種電影類型,根據相應比例計算出各種類型的電影推薦書目進行推薦。推薦流程如圖5所示。
系統測試模塊是系統設計中不可缺少的一部分,通過測試能夠證明系統運行的穩定性與實用性。本次對智能推薦系統以實際數據進行實驗測試。在Intel Core i5-1.6 GHz,4GB RAM硬件環境下,運用Ubuntu 14.04操作系統,通過模擬數據器產生數據。本次測試以交易數量10萬筆與5萬筆為基礎,交易平均長度為12,項目種類為1400種[6]。如表2所示。

圖5 交易記錄推薦

參考值參數名T12.100KT12.50K交易數量/個100 00050 000平均交易長度1212項目 種類/種14001400
根據相應的數據量生成五種不同的測試數據,測試系統的穩定性。根據表3所示。

表3 不同資料執行時間以及頻繁項目集
將最低門限值設定為1%時,兩者執行時間為14.19秒和16.22秒。所以,系統在相同數據量所產生的不同測試數據下,時間非常穩定。基本不會由于測試數據而對穩定性造成很大影響。可靠性比較高,值得信賴。另外,系統所產生的項目集在2萬個左右,使用者的個性信息在越長頻繁項目集中出現,代表電影隊額推薦準確性越高。利用最低門限值來產生頻繁項目集,預測推薦的電影會更準確。
本文所設計的數據挖掘技術下的個性化智能推薦系統,主要運用數據挖掘技術,針對用戶的個人喜好進行預測,將符合用戶需求的內容推薦給用戶,通過關聯規則與交易記錄的結合,擺脫傳統被動的推薦方式,使用戶無需時刻進行上線查詢,能夠隨時掌握最新信息。經過對系統的測試,能夠證明該只能推薦系統的運行穩定性,在實際應用中具有一定的推廣價值。