李宏基
同濟大學軟件學院,上海 201804
物流企業用戶對物流服務平臺有著不同的功能需求,然而現有的物流管理平臺往往對用戶提供同樣的服務組合方案,用戶的需求往往混雜在一些他并不關切的服務中。本文設計物流服務平臺中的推薦系統,該統采用基于用戶聚類的協同過濾推薦技術,根據用戶在瀏覽、試用物流服務過程中所收集的物流服務評分,將評分相似的用戶聚類,在用戶目標所在的聚類中查找其最近鄰居并根據鄰居用戶的評分產生推薦,使得物流服務平臺能為不同的用戶推薦符合其自身需求的物流服務組合方案。
協同過濾推薦是目前研究最多、應用最成功的推薦技術。協同過濾推薦技術的優點是能為用戶發現新的感興趣的信息,同時對推薦資源沒有特殊的要求。但基于用戶的協同過濾推薦需要在整個用戶空間上搜索目標用戶的最近鄰居,隨著物流服務平臺的系統規模擴大,用戶數量的不斷增多,在整個用戶空間上搜索目標用戶的最近鄰居將非常耗時,因此,極大影響了推薦系統的實時性[1]。
為了提高推薦系統的實時響應速度,縮小目標用戶最近鄰居的搜索范圍,研究者提出了各種不同的推薦系統算法。基于用戶聚類的協同過濾技術[2]是通過用戶評分的相似性對用戶聚類,然后根據聚類中的項目評價生成對應的聚類中心,最后根據已有的用戶聚類尋找目標用戶最近鄰居并產生推薦的方法。和傳統基于用戶的協同過濾算法不同的是,基于用戶聚類的協同過濾技術首先將對物流服務評分相似的用戶聚類,在目標用戶所在的用戶聚類中查找最近鄰居。由于相似性用戶所在的聚類相對于整個用戶空間而言,其搜索范圍要小得多,因此能有效提高推薦系統的實時響應速度,提高物流服務平臺的運作效率。
推薦系統框架主要分為3個部分:信息輸入,數據管理和推薦生成。首先接受用戶在物流服務平臺頁面的瀏覽請求,服務器記錄下用戶的訪問記錄,包括用戶訪問的頁面、時間、用戶和物流服務信息等等。然后對Web日志進行預處理,將其加載到元數據庫中成為規整數據。根據推薦系統所調用的推薦算法可以提取所需的數據,如用戶評分數據、用戶信息、服務信息等進行推薦處理。物流服務平臺向推薦系統提供當前用戶的信息,并請求產生推薦服務。推薦系統接受信息和請求后調用內部推薦算法來產生推薦服務列表,并通過物流服務平臺的交互界面將組合后的物流服務推薦給用戶。推薦系統工作流程如下:
1)聚類分析:根據用戶對物流服務評價的相似度通過K-Means聚類算法[3]對用戶進行聚類。聚類過程首先根據修正的余弦相似性度量方法計算用戶間的相似性,然后利用K-Means算法選取K個用戶初始聚類中心后將相似度高于某一閾值的用戶聚為一類。
2)查找最近鄰居:通過聚類分析得到該用戶所在的聚類,依次計算目標用戶與聚類中其他用戶的相似度,將那些與目標用戶之間相似系數超過設定閾值的用戶作為他的最近鄰居,形成最近鄰居集。
3)預測服務評分:得到用戶的最近鄰居集后,根據目標用戶與鄰居用戶對已評價過的物流服務的評分來預測計算出目標用戶沒有評價物流服務的評分。假設用戶n對項目I的預測評分為Xn,i,則預測評分公式[4]可表示為:

4)生成推薦結果:推薦系統調用評分數據庫和用戶數據庫信息,根據用戶對物流服務評分相似度大小將用戶聚成K類,然后目標用戶所在的用戶類別生成最近鄰居,最后通過對鄰居用戶的物流服務評分進行加權平均來預測未被目標用戶評價過的服務評分值從而選擇評分值最高的前N個服務組成推薦列表。推薦系統接收物流服務平臺發出的推薦請求以及用戶信息,經過推薦處理后將生成的服務評分推薦列表發送給平臺交互界面,由物流服務平臺將組合后的物流服務方案推薦給用戶,通過服務功能可配置性為其訂制符合其自身需求的物流服務方案。
本文中的推薦系統在計算用戶對物流服務評分相似性的基礎上,對用戶進行聚類,在用戶目標所在的聚類中查找其最近鄰居并根據鄰居用戶的評分產生推薦。相對于整個用戶空間而言,相似性用戶所在聚類的搜索范圍要小得多,因此能有效提高推薦系統的實時響應速度,從而提高物流服務平臺的運作效率。
[1]王輝,高利軍,王聽忠.個性化服務中基于用戶聚類的協同過濾推薦[J].計算機應用,2007,27(5):1001-9081.
[2]潘宇,林鴻飛,楊志豪.基于用戶聚類的電子商務推薦系統[J].計算機應用與軟件,2008,25(4):25-26.
[3]毛國君,段立娟,王實,等.數據挖掘原理與算法[M].北京:清華大學出版社,2005.
[4]何安.協同過濾技術在電子商務推薦系統中的應用研究[D].浙江:浙江大學計算機學院,2007:15-16.