司夢楚,張春明
?
服裝智能推薦系統在電子商務平臺中的應用
司夢楚,張春明*
(青島大學 紡織服裝學院,山東 青島 266071)
近十年來,中國逐漸進入全民網購的電子商務時代,越來越多的電商平臺和產品領域引用推薦系統提高交易效率。服裝作為電商品類的一大分支,其推薦系統也展現出巨大的商業潛力和應用前景。為進一步探索電子商務中服裝類商品的個性化推薦機制,本文結合產品屬性對服裝推薦算法及其應用進行研究,著重闡釋三種推薦技術的運算步驟及特征,并總結各個算法的優缺點以及目前服裝推薦系統研究中存在的不足,為電商平臺的服裝類產品及品牌營銷提供理論與智能算法依據。
推薦系統;個性化推薦;服裝;電子商務;網絡營銷;協同過濾
隨著互聯網的高速發展、電子商務與物流產業的日益成熟,我國電商行業的市場規模也發生了天翻地覆的變化。早在2010年,淘寶網的在線商品數已達到8億。同年首屆雙11,在當時網購蔚然成風的情況下,仍創造了一天5000萬的銷售額。根據近五年中國電子商務研究中心監測數據顯示,2012到2017年中國電子商務市場交易規模翻了近4倍(見圖1),大多數人對網購已經習以為常。中國網絡購物用戶規模也呈直線式增長(如圖2),5年內網購用戶規模翻了一倍,即在中國接近一半人口會使用網購。根據表1顯示的各年齡消費者網絡購物喜好排行,不難發現服裝類產品是網購人群的重要占比類。值得注意的是,服裝品類占據了電商B2C銷售規模的35%,網購滲透率達到36.9%。

圖1 2012-2017年中國電子商務市場交易規模

圖2 2012-2017年中國網絡購物用戶規模
商品種類與數量爆炸式增長,可想而知消費者在選購自己心儀商品時會面臨信息超載的難題。對于類似C2C、B2C電子商務網站來說,消費者想要從海量信息中篩選出自己想要的商品信息不是易事。但對于B2B、C2M類似的電子商務平臺來說,生產商和經營方讓自己廠商的產品引起注意更加困難[2]。“人找信息”的服務模式已經不適用于信息過剩的現代社會,急需一種依據用戶本人信息與歷史數據而自動組織和篩選服務模式。推薦系統應運而生,它的做法不止是把消費者作為網站內容的瀏覽者,同時更是網站內容的制造者。目前,像淘寶、京東這類電商平臺已經應用了簡單的個性化推薦功能,主要是為了實現商家營銷目的,從消費者自身出發的個性化推薦應用少。同時,推薦算法在服裝電商行業的應用規模還不成熟。

表1 各年齡消費者網絡購物喜好排行[1]
服裝推薦系統是個性化推薦系統應用在服裝行業的個例,利用數據挖掘等技術建立服裝數據模型和客戶模型,經過數據分析,借助電子商務平臺適時的將與客戶興趣特點匹配的服裝進行展示,幫助顧客完成服裝購買過程的協同機制[3]。
服裝電商領域的商品推薦主要包括:新款服裝面向大眾化的推薦、熱賣服裝,爆款服裝推薦、商家換季促銷特價服裝推薦和基于用戶瀏覽記錄,歷史購買(評分)記錄和喜好收藏商品的個性化推薦等。服裝作為電商銷售平臺的銷售大類,其推薦系統在推薦原理上與其他商品的推薦類似,但其本身的特殊性,也面臨著諸多挑戰,具體表現為:
(1)用戶模型不穩定,不易建模。消費者對于服裝的喜好會受流行趨勢、地域文化、季節變化的影響,甚至是受某明星、某文化的一時影響。并且隨著現代生活的豐富,消費者也經常購買功能性的服裝。這使得系統很難捕捉用戶興趣,建立的用戶模型準確度低。
(2)與對圖書電影、日用消費品和電子類產品的推薦不同,消費者在選購服裝產品時會存在求異心理,因此銷量好不能等同于值得推薦。服裝商品的推薦既要符合流行趨勢迎合人們的趨同心理,又要兼顧消費者張揚個性的求異心理。
(3)推薦系統運算量巨大。從以上兩方面不難看出,服裝推薦系統運行數據繁多,數據更新快,計算量大,會導致系統維護成本高。這也是限制一些中小型企業和網站投入運行該系統的重要原因[4]。
在針對服裝的推薦算法上,國外的研究要早于國內。Kudo等通過分析消費者的數據制定用戶對服裝屬性的決策信息表,并將粗糙集理論應用到服裝推薦中(2006)[5]。Lin等在原有研究的基礎上,提出除了用戶偏好之外的需求因素的用戶模型(2012)[6]。Choi等認為隱式評級可以成功地替代協同過濾的顯式評級,而協同過濾和序列模式分析(SPA)的混合方法比單獨的評級要好,可為用戶建立更準確的偏好模型(2012)[7]。Geuens等提出了一個新的決策支持框架,根據在線二進制購買數據(稀疏級、采購分配和項目—用戶比率)生成建議,以幫助電商公司選擇最佳的協同過濾算法(CF)(2018)[8]。
國內對于服裝個性化推薦建模問題研究較晚,主要是基于算法的改進。吳健春,艾黎,徐兵兵均是用聚類的方法縮小協同過濾時用戶群的數量、從而在計算時降低屬性空間的維度,來解決信息過載問題[9-11];齊揚關注了服裝商品的特殊性,將西服的主要特征分為領型、扣子、面料等不同要素,并對這些特征要素抽取分類,最后用BDEU決策樹算法建立用戶類別偏好模型(2010)[12];鄭充林在協同過濾算法中介入了產品生命周期理論,新算法考慮了時間信息影響的問題,提出了在推薦結果過程中加入由項目生命周期決定的權重信息,克服了傳統算法的弊端(2013)[3];陳丹兒等提出的協同過濾改進算法首先將用戶歷史評分數據映射為用戶偏好,然后使用BP神經網絡建立偏好模型并預測新項目的評分,形成最近鄰后產生推薦(2015)[13];單毓馥等提出的服裝推薦方法基于AHP層次分析,該方法量化影響顧客選擇主要因素的權重,通過相似顧客的評分來預測其他顧客對該服裝的喜好(2016)[4];陳俊虹等調研用戶搜索時使用的關鍵詞,開創性構建了標簽體系,從而提高用戶在購買服裝時的精確度(2017)[2];
針對電子商務中服裝類商品的個性化推薦問題,國內外學者進行了一些研究,其成果多為根據客戶的瀏覽、點擊、收藏行為等進行聚類從而實現產品推薦。然而,結合服裝產品特點的智能推薦系統或算法目前卻鮮有文獻報道。本文以電商平臺的服裝智能推薦系統為研究對象,結合三種推薦方式以及服裝產品種類、款式等提出了新的推薦算法,并對其運算步驟及特征進行了闡釋。
推薦系統除了解決信息過載的問題,更重要的是激勵用戶去購買新商品。針對于服裝這一類商品,目前主流采用的算法有以下幾種:基于內容(Content-based,簡稱CB)、協同過濾(CollaborativeFiltering,簡稱CF)和混合推薦。
基于內容的推薦不依賴用戶對項目的評價,利用歷史瀏覽、點擊、分享、加購和已購買這些項目數據來建立用戶偏好模型,再提取項目的內容屬性形成特征矩陣,最后對比分析用戶模型與特征矩陣的吻合程度,將相關系數高的項目推薦給用戶。因此隨著用戶的瀏覽記錄數據的增加,這種推薦一般也會越來越準確。項目內容特征提取、用戶偏好數據模型建立和相似度匹配是該推薦模型的三大關鍵。項目特征的表示一般采用向量空間模型,最常用的是TF-IDF[14](Term Frequency-Inverse Document Frequency)方法,其為項目特征分配權重的思想如下:
關鍵詞在文檔中出現的頻率定義為:
(1)
關鍵詞在項目集中出現的逆向文檔詞頻定義為:

關鍵詞i在項目文件j中的權重為:

用戶偏好文檔和項目文檔的余弦相似度為:

利用公式(3)-(4)計算偏好文檔和項目文檔的余弦相似度,算得的相似度越高,表示用戶對該特征越偏好[15]。
比如,在進行款式推薦時首先根據用戶的瀏覽記錄等提取用戶的興趣特點建立用戶模型,然后在服裝數字模型中尋找與用戶模型匹配度較高的服裝進行推薦,其具體的推薦機制的基本原理如表2所示。假設有三種類型的用戶A、B、C,表格中的圓點表示該用戶喜歡購買該款式風格的服裝。通過匹配用戶興趣模型以及款式的特征矩陣,系統對款式A的特征提取和款式C的類似。對號表示生成推薦,根據基于內容的推薦思想,系統會把款式C推薦給用戶A。

表2 基于內容的推薦原理
基于內容的推薦有優點,如:沒有冷啟動問題和稀疏問題;實現原理簡單、直觀,結果易于理解,不需要具備專業行業知識[15];可以發現隱藏的“暗信息”,從而推薦新出現和非流行的項目資源。但也有缺點,只能適用于資源內容比較容易分析的系統,對于抽象的內容(如視頻、音樂等)會由于缺乏特征提取方法而無法實施;推薦資源的范圍也會過于狹窄,只能根據用戶歷史偏好進行推薦,不能很好地發現用戶的新興趣。
協同過濾推薦算法是應用最廣泛也是最成功的算法,它的原理是基于這樣的假設:生活中當我們接觸到新問題或購買新產品時,總會向身邊的朋友咨詢建議。它的算法基于三點:(1)根據用戶歷史行為數據分析用戶喜好;(2)將具有相似喜好的用戶歸為一類;(3)綜合同類用戶對某項目的評分,預測目標用戶對該項目的喜好程度。對同一用戶群的用戶推薦相似的服裝時,先根據用戶一項目評分矩陣中的用戶數據提取相似用戶,進而產生推薦。協同過濾推薦算法分為基于用戶(User-Based)的協同過濾推薦和基于項目(Item-Based)的協同過濾推薦兩種類型。
2.2.1 基于用戶的協同過濾推薦算法
基于用戶的協同過濾推薦算法強調了人與人之間的合作,每個人的行為屬性都在某個特定群體的范圍之內,相同群體的用戶興趣偏好相似。首先根據用戶對項目的評價尋找特定群體范圍內的最近鄰居集合,根據最近鄰居集合對某一項目的評分預測新用戶對該項目的喜好。
分為相似度計算、臨近選擇和產生推薦三步。修正的余弦相似度是衡量用戶間相似性的較好方法,公式見式(5)。



經過上面的計算,就可以得到目標用戶對所以未評分項目的評分,選擇評分最大的前k個項目推薦給用戶。
基于用戶的協同過濾算法的基本原理如表3所示。假設有三種類型的用戶A、B、C,表格中的圓點表示該用戶喜歡購買該類型的服裝。從表格信息可以推斷出,用戶A和用戶C的興趣大致類似,他們都喜歡購買運動裝和工裝。表格中的對號表示將西裝推薦給用戶A,因為用戶A和用戶C興趣類似,用戶C喜歡西裝,則用戶A也可能喜歡西裝。

表3 基于用戶的協同過濾推薦
2.2.2 基于項目的協同過濾推薦算法
基于項目的協同過濾推薦算法將項目的特征屬性放在特定項目的范圍內,假設用戶對某一項目有興趣,那與之相似的其他項目也可能引起用戶興趣。根據用戶一項目評分矩陣中的服裝數據來計算服裝之間的相似性,向顧客提供與以前喜歡的服裝相似的服裝。大體思想與基于用戶的推薦類似,唯一區別在于提取的是項目的相似度。


該算法思想依據假設某用戶對某項目產生興趣,那么用戶也會對與之相似的其他項目產生興趣,其基本原理如表4所示。表示假設有三種類型的用戶A、B、C,表格中的原點表示該用戶喜歡購買該類型的服裝。對于用戶C,根據所有用戶對某種款式的偏好情況,判斷出喜歡款式1的用戶都喜歡款式3,得出款式1和3相似,繼而推斷出用戶C可能對款式3感興趣。對號P表示系統會將款式3推薦給用戶C。

表4 基于項目的協同過濾推薦
協同過濾系統具有以下優點:可以對內容識別困難的商品進行項目分析,比如音樂、電影等;有挖掘消費者潛在興趣和偏好的能力,新用戶的個性化學習過程得以加快。但同時也有難以克服的數據稀疏性問題,以及項目、用戶的冷啟動問題。這兩大問題使得相似度計算的結果與實際相差甚遠,導致推薦質量的下降。隨著用戶與項目數量的劇增,傳統的算法也將遭遇到嚴重的擴展性問題。

表5 混合推薦的七種類型[18]
每個算法都有一個相對“致命”的缺點,混合算法的原理是采取組合策略,使不同的推薦算法“揚長避短”。混合算法最開始是作為一種新思想提出的,近幾年有很多學者針對這一問題進行了研究,把理論變為實踐,其中應用最多的是把基于內容的推薦與協同過濾算法結合。現實生活中經常會用到組合推薦的形式,在組合方式上有加權,變換,混合,特征組合,層疊,特征擴充和元級別(見表5)7種組合形式。現階段,很多針對于推薦算法提高精確度的新突破都是基于混合這一思想。
個性化推薦系統目前在用戶偏好較穩定的圖書、音樂、電影等產品領域的應用較為成熟,但服裝類產品的智能推薦仍處于摸索階段。導致服裝推薦系統運算數據巨大且準確性不高的原因主要有以下幾點:(1)消費客體易受適用季節、流行生命周期、使用情境等因素的影響;(2)消費主體購買服裝時的動機、態度、價值觀、生活方式等心理變量因素較為復雜:(3)服裝類產品的分類和評價方式更加多元化。
本研究梳理總結了幾種常見推薦算法在電商平臺服裝類產品智能推薦中的應用,著重闡釋了三種推薦算法的運行原理,對協同過濾算法進行了優化,計算用戶之間的相似度后,采取聚類分析,避免了大量運算,為電商平臺的服裝類產品及品牌營銷提供了理論與智能算法依據。基于內容的推薦沒有冷啟動的問題,但無法建立抽象內容的特征矩陣,不能發掘用戶潛在新興趣;作為主流算法的協同過濾算法,具備推薦新信息,產生新奇推薦的能力。在資源內容難以分析的情況下,協同過濾是很好的選擇。但是當用戶評分信息不足10%時,會導致推薦算法性能的下降。還有一種極端的情況,新項目和新用戶都面臨著第一評價的問題(即冷啟動);混合推薦是一種新思想,并沒有具體的算法流程,目的是為了避免和改善單一算法的缺點,靈活融合,提高推薦效率。
[1] 唯衣. 2017年消費者網購行為分析,服裝穩居首位[EB/OL].http://m.sohu.com/a/155530858_154452. 2017-7-8.
[2] 陳俊虹,劉詠梅.基于標簽的商務女裝推薦模型研究[J].浙江紡織服裝職業技術學院報,2017,(4):68-72.
[3] 鄭充林.協同過濾的服裝推薦算法的改進研究[D].上海:東華大學,2013.1-5.
[4] 單毓馥,李丙洋.電子商務推薦系統中服裝推薦問題研究[J].毛紡科技,2016,(5):66-69.
[5] Kudo Y,Amano S,Seino T,et al.A simple recommendationsystem based on rough set theory[J].KanseiEngineering International,2006,6(3):19-24.
[6] Lin Y C, Kawakita Y, Suzuki E, et al.Personalizedclothing-recommendation system based on a modifiedBayesian network[A]. //2012 IEEE/IPSJ 12th InternationalSymposium on Applications and the Internet[C].IEEE,2012.414-417.
[7] Keunho Choi,DongheeYoo,Gunwoo Kim,et al.A hybrid online-product recommendation system: Combining implicitrating-based collaborative filtering and sequential pattern analysis[J].Electronic commerce research and applications,2012,11(4):309-317.
[8] StijinGeuens,KristofCoussement,Koen W, et al.A framework for configuring collaborative filtering-based recommendations derived from purchase data[J].European journal of operational research,2018,265(1):208-218.
[9] 艾黎.基于商品屬性與用戶聚類的個性化服裝推薦研究[J].現代情報,2015,(9):165-170.
[10]吳健春.基于協同過濾的服裝電子商務個性化推薦系統研究與開發[D].天津:天津工業大學,2008.26-48.
[11]徐兵兵.基于粗集和模糊聚類的協同過濾算法[J].浙江紡織服裝職業技術學院學報,2010,(2):56-60.
[12]齊揚,朱欣娟.基于數據挖掘的服裝推薦系統研究[J].西安工程大學學報,2010,(4):438-443.
[13]陳丹兒,應玉龍.基于項目屬性和BP神經網絡的協同過濾推薦[J].信息技術,2015,(3):70-73.
[14]周軍鋒,湯顯,郭景峰.一種優化的協同過濾算法[J].計算機研究與發展,2005.41(10):27-35.
[15]何佳知.基于內容和協同過濾的混合算法在推薦系統中的應用研究[D].上海:東華大學,2016.8-12.
[16]汪嶺.基于Hadoop的電子商務推薦系統應用研究[D].廣州:廣東工業大學,2015.8-11.
[17]劉建國,周濤,汪秉宏.個性化推薦系統的研究進展[J].自然科學進展,2009,(1):2-7.
[18]鄧仙榮.基于梯度提升回歸算法的O2O推薦模型研究[D].淮南:安徽理工大學,2016. 18-19.
Application of Clothing Intelligent Recommendation System in E-commerce Platform
SI Meng-chu, ZHANG Chun-ming
(College of Textiles and Clothing, Qingdao University, Qingdao Shandong 266071, China)
In order to further explore the personalized recommendation mechanism of clothing products in e-commerce, this paper combines product attributes to study the clothing recommendation algorithm and its application, focuses on the operation steps and characteristics of the three recommended technologies. And at last it has summarized the advantages and disadvantages of each algorithm and the shortcomings of the current clothing recommendation system, and it provides theoretical and intelligent algorithm basis for clothing products and brand marketing of e-commerce platform.
recommendation system; personalized recommendation; clothing; e-commerce; e-marketing; collaborative filtering
張春明(1981-),男,副教授,博士,碩士生導師,研究方向:服裝文化與品牌營銷.
中國博士后科學基金項目(2018M632624);中國紡織工業聯合會高等教育教學改革項目(2017BKJGX102);青島大學教學研究與改革項目(2018).
TS941.2
A
2095-414X(2019)02-0033-06