王海明
基于大數據下電子商務商品推薦系統的分析
王海明
隨著電子商務的不斷發展,電子商品的種類逐漸增多,如何推薦給適合顧客的商品來提高交易量成為電商首要考慮的問題。本文對如何完善電子商務商品推薦系統進行分析,圍繞設計搜索的整體性、相似商品的推薦和對顧客進行分類三個方面展開討論,從而實現提高電子商務商品成交額的目標。
電子商務目前已經十分普遍,網上商品交易數量也隨之增多,網上商品種類繁多,商品消費者的選擇性增加。因此,電子商務商品推薦系統的完善成為提高交易量的重要手段。通過挖掘大數據下消費者的消費特點,進行相應的商品推薦,對實現電子商務商品發展有著重要的作用。
從消費者的角度出發,將電子商務商品推薦系統按使用技術分為兩類,一種是自動化程度,一種是持久性程度。自動化程度是指消費者在進行商品選擇時,通過輸入相關信息,便會出現一系列有關商品,其中可能出現消費者恰好感興趣的商品,以此縮短消費者查找商品時間,盡可能提供給消費者便利。手工方式是指消費者需要進行對所需商品的具體要求,網上會根據消費者需求顯示出具體的商品,這類推薦方法存在限制消費者接觸更多商品類型的弊端;所謂持久性程度,是指根據用戶的不同需求,綜合推薦消費者感興趣的商品,不局限與消費者某階段的單獨需求,而是對用戶多種需求進行整合分析,再推薦給用戶相關的商品。
以上兩個推薦系統從用戶的角度出發進行分類,體現了電子商務網站以用戶為核心的標準,通過進行不同類型推薦系統的探索,盡可能使推薦系統滿足用戶的需求。以上兩類推薦系統可以實現自主的、持久的對用戶進行推薦。基于以上兩個推薦標準可以將電子商務推薦系統分為四類,包括非個性電子商務推薦系統、根據產品屬性的電子商務推薦系統、相關性商品推薦系統、相關性用戶推薦系統。其中,非個性電子商務推薦系統指的是推薦標準主要源于各個用戶的評價,對全部用戶評價作出綜合判斷,這種推薦系統對全部用戶的推薦標準相同,并且是系統自動產生的,不需要對用戶需求進行復雜的分析;基于產品屬性的推薦系統,主要核心是商品,通過接收用戶輸入的相關產品屬性,推薦給用戶具有對應屬性的商品。這種推薦系統注重用戶的個性化需求,可以使根據用戶的瞬時需求進行推薦,也可以根據用戶的多種需求來推薦;相關性產品和相關性客戶推薦分別是根據商品的相似性和用戶之間的相似性進行推薦,個性化程度較高。
基于大數據的電子商務個性化推薦
大數據的挖掘是根據用戶需求進行相應商品推薦的前提。目前,主要推薦算法包括內容過濾算法和協同過濾算法兩類,其中過濾算法是在內容的基礎上進行信息檢索,協同過濾算法更多的是根據用戶的具體需求,以客戶的興趣為主要推薦標準。當前最為流行的挖掘算法是基于Web的挖掘,因此將Web挖掘的電子商務推薦與用戶需求進行有效結合是實現電子商務發展的關鍵。
研究表明,目前存在的推薦算法準確性不夠,通常是根據用戶以往的瀏覽內容進行推薦。而用戶的需求處于不斷變化中,若只根據消費者以往需求進行推薦,往往有別與消費者的目前需求,并且這種方式也不被消費者接受,在進行商品選擇時,常出現用戶不感興趣的商品推薦,會影響用戶的消費情緒。因此,創新出能滿足用戶當前商品需求的推薦算法,是完善電子商務商品推薦系統的重點。
基于關聯規則的推薦算法
基于關聯規則的推薦算法。關聯規則屬于數據挖掘技術,該技術能發現數據之間的某些關聯。關聯規則挖掘出的數據能有效將用戶消費特點顯示出來,根據用戶的購買習慣,可通過關聯規則進行與用戶需求有關的商品匹配,對用戶的需求有一定的掌握。這種方法對商家進行商品促銷有很大的幫助,舉例說明,當用戶產生購買記錄后,關聯規則便會挖掘出相關數據,商家通過對數據的分析,能直觀的發現消費者的購買習慣,在進行商品促銷時,商家便會根據分析出的數據結果,進行符合群眾需求的商品促銷,能為商家帶來很大的效益。
Apriori算法及改進算法。Apriori算法是基于關聯規則的一種推薦算法,它的基本思想是,首先通過挖掘數據中大范圍的數據項集作為候選,并記錄候選項集中每個數據發生的次數,將大于最小支持率的數據作為一個集合,將該集合記作L1,再基于L1中數據,進一步生成集合L2,以此類推,直至生成集合Ln,標志著集合已經不能更加細分。最后,再根據相應算法導出規律。Apriori算法在用戶相似商品需求的判斷中起到重要的作用,但是仍然存在一些不足,包括由于數據庫太大,導致算法存在一些不必要的規則,加大了數據分析難度;Apriori算法的運算步驟,要求在運算時,要對數據庫進行多次掃描,降低了算法的效率;由于一些客觀因素的存在,也會影響算法的準確性,導致最后的結果與實際存在差異。算法的改進是實現結果準確的重點,它的改進可以從算法的效率和產生集合的準確性入手,例如數據庫中包括多種商品的信息,由于某些商品之間的聯系較大,可能導致它與其他商品之間關聯性被忽視,那么產生的集合就是不準確的,為了改善這種情況,可以將與眾多商品具有關聯性的商品做出標志,避免此類商品數據的頻繁掃面,造成算法的不準確。
分段Apriori算法及其應用。分段Apriori算法就是將大數據庫中的項分成小部分,再對各部分進行Apriori算法。這種算法可能會丟掉數據庫中的一些信息,是分段算法存在的缺陷,但是由于數據庫太大,其中的數據不完全有效,分段算法通過丟掉多余的數據,不僅可以提高算法效率,還能提高算法的準確性。舉例說明,當我們針對某些屬性進行推薦算法時,可以通過添加一些限制條件,頻繁集合必須滿足前提條件才能進行運算,這樣就可以在進行算法前將不必要的數據進行排除,減少運算量,提高算法的效率。
隨著科技的發展,電子商務越來越普遍化,網上消費者的數量明顯增加,同時由于電子商務商品數量和種類的增加,電子商務的競爭力增大。如何提高對消費者的了解程度,提供相應的產品推薦成為重點問題。可以通過完善電子商務商品推薦系統,實現提高網上交易量的目標。
(作者單位:蘇州大學計算機科學與技術學院)