耿小芬?
摘 要:隨著IPTV技術的迅速發展,IPTV系統為用戶提供的內容也越來越豐富,用戶在龐大的互動電視節目信息空間中,希望快速的找到自己喜歡的電視節目,因此,個性化推薦技術的研究和開發成為熱點。論文論述了目前推薦研究方面常見的幾種技術,提出了混合推薦的優越性,并指出該推薦是目前應用最廣泛的技術。在論述的基礎上提出了用戶興趣模型創建的方法,為開發高效的推薦系統提供了理論依據。
關鍵詞:IPTV;相似度計算;個性化推薦
中圖分類號:G20 文獻標識碼:A 文章編號:1672-8122(2017)06-0122-02
一、引 言
IPTV(Internet Protocol Television)全名網絡協議電視,是集互聯網技術、多媒體技術和通訊等多種技術于一體,使用“互聯網機頂盒+普通電視機或計算機作為用戶終端”,為用戶提供節目直播、視頻點播、手機互動、3D游戲、教育娛樂等多種交互式服務的網絡電視。IPTV的節目通過廣播,組播,單播等發布方式,實現了比傳統電視更人性化的服務,如:互動電視、預約節目、實時的快進及計費等管理方面的功能。除此之外,IPTV還能開展和互聯網相關的其它業務,如電子郵件、電子理財和網絡游戲等。IPTV的發展使傳統的電視用戶在選擇自己喜歡的節目方面有個更大的自由空間,但是,傳統的電視用戶,在這些海量資源中如何快速找到自己喜歡的資源,如何快速定位到自己喜歡的節目變成了一個難題,因此設計具有個性化智能推送的系統也迫在眉睫。
二、個性化推薦技術研究現狀
個性化推薦就是建立用戶興趣模型,計算用戶對信息的感興趣程度,研究適合用戶的個性化內容推送技術,實現將用戶喜歡的內容準確的推送給用戶。1995年個性化服務技術的概念被正式提出,標志性事件是在美國賓夕法尼亞州的卡內基梅隆大學,由 Robert Armstrong等人提出的一個名為Web Watcher 的系統。我國開始個性化服務研究的標志性事件是路海明提出的基于多Agent混合智能個性化推薦系統[1]。隨著互聯網技術的發展,網民數量日益增多,《中國互聯網絡發展狀況統計報告》中指出,截至2016年12月,我國網民數量已達7.31億,很多領域的網民數量還出現了爆發式的增長,在這種態勢下個性化推薦的研究也一定是熱點。常見的推薦有購物類網站提供的商品推薦,行業類網站提供的信息推薦,視頻類網站提供的視頻推薦,門戶類網站提供的消息推薦等。個性化推薦帶來的便利使越來越多的用戶加入其中,也促使越來越多的學者和技術人員參與到個性化服務系統的研究之中。因此在IPTV發展過程中,個性化推薦技術的研究具有重要的意義。
1.基于用戶特性和資源特征的內容推薦
基于內容的推薦技術是信息檢索領域的研究內容,該方法來源于信息獲取領域,該推薦方法要為每個需要推薦的資源建立該資源的屬性檔案,再為每個用戶構建一個用戶的喜好檔案,計算用戶的喜好檔案與資源屬性檔案的相似度,相似度高說明用戶喜歡該資源,否則表示不喜歡該資源,根據喜好與否進行推薦。該方法要在需要推薦的資源中進行特征提取,利用加權的方法使那些顯著特征具有較高的權重,參考用戶的評價修改權重,并將資源的特征向量按比例加入到用戶特征向量中。計算推薦的依據可以利用余弦相似度的公式來計算,余弦相似度的計算方法為:
其中:US表示用戶對某資源S的喜好值,IS表示資源I中包含S的值。
基于內容推薦只利用用戶特征和資源特征,因此適用于易于提取特征的文本內容的推薦。該推薦根據資源的特征匹配,而且由于是基于用戶以前的興趣,并不能為用戶找到新的興趣,所以對于新用戶,沒有辦法根據以往的歷史數據發現興趣,因此無法得到準確推薦[2]。基于內容的推薦,如果想達到好的推薦效果只有等用戶有一定的記錄量后才有可能實現。基于內容的推薦系統有:ifWeb、SIFTER、WebPersonalizer、ELFI和WebACE等,這些系統的出現使基于內容的推薦研究得到了充分的實現。
2.基于用戶和項目的協同過濾推薦
協同過濾技術是目前研究比較成功也是應用較多的一種推薦技術。協同過濾技術可分為兩類:一類是基于用戶(User-Based)的協同過濾,一類是基于項目(Item-Based)的協同過濾。
基于用戶的協同過濾基本原理是:基于用戶對物品的喜好找到相鄰鄰居,將相鄰鄰居喜歡的物品推薦給當前用戶[3]。例如,在一個個性化推薦系統中,向用戶推薦時,通過計算找到與該用戶有相似興趣的其他用戶,根據鄰居的相似度權重,以及他們對物品的偏好,為當前用戶生成一個排序的推薦列表,這種方法為基于用戶的協同過濾算法。基于用戶的協同過濾算法主要包括兩個步驟:
(1)找到和推薦用戶相似的用戶集合。
(2)在這個集合中找到用戶喜歡的,且推薦用戶沒有的物品進行推薦。
基于項目的協同過濾和基于用戶的協同過濾原理相類似,不同的是在計算鄰居時不是從用戶的角度,而是從項目(或稱為物品)角度,即通過分析項目之間的相似性進行推薦。該推薦算法采用統計技術,找到與目標項目有相似評分的鄰居項目,選擇預測評分高的前若干項推薦給目標用戶 [4]。比如:對于物品甲,根據所有用戶的歷史記錄分析發現喜歡物品甲的用戶都喜歡物品乙,可以得出物品甲和物品乙有很高的相似度,所以當向喜歡物品甲的用戶進行推薦時,可以推斷該用戶可能喜歡乙,并進行推薦。
基于協同過濾的推薦從應用的角度看是現今比較成功的推薦技術之一,很多網站都采用了這種方法進行推薦,如亞馬遜、當當網等。基于內容的推薦只分析資源文本內容,而基于協同過濾的推薦加入了用戶對項目的評分,因此不僅能推薦除文本之外的其他資源,還避免了對資源內容表達和推薦不準確等問題,同時由于協同過濾算法是利用最近鄰居進行推薦,因此有助于發現用戶潛在的興趣,這也是協同過濾技術應用較多的原因。
3.基于聯合技術的混合推薦
在推薦系統中,為了提高推薦精度經常把不同的推薦算法聯合起來,這種聯合技術稱為混合推薦。目前,最常用的混合推薦就是把基于內容的推薦和協同過濾推薦聯合起來。聯合的方法主要有加權、轉換、融合、特征聯合、級聯、特征增加、分層。混合推薦具有更好的準確率,常見的混合推薦技術是在協同過濾的推薦系統中加入基于內容的推薦算法。對于混合推薦的研究目前比較有代表性的有:Velasquez 等提出的基于知識的 Web 推薦系統;Aciar 等實現的是基于知識和協同過濾的混合推薦系統;Wang 等提出的基于虛擬研究群體的知識推薦系統[5]。
三種推薦技術各有特點也有其不足之處,其中基于內容的推薦技術需要較高的文本分類技術,而且只能實現相似內容的推薦。各網站應用較多的基于協同過濾技術雖然有很多優點,但是在剛開始使用時,想通過計算找到與目標用戶的相似用戶比較困難,可擴展性也差。混合推薦技術是將上述兩種技術進行組合而產生的混合推送策略,能結合實際情況選擇恰當的混合策略,進而提高推送質量。
4.其它的推薦技術
除了上述所說的三種推薦技術外,還有很多其它的推薦技術。一是通過用戶行為的關聯模式進行推薦的基于關聯規則分析的方法。如:Agrawal 等通過對用戶與物品間關聯規則的分析提出的 Apriori 推薦算法;二是基于社會網絡分析的方法。如:Wand 等對在線拍賣系統中的拍賣者進行推薦時就利用了社會網絡分析方法;三是基于上下文知識的方法。如:郭磊等提出的結合推薦對象間關聯關系進行推薦的算法就是利用推薦對象間的關聯關系實現的。
三、用戶興趣模型的創建
要創建用戶的興趣模型,需要計算用戶的興趣度。為了計算用戶興趣度,通常要把用戶的興趣劃分為多個具體的興趣特征,先計算這些具體的興趣特征的興趣度,再用興趣特征的興趣度來計算和表示用戶的興趣度。目前,用戶興趣度大部分是采用二維向量表示的,隨著時間的變化,人的主觀認識會發生變化,興趣會發生變化,對某件事的興趣度也會發生變化,但是用戶興趣的二維向量是不變的,因此不能動態的反映用戶興趣和對某件事興趣度的實時變化。所以我們可以在表示用戶興趣時加上時間因素,也就是給興趣打上時間的標簽,這樣可以更好地區分用戶興趣的變遷,重新構建新的用戶興趣模型。
1.用戶行為數據的采集及建模
個性化用戶模型的表示通常根據項目實際要求來選取特定的表示方法,既要考慮模型是否反映用戶的真實信息,還要考慮系統本身的實際計算能力。目前,常用的表示方法有:基于矢量空間模型表示法、基于概率模型表示法(分類模型的訓練可以采用樸素貝葉斯方式)、基于本體論的表示法、基于粗細興趣度表示法、基于用戶-項目矩陣表示法。計算的目的是讓系統自動地分析獲取用戶感興趣的敏感詞,然后自動進行個性化模型創建。
2.用戶興趣模型的建立
要創建用戶興趣模型,首先要做的是用什么方法來表示用戶興趣模型,然后是用戶興趣模型在何時要如何更新。具體實現的方法是對興趣特征進行多維度、細粒度劃分,采用數據挖掘技術、人工智能等知識建立用戶的興趣模型,之后對各粒度進行定量分析,在興趣模型的基礎上加上時間因素,建立基于時間的向量興趣模型。同時在模型構建時系統還會對數據進行解釋、推理并分離出噪聲,只留下關于用戶興趣的有用知識,系統通過對這些有用的知識進行格式化形成最終的用戶模型。
四、結 語
個性化推薦技術的研究可以實現在不需要用戶主動提供關鍵詞的情況下,系統就能夠自動建立用戶感興趣的信息庫,通過計算向用戶推薦感興趣的信息,這是傳統搜索引擎無法比擬的,個性化推薦技術研究既有重大的社會價值,也能帶來一定的經濟效益,同時也能解決現代信息科學中的很多問題。
參考文獻:
[1] 易偉.基于用戶行為的個性化內容推送系統研究[D].華中科技大學,2013.
[2] 龐秀麗,馮玉強,姜維.電子商務個性化文檔推薦技術研究[J].中國管理科學,2008(16).
[3] 肖杰.面向網絡電視的推薦系統框架及算法研究[D].華東師范大學,2012.
[4] IE Shparlinski. On some weighted Average Values of L-function[J]. Bulletin of the AustralianMathematical Society.2009,79:183-186.
[5] 鄧愛林,左子葉,朱揚男.基于項目聚類的協同過濾推薦算法[J].小型微型計算機系統,2004,25(9):1665-1670.
[責任編輯:東方緒]