武慧娟 孫鴻飛 金永昌


摘要:[目的/意義]在社會化標注系統自組織運行的基礎上,構建個性化信息推薦的多維度融合與優化模型.進而在大數據環境下.為用戶提供精準的個性化信息推薦服務.從而進一步豐富個性化信息推薦的理論體系以及拓展個性化信息推薦的研究方法。[方法/過程]首先,對每一種個性化信息推薦方法的優點和不足進行深入分析;然后,將基于圖論(社會網絡關系)、基于協同過濾以及基于內容(主題)3種個性化信息推薦方法進行多維度深度融合,構建個性化信息推薦多維度融合模型:最后,對社會化標注系統中個性化信息推薦多維度融合模型進行優化,從而解決個性化推薦過程中用戶“冷啟動”、數據稀疏性和用戶偏好漂移等問題。[結果/結論1通過綜合考慮現有的基于圖論(社會網絡關系)、基于協同過濾以及基于內容(主題)的個性化信息推薦方法各自的貢獻和不足,實現3種方法之間的多維度深度融合,并結合心理認知、用戶情境以及時間、空間等優化因素,最終構建出社會化標注系統中個性化信息推薦多維度融合與優化模型。
關鍵詞:個性化信息推薦;社會化標注;多維度融合;優化模型
DOl:10.3969/j.issn.1008-0821.2019.01.005
[中圖分類號]G203;G252 [文獻標識碼]A [文章編號]1008-0821(2019)01-0037-06
社會化標注系統是一種由它組織向自組織漸進漸變的復雜系統,其內部的信息組織并不是由外部力量直接安排的結果,而是在其內部規律支配下的自身演進發展的結果。因此,在遵循社會化標注系統自組織運行的基礎上,構建個性化信息推薦多維度融合模型,將目前現有的個性化信息推薦方法進行融合與優化,從而發揮每種方法的優點,回避它們的缺點,進而實現在大數據環境下,為用戶提供精準的個性化信息推薦服務。
開展社會標注系統中個性化信息推薦的研究具有十分重要的理論價值和應用價值,具體地主要體現在兩個方面:第一,從各類社會化標注系統的應用平臺角度出發,機構可以掌握用戶行為和用戶偏好的特點,能夠從宏觀、中觀和微觀三個層次逐層向用戶推薦個性化的信息,從而為政府部門、圖書館等信息服務機構更好地為用戶提供個性化信息服務起到積極的理論與實踐指導意義。第二,從社會化標注系統的使用用戶角度出發,面對海量數據,用戶可以更有效地享用自己需求和偏好的信息資源以及發現與自己需求和偏好相同的其他用戶,從而為更有效率地使用網絡信息平臺起到積極的理論與實踐指導意義。
1國內外相關研究現狀及研究趨勢
“社會化標注系統”最早引起國外學者的關注是在1999年,國內是在2008年。“個性化推薦”則是在20世紀90年代提出的這一概念??偨Y國內外關于社會化標注系統中個性化信息推薦方法,主要包括:基于內容(主題)的個性化推薦、基于協同過濾的個性化推薦、基于圖論(社會網絡關系)的個性化推薦以及其他個性化推薦方法(包括:基于知識的個性化推薦、基于關聯規則的個性化推薦、混合推薦等)。
1.1基于內容(主題)的個性化信息推薦
基于內容的個性化信息推薦是指通過對用戶的歷史行為信息進行分析,提取用戶需求和偏好特征并且構建相應的用戶需求和偏好模型,由此向用戶推薦與其需求和偏好模型相匹配的資源。該推薦方法的核心在于利用用戶需求和偏好與目標資源的相似性來過濾信息,進而實現個性化信息推薦?;趦热莸膫€性化信息推薦的不足之處在于雖然能夠較為準確地獲取用戶需求和偏好,但由于是根據用戶的歷史行為信息實現用戶需求和偏好的提取,而用戶的需求和偏好會隨著時間的推移發生變化和漂移,因此該推薦方法很難發現用戶潛在的需求和偏好以及難以實現所推薦資源的多樣性。
基于主題的個性化信息推薦是指從社會化標注系統的語義角度對信息資源進行深度挖掘,并且在此基礎之上再進行用戶需求和偏好和目標資源之間的相似性判斷,從而使得所推薦資源更加符合用戶的個性化需求和偏好?;谥黝}的個性化信息推薦的不足之處在于由于該推薦方法需要機器學習各種精確的數學匹配算法,以及需要機器分析語義的概念,從低維主題到高維主題進行用戶需求和偏好與目標資源之間的相似性檢索和匹配,因此為了實現更有效地從海量數據中進行相似性檢索和匹配,計算過程需要花費一定的時間才能夠挖掘出有價值的個性化信息。
1.2基于協同過濾的個性化信息推薦
基于協同過濾的個性化信息推薦是指根據具有相似興趣的用戶的歷史行為信息(例如以往的瀏覽記錄等)來預測目標用戶未來可能的需求和偏好,從而為之推薦相應的資源。類似地,用戶對于相似標簽的需求和偏好程度也在一定程度上反映了用戶之間的相似度。可見,基于協同過濾的個性化信息推薦包括基于用戶的協同過濾方法和基于資源的協同過濾方法。
基于協同過濾的個性化信息推薦的不足之處在于以用戶過去的信息行為來計算相似度。因此需要大量的歷史數據才能較好地衡量相似性以及挖掘出用戶潛在的需求和偏好。同時,在海量數據的情況下計算相似度也是非常耗費時間的。此外,很多在線用戶的信息行為并不十分明顯(例如瀏覽過程中的關注和收藏行為等),甚至是“冷啟動”,從而導致初始推薦質量較低、可擴展性較差等問題出現,因此如何準確判斷這一類用戶的信息行為還是一個研究難題。
1.3基于圖論(社會網絡關系)的個性化信息推薦
由于社會化標注系統是一個復雜網絡,所以許多學者利用圖論的相關理論來描述和刻畫標簽,分別使用了3部分圖、超圖和社會網絡分析等方法來描述社會化標注系統中的各種組成要素。特別是隨著社會網絡分析理論和方法的發展,從社會網絡的角度分析社會化標注系統的網絡結構,對其中的資源、標簽、用戶三者各自的網絡結構進行數據挖掘。
基于圖論(社會網絡關系)的個性化信息推薦采用向量來表示用戶—資源、資源—標簽、用戶—標簽兩兩之間的關系,尤其是從社會網絡分析的角度分析社會化標注系統的網絡結構,分析用戶所在的群體特征,進行群體用戶行為的分析等。但是,其不足之處在于基于圖論(社會網絡關系)的個性化信息推薦是從宏觀的角度來劃分用戶群體,而對于每一個具體用戶行為的微觀分析略顯不足。
1.4其他個性化信息推薦
其他個性化信息推薦還包括基于知識的個性化推薦、基于關聯規則的個性化推薦以及混合推薦等等。其中,基于知識的個性化信息推薦是指利用特定領域的知識或規則進行推理,不是通過挖掘用戶的需求和偏好,而是通過用戶知識和資源知識實現個性化信息推薦;其主要缺點在于特定領域的知識或規則難以獲得而且屬于靜態推薦?;陉P聯規則的個性化信息推薦是指利用資源之間的某種關聯規則,通過數據挖掘技術挖掘出用戶已有資源與目標資源之間的相關性,從而實現個性化信息推薦;其主要缺點在于存在數據稀疏性以及用戶“冷啟動”等問題。
綜上所述,每一種個性化信息推薦方法都有其優點和不足之處,因此如何選取每種方法的優點,進行相互融合與補充,從而規避它們的缺點,實現更加精準的個性化信息推薦,就成為當前個性化信息推薦領域亟待解決的重要問題。
2社會化標注系統中個性化信息推薦多維度融合與優化模型的研究框架
本文在利用自組織理論深度挖掘社會化標注系統內部演化機理和個性化信息推薦機理的基礎上,多維度融合基于內容(主題)、基于協同過濾以及基于圖論(社會網絡關系)3種個性化信息推薦方法的優點,構建社會化標注系統中個性化信息推薦多維度融合與優化模型,以期解決社會化標注系統中個性化信息推薦的過程中有關用戶“冷啟動”、數據稀疏以及用戶偏好漂移等問題,最終實現更加精準的個性化信息推薦。
具體地說,開展社會化標注系統中個性化信息推薦多維度融合與優化模型研究主要解決以下幾個關鍵問題:
1)在用戶沒有留下任何歷史記錄的情況下,個性化信息推薦多維度融合模型如何實現精準的信息推薦,即如何解決系統中用戶“冷啟動”問題。
2)隨著時間的推移,用戶的需求和偏好會發生漂移現象,個性化信息推薦多維度融合模型如何適應用戶的需求和偏好漂移現象,進而實現用戶的需求和偏好的動態跟蹤與信息推薦。
3)從現有的調研數據分析,目前的社會化標注系統中的標簽數據呈現出明顯的冪律分布,即大量的標簽用戶很少使用,而少量的標簽受到大量用戶的頻繁使用,同時用戶添加標簽的積極性并不高,這便產生了系統中數據的稀疏性問題。在這種情況下,個性化信息推薦多維度融合模型如何進行精準的信息推薦。
因此,本文首先提出社會化標注系統中個性化信息推薦多維度融合與優化模型的研究框架,如圖1所示。
從中可以看出,社會化標注系統中個性化信息推薦多維度融合與優化模型的研究主要包括以下3個方面的內容:
1)基于社會化標注系統演化的個性化信息推薦機理分析
通過對基于社會化標注系統演化的個性化信息推薦機理進行研究,分析社會化標注系統的自組織超循環演化形式和耗散結構,從個性化用戶行為和信息發現兩個角度進行探討。
第一,從系統演化的角度,分析社會化標注系統的結構特征,利用自組織理論分析社會化標注系統的自組織演化特性,借助超循環理論分析社會化標注系統以及3個集合(標簽集、資源集、用戶集)的自組織演化過程,構建社會化標注系統的自組織超循環演化形式。
第二,根據耗散結構理論,對社會化標注系統的耗散結構進行多層次研究,具體分析社會化標注系統的內部正熵和外部負熵之間的關系、系統整體熵的演化方向、系統的有序度和平衡態,構建社會化標注系統的多層級耗散結構。
第三,利用社會化標注系統中蘊含的大數據,從中挖掘出用戶行為數據,進行深度分析,發現用戶行為特征,歸納用戶的個性化信息需求和偏好,揭示社會化標注系統中個性化信息推薦機理。
2)社會化標注系統中個性化信息推薦多維度融合模型的構建
對于現有的基于圖論(社會網絡關系)、基于協同過濾和基于內容(主題)的個性化信息推薦方法,通過深入分析這三種推薦方法各自的優缺點,充分考慮它們的主要貢獻,規避它們的不足之處,尋找三者之間的融合點,采用適當的融合方法和融合工具,挖掘其內在的融合動因和融合機制,同時考慮社會化標注系統在結構演化過程中的時間因素,結合用戶、資源、標簽為一體的向量空間因素,充分發揮基于社會網絡分析、內容(主題)本體、協同過濾等方法的特點和優點,實現3種方法的深度融合,最終構建社會化標注系統中個性化信息推薦的多維度融合模型,使其能夠解決社會化標注系統中個性化信息推薦的過程中有關用戶“冷啟動”、數據稀疏和用戶偏好漂移等問題,最終實現更加精準的個性化信息推薦。
3)社會化標注系統中個性化信息推薦多維度融合模型的優化
將社會化標注系統中個性化信息推薦多維度融合模型進行靜態優化和動態優化,從而揭示構成個性化信息推薦多維度融合模型中各個要素之間的聯系以及動態變化。
第一,從系統學的角度,充分考慮所構建的個性化信息推薦多維度融合模型的系統結構是由許多要素組成的,要素是系統中對整體性質和體系結構起到主要和關鍵作用的主要元素,其中靜態優化主要從功能要素、角色要素、組成要素3個方面對所構建模型展開優化。
第二,從系統動力學的角度,充分考慮所構建的個性化信息推薦多維度融合模型的時間適用性、用戶偏好的漂移性,從模型的目標要求、適用條件,尤其是模型內部各個要素的運行機制,將靜態優化轉換成為動態優化,從而實現個性化信息推薦的動態適應性。
3社會化標注系統中個性化信息推薦多維度融合與優化模型構建
結合前文所述社會化標注系統中個性化信息推薦領域存在的問題以及社會化標注系統中個性化信息推薦多維度融合與優化模型的研究框架及其內容,本文提出構建社會化標注系統中個性化信息推薦多維度融合與優化模型。
首先,以個性化信息推薦領域存在的問題為導向,將基于圖論(社會網絡關系)、基于協同過濾和基于內容(主題)的個性化信息推薦方法相融合,從而發揮社會網絡分析的宏觀作用,協同過濾算法的中觀作用以及本體語義分析的微觀作用,彼此之間相互融合,以解決個性化信息推薦過程中用戶“冷啟動”的問題。
其次,在構建社會化標注系統中個性化信息推薦多維度融合與優化模型的過程中需要著重考慮:在時間方面,需要考慮在社會化標注系統自組織演化的過程中,用戶信息行為以及用戶信息需求和偏好所發生的變化;在空間方面,需要考慮用戶、資源、標簽三者在空間某一點進行統一的問題,即如何構建用戶的個性化信息點。由此,使得所構建的社會化標注系統中個性化信息推薦多維度融合模型,能夠解決個性化信息推薦過程中用戶偏好漂移的問題。
再次,在實現將3種個性化信息推薦方法深度融合的過程中,需要發現社會化標注系統在自組織演化過程中的平衡極點。社會化標注系統在有序度最高的時候,平衡達到極點,在此時對社會化標注系統進行用戶行為分析、資源相似性分析以及用戶信息需求分析,將會準確地分析出用戶的行為特征和偏好特征,準確地實現資源與偏好相匹配,使得個性化信息推薦的準確率更高。
最后,對個性化信息推薦多維度融合模型進行靜態優化與動態優化,既要體現出多維度融合模型的運行機制,展示其結構特征——功能要素、角色要素、組成要素,以及各要素之間的內部本質聯系;又要體現出多維度融合的過程和個性化信息推薦的過程,遵循社會化標注系統自組織演化的過程,從而揭示出構成個性化信息推薦多維度融合模型中各要素之間的動態變化。同時,結合用戶標注過程中的偏好漂移、信息推薦的目標要求、融合模型的運行機制等因素,從而解決冪律分布問題,突破用戶“冷啟動”和用戶偏好漂移的問題。
綜上所述,本文所構建的社會化標注系統中個性化信息推薦多維度融合與優化模型,具體如圖2所示。
從中可以看出,社會化標注系統中個性化信息推薦多維度融合與優化模型主要包括以下幾個方面內容:
1)通過對目標用戶的歷史行為信息進行深度挖掘,根據基于資源主題的內容推薦方法形成資源主題模型,從中獲取用戶的歷史偏好;此外,對資源主題模型進行資源相似性分析,從中獲取用戶的當前偏好。利用基于資源主題的內容推薦方法,結合用戶的歷史偏好和當前偏好,從而有效解決個性化信息推薦過程中用戶“冷啟動”的問題。
2)通過對目標用戶的歷史行為信息進行深度挖掘,根據基于用戶行為的協同過濾推薦方法形成用戶偏好模型,同時進行用戶相似性計算,找出相似用戶群,從中獲取用戶的潛在偏好。利用基于用戶行為的協同過濾推薦方法,結合用戶的潛在偏好,從而有效解決個性化信息推薦過程中數據稀疏的問題。
3)將目標用戶的社會網絡關系中的社會化行為及其所產生的社會關系網絡引入信息推薦之中,根據基于用戶關系的社會化推薦方法,對用戶群、資源群和標簽群進行深度挖掘,找出相應的用戶子群和資源子群,從中獲取用戶的潛在偏好。利用基于用戶關系的社會化推薦方法,結合用戶的潛在偏好,從而有效解決個性化信息推薦過程中數據稀疏的問題。
4)結合用戶的歷史偏好、當前偏好以及潛在偏好,基于效用知識理論進行用戶偏好的融合與優化,在以用戶心理認知為基礎、用戶所處情境為條件以及信息發布時間與當前之間的差值小于某個閾值、在特定空間范圍之內等優化因素的作用下,形成推薦資源列表并且對目標用戶開展個性化信息推薦,從而有效解決個性化信息推薦過程中用戶偏好漂移的問題,最終實現更加精準的個性化信息推薦。
4結語
鑒于當前關于社會化標注系統中個性化信息推薦過程中所存在的主要問題:即用戶“冷啟動”問題、數據稀疏性問題以及用戶偏好漂移問題,本文深入探討了社會標注系統中個性化信息推薦多維度融合與優化模型研究的總體框架并且構建了社會標注系統中個性化信息推薦多維度融合與優化模型。
利用本文所提出的社會化標注系統中個性化信息推薦多維度融合與優化模型,能夠有效解決個性化信息推薦過程中所存在的問題,不僅在一定程度上豐富了個性化信息推薦的理論體系,而且也將在一定程度上拓展了個性化信息推薦的方法,從而實現在大數據環境下,為用戶提供更加精準的個性化信息,為信息資源的有效開發與利用提供借鑒意義。