999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于領域本體的個性化推薦在健康系統中的研究

2010-03-26 01:47:32佘名高張照亮胡錦紅
電子設計工程 2010年11期
關鍵詞:概念用戶

佘名高,張照亮,胡錦紅

(武漢理工大學 計算機科學技術學院,湖北 武漢 430070)

隨著互聯網的發展和網絡信息的增加,為用戶提供個性化的服務以便獲取更準確的信息已成為焦點。在網絡環境下,個性化服務[1-2]是一種網絡信息服務的方式,這種服務方式的實現主要是根據用戶設定,借助于計算機及網絡技術,對信息資源進行收集、整理和分類,向用戶提供和推薦相關信息,以滿足用戶對信息的需求。在個性化推薦中,協同過濾是當前應用最成功的技術。

在基于項目的協同過濾推薦中,為了產生對目標用戶的推薦,需要搜索最近鄰居,此時項目之間相似性的計算成為關鍵。系統開始時,由于參與的用戶和用戶評分項目很少導致用戶評分項的交集很小,傳統的相似性計算方式在這種情況下很難找到最近鄰進行推薦,隨著時間的推移,還容易產生數據稀疏問題和“冷啟動”現象,推薦質量大大下降。

隨著網絡的發展,計算機輔助診斷成為越來越重要的應用技術,對于一種疾病,可以在互聯網上找到包括運動療法、中醫理療、營養配餐等數以千計的治療方法,為用戶提供個性化的服務在健康系統中也有所應用。隨著醫學的發展,傳統相似性度量不足和新項目的冷啟動問題也可能發生,因此引入了本體,構建用戶興趣本體,將項目的語義相似性和用戶相似性結合,這種基于領域本體的個性化推薦算法在一定程度上緩解了數據稀疏問題和冷啟動問題,將這種算法應用到某健康系統中進行分析,已取得較好的推薦效果。

1 本 體

“Ontology”是指哲學領域的本體論。在哲學中“Ontology”是一個存在的系統化解釋,用于描述事物的本質。而在計算機領域是用于知識表示、知識共享和重用,“ontology”表示,翻譯為本體。直觀地講,本體是一個實體,是對某一領域應用本體論的方法分析、建模的結果,即把現實世界中的某一領域抽象為一組概念及概念之間的關系。

為了澄清在知識工程領域中本體的概念,美國學者Tom Gruber給出了一個被廣泛接受的定義:本體是一個可共享概念化(Conceptualization)的顯式(Explicit)的規格說明[3]。 這里包含4層含義:

1)“共享”指出本體的主要作用就是領域知識交互,而非為個人所用;

2)“概念化”指出知識的形式化表示的基礎是概念化,領域知識內的對象、概念和其他實體,以及它們之間的關系;

3)“顯式”則表示概念的類型和約束必須直接、無二義地給出,同時是機器可理解的;

4)“規格說明”則要求概念化體系用具體形式進行表達。本體的目的就是建立統一的概念和語義結構,進行相關領域知識的交換。

文獻[4]對本體的作用進行概括,本體作用如下:

1)本體的分析澄清了領域知識的結構,從而為知識表示下基礎。本體可以重用,從而避免重的領域知識分析;

2)統一的術語和概念使知識共享成為可能。本體可將某個或多個特定領域的概念和術語規范化,為該領域或領域之間實際應用提供便利。

2 基于領域本體的個性化推薦

2.1 個性化推薦的一般組成

1)行為記錄模塊 負責記錄能夠體現用戶喜好以及需求的行為,比如購買、下載、評分等。下載和評分這兩種行為表達潛在的喜好程度就不盡相同,完善的行為記錄需要能夠綜合多種不同的用戶行為,處理不同行為的累加;

2)模型分析模塊 實現對用戶行為記錄的分析,采用不同算法建立起模型描述用戶的喜好信息;

3)推薦模塊 通過推薦模塊,實時地從內容集篩選出目標用戶可能會感興趣的內容推薦給用戶。

由上可見,建立一個真正能體現用戶興趣的模型是至關重要的,它對個性化推薦的質量起著非常重要的作用。建立興趣模型所需要的數據一般有2種獲取方式:

1)系統一般使用打分方式,最著名的例如 Movie Lens,這種方式稱為“顯式評分”方法[4],但其收集數據比較困難,用戶通常并不愿意提供這種數據。

2)被認為更有效的方法是“隱式評分”方法,這種方法不需要用戶直接輸入評價數據,而是根據用戶的行為特征由系統代替用戶完成評價。無論采用哪種方式,抽取到的都是一組能表示用戶興趣和需求的關鍵詞,這就涉及到這些詞的組織問題。

在傳統推薦系統中, 用戶興趣描述為:U={(Ci,Wi)|Ci:關鍵詞,Wi:權重(表征用戶興趣高低)},可以看出這種表示方法,用戶興趣用一組羅列的關鍵詞表示,而沒有考慮詞之間內在的聯系,沒有從語義上對信息進行理解,造成了推薦質量的下降。這里根據用戶行為記錄模塊來記錄用戶行為,通過模型分析模塊得到用戶的興趣信息,將用戶的興趣信息與領域本體中的概念進行映射,構建用戶興趣本體,然后進行用戶模式識別,通過推薦模塊產生推薦。由于考慮了詞之間的內在聯系,系統的推薦質量大大提高。

2.2 基于領域本體的領域知識建模

個性化推薦的實現是建立在領域本體上的,在領域本體的構建上,本文借鑒了國外本體工程中七步法的思想,參考了國內外基于敘詞表構建本體的有關思路和方法。領域本體構建步驟如下[5]:

1)確定本體的領域和范圍;2)本體概念體系的構建,包括定義類及類的等級體系、定義類的屬性和創建實例;3)概念的規范化處理;4)利用現有的本體開發工具輔助本體構建,并可直接轉化成相應的本體表示語言的文件格式存儲;5)本體評價和應用。

2.3 基于用戶興趣本體構建的用戶興趣建模

利用領域本體構建用戶興趣本體,通過將用戶的興趣信息與領域本體中的概念進行映射,將用戶的興趣內容轉化為本體概念的形式,并利用這些本體概念構建用戶興趣本體。最后利用構建的用戶興趣本體,進行用戶模式識別。用戶興趣建模過程如圖1所示。

圖1 用戶興趣建模Fig.1 User interests modeling

2.3.1 利用領域本體構建用戶興趣本體

用戶本體是用戶信息的概念化的規格說明[6],它定義了有關用戶概念的各種術語、關系并給出術語的語義。用戶興趣本體主要對用戶興趣進行描述,展示用戶興趣的不同屬性及屬性之間的關系。將用戶興趣信息與領域本體庫進行映射,得到用戶感興趣的領域本體概念集合,進而將用戶興趣用領域本體概念來表述,生成用戶興趣本體。

2.3.2 利用用戶興趣本體發掘用戶興趣模式

利用用戶興趣本體的概念集合,通過概念間的語義關系(主要是上下位類關系和類-實例關系)和鄰接徑度,將用戶興趣劃分為若干個子興趣,從而實現用戶興趣建模。在知識本體的支持下,這種劃分可以迭代進行,理論上可以實現任意詳細程度的用戶興趣描述。

用戶興趣通過本體概念集進行了概念化的、語義層面的描述,然后基于本體中概念鄰接關系,將用戶感興趣的主題概念按鄰接程度進行聚集,最后得到若干個聚集后的向量形成用戶興趣模式。在系統與用戶的交互過程中,用戶的興趣會發生變化和調整,即原有的興趣本體節點權重將逐步衰減,同時新的興趣本體節點不斷增加,因此必須進行用戶興趣的增量更新。

2.4 個性化推薦算法

個性化推薦算法是在收集和分析用戶信息的基礎上,學習用戶的興趣愛好和行為習慣,從而將用戶需要的、感興趣的信息主動推薦給用戶。

利用領域本體的個性化推薦算法:利用Web站點的領域知識計算用戶評價項目之間的相似度,這種相似度更適合人們直觀上的感覺;通過項集合的相似性計算用戶之間的相似性,得到最近鄰進行推薦。

2.4.1 用戶興趣本體相似度計算

在計算用戶興趣本體相似度時,可以與領域本體相聯系,通過計算用戶興趣本體包含的領域本體中的概念之間的相似度,來進一步計算用戶興趣本體相似度。

利用基于網絡距離的方法,計算本體中概念相似度。通過概念相對應的節點之間的距離表示,路徑越短,它們之間越相似,使用這種簡單的邊計數方法是在假定邊距離統一的情況下(例如每條邊的路徑距離為1),Wu和Palmer[6]提出了計算節點c1和c2之間相似度方法:

其中,N1和N2為從c1和c2到它們最近公共祖先節點c3的路徑長度,N3為c3到根節點的路徑長度。

例如,對于用戶興趣本體A和C,如果要計算A中的概念A1與C中的概念c1的相似度,只需確定它們分別所處的節點位置,再利用式 (1)即可算出。

比如,計算表1中,A中apple和C中apple的相似度,N1=N2=1,N3=1,

對于用戶興趣本體 A與B,計算出B中m個概念分別與A中n個概念的相似度值后,求其均值,即是用戶興趣本體B與A的相似度。

用上例中的方法,計算出A與C中各項的相似度,從而得出:

2.4.2 評分項目之間的相似性

設對項i和項j共同評分過的項集合用Uij表示,Ui和Uj表示對項i和項j評分過的用戶集,則評分項目之間的相似性為:

有了評分項目之間相似度的計算方式,可根據用戶評分項的集合計算用戶的相似度。集合之間相似度的計算需要考慮相似的對稱性性質和集合元素個數對相似計算結果的影響。另外,用戶之間的相似度應該滿足以下基本條件:

1)用戶和自身的相似度為1,即滿足自反性;

2)用戶A與 B的相似度應等于B與A的相似度,即滿足對稱性;

3)假設用戶評分項目集合都有n個元素,其中m(m〈n)個項目相同,又假設2個項目的相似度只能是0(不同)或1(相同),那么這兩個用戶的相似度應該是 m/n。

通過在集合的元素之間建立對應的關系來消除集合元素數目的影響并保證計算結果滿足以上的條件。具體方法為:1)首先計算兩個用戶評分項集合的所有項目兩兩間相似度;2)從所有的相似度值中選擇最大的一個,將這個相似度值對應的兩個項目對應起來,并累加該最大值。3)從所有的相似度值中刪去那些已經建立對應關系的項目的相似度值。4)重復上述第2)步和第3)步,直到所有的相似度值都被刪除;5)沒有建立起對應關系的項目與空元素對應;6)求平均相似度(累加和除以對應項目個數),返回。

首先按照相似度建立起兩個集合中項目的一一對應關系,然后計算用戶評分項目集合的相似度:用戶評分項目集合的相似度等于其元素對的相似度的加權平均。因為評分項目集合的元素之間都是平等的,所以所有的權值取相同,那么項目集合的相似度等于其項目對的相似度的算術平均。

2.4.3 產生推薦集

基于領域本體的個性化推薦算法,綜合考慮用戶評分項目之間的語義相似性和用戶的相似性:

式中,simij為混合相似度,sim(i,j)為評分項目的語義相似度,ω為語義相似度的貢獻權值,sim(u,v)為用戶的相似度,1-ω為用戶相似度的貢獻權值。

用戶u對目標項i的預測評分pui可以通過目標項i的最近鄰居集合V對j的評分得到:

3 試驗與分析

個性化推薦系統為用戶提供個性化的服務,應用于醫療領域,在健康系統中也有很大的用途,為臨床診斷、選擇治療方案提供參考。以為用戶提供合理的營養配餐為例進行分析。

3.1 領域本體及用戶興趣本體的構建

手工構建本體的工作量是很大的,通過下面的技術構建領域本體,具體做法是:首先對訓練文本進行預處理,然后構建術語、文本矩陣并對其進行SVD分解得到一組概念和描述每一個概念的一組術語,這些概念之間的關系通過聚類得到。這里以健康系統食物查詢模塊中部分食物的分類為依據,構建其本體形式,如圖2所示。

將用戶興趣信息與領域本體概念進行映射后,得到用戶A、B、C具有相同的興趣模式,其用戶興趣本體信息如表1所示。

圖2 營養配餐食物領域本體模型Fig.2 Domain ontology model of food nutrition catering

表1 用戶興趣本體信息Tab.1 User interest ontology information

3.2 相似性的計算以及推薦結果的產生

抽取幾個用戶和評分項目的信息做簡單的數據舉例,若以B、C為相似用戶向A推薦食物,由式(1)和式(2)計算出用戶興趣本體B與A的相似度為0.125,C與A的相似度為0.125,再由式(3)計算出興趣本體中評分項之間的相似度,由此再計算用戶之間的相似性,B與A的相似度為0.678,C與 A的相似度為 0.769,可以得到推薦概念集合為{apple,rice,hairtail}。

3.3 結果與分析

設計一個基于食物領域本體的個性化推薦系統,依據上述的思路,在健康系統中做初步的實驗性應用,并采用系統數據來進行測試。該系統已有200個用戶對500個食物項目評分,評分值為從1到5的整數,數值越高表明用戶對該食品的興趣度越高。

采用平均絕對誤差MAE作為評測的標準。MAE是常用的評價推薦算法質量的標準,它通過計算用戶實際評分與預測評分之間的偏差衡量預測的準確性,MAE的值越小,推薦的質量越高。

考慮到混合相似度計算中的ω權重參數對MAE[7]的影響,在使用混合相似度算法預測時,找出最優ω值的范圍,權重參數ω從0到1,間隔為0.1。實驗結果如圖3所示,由此得出結論,ω的取值在0.5附近時最優的。

圖3 權重參數ω對推薦精度的影響Fig.3 Weight parameter ω effect on the accuracy of recommended

為了檢驗基于領域本體的個性化推薦算法的性能,本文將傳統的基于內容的協同過濾推薦算法與本本文的算法進行比較,權重參數ω選為0.5,最近鄰居N從20增加到120,間隔為20,實驗結果如圖4所示。

圖4 推薦算法精度-MAE比較Fig.4 Recommendation algorithm precision-comparison of MAE

從實驗結果分析,通過項目語義相似性與用戶相似性的融合,挖掘出項目之間的語義關系,抽取出項目之間的一樣信息,不僅能很好的解決傳統的基于項目的協同過濾的新項目的冷問題以及提高推薦精度,還能進一步說明用戶對特定領域的項目是否感興趣。隨著用戶的增加,特別是具有較高評分項目數用戶的增加,這兩種算法的推薦質量都有明顯的提高。

4 結束語

以領域本體為中介,通過抽取領域本體中概念的語義關系,構建用戶興趣本體并進行用戶興趣建模,通過融合評分項目相似性和用戶相似性,產生用戶的最近鄰居并且得到項目的推薦集合。將本文的方法應用到健康系統中進行初步的實驗分析,實驗結果表明利用領域知識計算相似度可以解決用戶評分項很少數據極端稀疏情況下的系統冷啟動現象,提高系統的推薦質量和精度。

[1] 韓燕.數據挖掘方法和知識發現[J].人工智能及識別技術,2007, 17(1):10-25.HAN Yan.Data mining and knowledge discovery[J].Artificial Intelligence and Identification Technology,2007,17(1):10-25.

[2] 李慶祝,佘玲玲,單光先.數據挖掘及應用[J].現代電子技術,2010(12):28-30.LI Qing-zhu,SHE Ling-ling,SHAN guang-xian.Data mining and its application [J].Modern Electronic Technique,2010(12):28-31.

[3] Chandrasekaran B,Josephson J R,Benjamins V R.What are ontologies,and why do we need them [J].IEEE Intelligent Systems Archive, 1999, 14(1):20-25.

[4] LI Wang,LI Ying-jie.The semantic matching of semantic web services[C].In:IEEE/ACM/KGGI O4, 2004.

[5] 曾子明.電子商務推薦系統與智能談判技術[M].武漢:武漢大學出版社,2008.

[6] 顏端武.面向知識服務的智能推薦系統研究[D].南京:南京理工大學,2007.

[7] 陳健,印鑒.基于影響集的協作過濾推薦算法[J].軟件學報,2007,18(7):1685-1694.CHEN Jian.YIN Jian.A collaborative filtering recommendation algorithm based on influence sets[J].Journal of Software,2007,18(17):1685-1694.

猜你喜歡
概念用戶
Birdie Cup Coffee豐盛里概念店
現代裝飾(2022年1期)2022-04-19 13:47:32
幾樣概念店
現代裝飾(2020年2期)2020-03-03 13:37:44
學習集合概念『四步走』
聚焦集合的概念及應用
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
論間接正犯概念之消解
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 国产一区二区精品高清在线观看| 久热99这里只有精品视频6| 日本午夜三级| 国产经典三级在线| 国产成人一区二区| 日韩亚洲高清一区二区| 国产中文一区a级毛片视频| 国产一级妓女av网站| 午夜性刺激在线观看免费| 国产玖玖视频| 久久精品欧美一区二区| 91精品专区| 91在线视频福利| 国产精品国产三级国产专业不| 国产欧美日韩在线一区| 宅男噜噜噜66国产在线观看| 欧美另类图片视频无弹跳第一页| 亚洲人成在线免费观看| 成人午夜视频在线| 亚洲人网站| 国产靠逼视频| 国产成人艳妇AA视频在线| 97超级碰碰碰碰精品| 在线免费a视频| 亚洲日韩精品伊甸| 在线精品亚洲一区二区古装| 中文字幕天无码久久精品视频免费 | 18禁黄无遮挡免费动漫网站| 国产精品永久在线| 国产免费高清无需播放器| 草草影院国产第一页| 国产人人乐人人爱| 伊人天堂网| 国产成人综合久久精品下载| 国产不卡一级毛片视频| 国产真实二区一区在线亚洲| 广东一级毛片| 欧美有码在线| 在线观看亚洲精品福利片| 亚洲精品大秀视频| 日韩第九页| 国产精品主播| 婷婷激情亚洲| 国产亚洲精品无码专| 欧美有码在线观看| 2024av在线无码中文最新| 欧美国产三级| 99热国产这里只有精品无卡顿" | 国产成人精品一区二区不卡| 国产高清国内精品福利| 香蕉久人久人青草青草| 欧美精品影院| 久久综合亚洲鲁鲁九月天| 亚洲国产91人成在线| 91精品啪在线观看国产60岁| 无码国产伊人| 久久伊人色| 国产精品高清国产三级囯产AV| 亚洲国产看片基地久久1024| 欧美第一页在线| 青青草原偷拍视频| 成年人免费国产视频| 亚洲国产精品VA在线看黑人| 精品国产免费人成在线观看| 亚洲国产成人精品青青草原| a级毛片免费播放| 制服丝袜无码每日更新| 9999在线视频| 亚洲无码精彩视频在线观看| 国产你懂得| 亚洲成人网在线播放| 天天色综网| 免费久久一级欧美特大黄| 日本不卡免费高清视频| 国产无码网站在线观看| 91美女视频在线| 精品国产电影久久九九| 一级高清毛片免费a级高清毛片| 日本免费精品| 91在线精品麻豆欧美在线| 日韩AV手机在线观看蜜芽| 国产农村妇女精品一二区|