999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于本體的信息推送技術研究

2018-11-22 02:23:56沈陽理工大學信息科學與工程學院鄒依彤
電子世界 2018年21期
關鍵詞:概念用戶

沈陽理工大學信息科學與工程學院 鄒依彤

引言:文章主要介紹個性化推送服務中的三個方面:本體、用戶興趣模型的建立和最后的推送機制,從而證明方法的有效性。

1 關于本體的建立

1.1 本體

本體是概念的集合,它的五個要素是概念、規則、屬性、關系、實例。

因此,可將本體形式化的表示為:(C,AC,R,AR),其中:C是概念集合,表示的是對象的集合,包括概念的名稱以及概念所表示的“事物”,也就是實例。AC表示的是每一個概念所具有的屬性的集合。屬性包括:名稱、解釋(定義)、值域、數據類型、舉例。如:電影屬性包括:電影代碼、電影片名、上映時間、電影類型、導演、演員、適用對象。而電影類型的屬性又包括:名稱、解釋、數據類型、實例。R是概念之間關系的集合,主要考慮概念之間的父類、子類、以及上下位等層次關系。類之間的關系一方面定義了類的公理:如:等價類、全不同、不相交等客觀關系,另一方面定義了概念之間的相互作用:如:previous、hasPart、isPartof、requires,也可定義概念之間的特殊關系。AR是每個關系的屬性集合。

1.2 本體的構件流程

構建領域本體時,流程如下:1)確定構建領域本體的應用范圍;2)舉出領域內的關鍵術語、概念;3)查找已有的相關本體進行復用;4)定義類并構建層次結構圖;5)定義領域本體的相關規則;6)定義類的屬性;7)創建實例;8)利用后續實驗對本體的構建進行評價及推理檢驗,一旦出現問題,就需要對類的層次結構圖及領域本體規則重新加以改進。

建立好本體模型之后,當用戶想搜索某個主題時,就不僅得到了關于該主題的解釋,而是把和該主題相關的內容、以及該主題的例子都推送給了用戶,實現數據之間的關聯。

2 用戶的興趣模型

主動推送服務的個性化主要體現在針對不同的用戶提供最符合用戶需求和最感興趣的服務列表,主動推送的前提是對用戶的需求進行語義分析,根據用戶的偏好等因素選取并推薦服務,為了對各種類型的網絡資源實現個性化的服務推薦,就必須了解用戶的個性化需求,這就需要獲取、分析用戶信息,建立合適的用戶興趣模型。用戶興趣模型是服務推送的前提,是個性化服務的基礎,直接涉及到服務的質量。

2.1 用戶的興趣模型的建立步驟

首先進行文檔預處理,其目的是抽取特征詞并計算各特征詞的權重,步驟如下:①詞匯分析:刪除一些對文檔校驗無關的詞,并處理一些特殊字符,比如數字、連字符以及字母大小寫等;②詞干提取:即詞根化處理(在中文里就是分詞過程);③訓練文檔聚類;④選取特征詞。

下面介紹這一過程涉及到的幾個重要算法:

步驟②中,傳統的分詞方法是逆向最大匹配分詞法,但是由于該方法只能驗證是否匹配成功,而無法對匹配成功的詞條進行記錄,因此從簡單、減少歧義的角度出發,也便于后續工作,分詞技術采用改進后的逆向最大匹配分詞法,其基本過程為:首先計算出詞表中最長的詞,將其長度記為n,則循環從句首截取長度為n的字符串,讓它去匹配此表中的字符串,如果此表中有候選詞匹配成功,則在文檔中刪除該字符串,并記錄下每一個匹配成功的字符串,循環上述步驟,設定循環結束的條件為句子長度為空,循環結束。當在此表中找不到任何一個詞條與當前候選字符串匹配時,就將該字符串的首字符刪去,用截取后的長度為n-1的字符串去和詞表中的詞條相比對,若仍匹配失敗,則繼續在其頭部刪除一個字符,用長度為n-2的字符串進行匹配,直至匹配成功。例如:若有這樣一個句子:我愛北京天安門,假設詞表中最長的詞有四個字,則n=4,則第一次從句尾抽取長度為4的字符串,顯然“京天安門”存在字符串的耦合,因此在詞表中未查到該詞,匹配失敗。則需刪除字符串首字符得到“天安門”,在詞表中找到該詞條,匹配成功,并將其記錄下來,以此類推,最后句子被切分為由特征詞構成的“我/愛/北京/天安門” 全部切分完畢,生成分詞結果。之后將經過分詞處理后的特征詞,進行權重的計算,從而合理地篩選出有意義的特征詞,減少冗余特征詞對后續工作造成的干擾。

步驟③中,訓練文檔的聚類,這一步驟的目的:一是要足夠體現目標文檔的特征,二是要能將目標文檔與其他類文檔區分開。因此需要對文檔進行特征選擇,常用的特征算法主要有:文檔頻率、信息增益、文本證據權等。其中,應用較廣泛、各方面性能較好的是信息增益算法,該算法描述如下:

其中,P(w)是指詞條w在文檔集中出現的概率;P(ci)為第i類文檔出現的概率,即此類型的文檔數量與全部文檔數量之比;P(Ci /w)為詞條w與ci類文檔共同發生的條件概率。從公式中可看出,雖然考慮某類文檔中某些詞條不出現的概率,具有其合理性,但它對分類造成的影響遠小于文檔中詞條出現的概率,因此,對該公式加以改進,使其具備更好的合理性。由于本公式的第一項對分類結果是強相關的,因此引入文本證據權參數,文本證據權本身是用來增大P(Ci)和P(Ci/w)之間的差異,但是該參數加到該公式中,作用是增大P(ci/ w)和之間的差異,設定w和類別強相關,使第一項式子值增大,提高其權重,從而增大詞條出現的概率對分類造成的影響。改進后的信息增益公式如下:

步驟④:選取特征詞過程中,首先要對特征詞項進行權重的計算,是指通過考察詞條在文檔中出現的次數等相關信息,確定其對文本內容的價值,這里采用歸一化的TF-IDF權重計算法來求取特征詞的權重。該算法的思想是:不同類別的文檔中在特征項的出現頻率上會有很大差異,因此文本分類時特征詞的選擇應該重要參考特征項的頻率信息,得出這樣一個判斷:如果某個候選特征詞在大多數文檔中出現的頻率都較高,那么這樣的特征詞就不如那些只在某些文檔中出現的特征項重要。

2.2 訪問興趣度的計算

首先根據用戶一次訪問中形成的所有特征詞的權重,建立訪問向量,它是用戶一次訪問的形式化表示。將其描述為:

其中,Iim表示用戶第m次訪問的特征詞Fi的權重大小,該向量可由文檔集矩陣D生成,將文檔集矩陣作行映射即得到用戶的訪問向量對于用戶的任意一次訪問,用戶之前的所有訪問歷史由用戶的前n次訪問的訪問向量構成。

經上述處理后,得到的矩陣就是降維后的用戶訪問歷史矩陣,為了方便對后續工作的描述,將該矩陣稱為初始用戶興趣矩陣。

接下來依據特征詞分類規則,采用Rocchio分類器對用戶興趣初始矩陣中的特征詞進行分類,其基本思想是使用訓練集為每個類構造一個原型向量,給定一個類,訓練集中所有屬于這個類的特征詞對應向量的分量用正數表示,所有不屬于這個類的特征詞對應向量的分量用負數表示,然后把所有的向量加起來,得到的和向量就是這個類的原型向量,定義兩個向量的相似度為這兩個向量夾角的余弦,逐一計算訓練集中所有特征詞和原型向量的相似度。

猜你喜歡
概念用戶
Birdie Cup Coffee豐盛里概念店
現代裝飾(2022年1期)2022-04-19 13:47:32
幾樣概念店
現代裝飾(2020年2期)2020-03-03 13:37:44
學習集合概念『四步走』
聚焦集合的概念及應用
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
論間接正犯概念之消解
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 国产精品手机在线播放| 一本久道热中字伊人| 日韩精品中文字幕一区三区| vvvv98国产成人综合青青| V一区无码内射国产| 欧美笫一页| 国产一区二区三区视频| av一区二区三区高清久久| 欧美人与性动交a欧美精品| 国产男女XX00免费观看| 9966国产精品视频| 欧日韩在线不卡视频| 国产在线91在线电影| 成人免费网站久久久| 亚洲另类第一页| 国产在线精彩视频二区| 色婷婷亚洲十月十月色天| 麻豆精品在线视频| 欧美亚洲国产精品第一页| 国模极品一区二区三区| 国产精品无码AⅤ在线观看播放| 久无码久无码av无码| 5555国产在线观看| 在线毛片网站| 亚洲一区二区三区香蕉| 美女无遮挡被啪啪到高潮免费| 亚洲无码一区在线观看| 日韩无码精品人妻| 久久www视频| 日本午夜精品一本在线观看 | 国产超碰一区二区三区| 无码福利日韩神码福利片| 亚洲无码不卡网| 91免费国产高清观看| 亚洲精品国产综合99| 国产又粗又猛又爽| 国产美女视频黄a视频全免费网站| 麻豆精品久久久久久久99蜜桃| 99在线视频免费观看| 亚洲综合极品香蕉久久网| 精品国产免费观看| 九九免费观看全部免费视频| 久久公开视频| 啊嗯不日本网站| 久久亚洲欧美综合| 午夜精品久久久久久久无码软件| 欧美日韩一区二区三区在线视频| 久久伊伊香蕉综合精品| 亚洲欧美另类专区| 欧洲免费精品视频在线| 欧美五月婷婷| 91精品啪在线观看国产60岁| 色网站免费在线观看| 综合久久久久久久综合网| 性欧美久久| 四虎影视国产精品| 国产爽妇精品| 国产精品香蕉在线观看不卡| 国产精品丝袜视频| 国产二级毛片| 玩两个丰满老熟女久久网| 青草视频在线观看国产| 久久精品丝袜| 日韩在线观看网站| 国产视频一区二区在线观看| 国产精品中文免费福利| 免费全部高H视频无码无遮掩| 18禁色诱爆乳网站| 日韩av无码DVD| 国产精品99在线观看| 久久精品国产999大香线焦| 另类综合视频| 爱做久久久久久| 久久精品aⅴ无码中文字幕| 亚洲精品成人片在线观看| 女人18毛片一级毛片在线 | 国产97色在线| 国产精品熟女亚洲AV麻豆| 午夜啪啪网| 国产视频欧美| 亚洲第七页| 欧美日韩在线国产|