999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于貝葉斯網(wǎng)絡(luò)的綜合語義檢索模型

2018-09-26 10:14:36白彥霞
價值工程 2018年25期
關(guān)鍵詞:語義用戶模型

白彥霞

摘要:通過關(guān)鍵詞匹配返回的檢索結(jié)果無法滿足用戶需求。為了解決該問題,提出一種基于貝葉斯網(wǎng)絡(luò)的語義檢索模型,該檢索能夠從語義層面上獲得較高的查準(zhǔn)率,為用戶提供更滿意的檢索結(jié)果。

Abstract: The retrieval results can be returned by keyword matching, which makes the retrieval results can't satisfy user's demand. In order to solve this problem, a semantic retrieval model based on Bayesian network is proposed, which can get high precision from the semantic level,and provide users with more satisfactory retrieval results.

關(guān)鍵詞:貝葉斯網(wǎng)絡(luò);關(guān)鍵詞;語義檢索

Key words: Bayesian network;keyword;semantic retrieval

中圖分類號:TP391.3 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-4311(2018)25-0141-02

0 引言

隨著信息技術(shù)的蓬勃發(fā)展,網(wǎng)絡(luò)資源成指數(shù)級增長,人們已經(jīng)越來越習(xí)慣于在網(wǎng)絡(luò)上檢索自己所需要的各類文檔資源。對于文檔的瀏覽和檢索,傳統(tǒng)的信息檢索技術(shù)只是以關(guān)鍵詞的簡單匹配作為主要手段,語義層面的具體分析無法實現(xiàn)。同時,檢索的文檔信息形式比較單一,未考慮文檔之外的信息關(guān)系,使得檢索效率低下。如果將檢索術(shù)語的同義詞、近義詞、高度相關(guān)詞等考慮進(jìn)來,必然提高查全率和查準(zhǔn)率,因為包含這些詞語的文檔在一定程度上也與用戶的查詢意圖有關(guān)。特別是對于剛剛進(jìn)入某個研究領(lǐng)域的人員,由于知識有限,對相關(guān)知識的認(rèn)識不夠全面,總是希望能從一篇本領(lǐng)域的文檔中找到與之類似的文檔,這些文檔間的近似關(guān)系、關(guān)聯(lián)關(guān)系等就需要在檢索的過程中被考慮進(jìn)來,引導(dǎo)用戶沿著感興趣的文檔找到相似或相關(guān)的文檔,從而幫助用戶快速檢索到目標(biāo)文檔。

貝葉斯網(wǎng)絡(luò)也被稱為信度網(wǎng)絡(luò),具有非常靈活的拓?fù)浣Y(jié)構(gòu),通過節(jié)點來表示術(shù)語之間的條件關(guān)系和語義關(guān)系,為實現(xiàn)語義檢索奠定了基礎(chǔ)。本文以貝葉斯網(wǎng)為基礎(chǔ),結(jié)合簡單貝葉斯網(wǎng)絡(luò)檢索模型關(guān)鍵詞精確匹配的優(yōu)點和兩層節(jié)點的貝葉斯網(wǎng)絡(luò)檢索模型語義擴展的優(yōu)點,提出了一個基于貝葉斯網(wǎng)絡(luò)的綜合語義檢索模型,該模型實現(xiàn)了語義檢索,使信息檢索趨于智能化。

1 模型拓?fù)浣Y(jié)構(gòu)

圖1為基于貝葉斯網(wǎng)絡(luò)的綜合語義檢索模型的拓?fù)浣Y(jié)構(gòu),整個網(wǎng)絡(luò)分為左右兩部分。右側(cè)實線框內(nèi)為簡單貝葉斯網(wǎng)絡(luò)檢索模型,由兩個子網(wǎng)組成:術(shù)語子網(wǎng)和文檔子網(wǎng)。文檔子網(wǎng)由N個文檔節(jié)點構(gòu)成,DSj表示文檔,也表示與其相關(guān)的變量和節(jié)點。左側(cè)虛線框內(nèi)為兩層節(jié)點的貝葉斯網(wǎng)絡(luò)檢索模型,該網(wǎng)絡(luò)是對簡單貝葉斯網(wǎng)絡(luò)檢索模型的擴展,也包括兩個子網(wǎng),其中文檔子網(wǎng)與右側(cè)網(wǎng)絡(luò)中的文檔子網(wǎng)完全一樣,只是文檔用DEj表示,DEj也表示與其相關(guān)的變量和節(jié)點。DSj和DEj是同一個文檔Dj的不同表示。左右兩部分網(wǎng)絡(luò)最大的區(qū)別在于術(shù)語子網(wǎng),在兩層術(shù)語節(jié)點的貝葉斯網(wǎng)絡(luò)中,復(fù)制原始術(shù)語層T中的每個術(shù)語節(jié)點Ti得到術(shù)語節(jié)點T′i,形成一個新術(shù)語層T′,因此兩層節(jié)點的貝葉斯網(wǎng)絡(luò)檢索模型的變量集合 。T′中的術(shù)語變量T′i也是二進(jìn)制的隨機變量,取值集合為 , 和 分別表示“術(shù)語T′i不相關(guān)”、“術(shù)語T′i相關(guān)”。 是N篇文檔組成的集合。

連接兩個術(shù)語層的有向弧的指向:①任意術(shù)語T′i與其本身Ti之間存在由T′i指向Ti的弧;②若術(shù)語Ti與Tj互為同義詞,則存在由T′i指向Tj的弧和由T′j指向Ti的弧。因此,術(shù)語節(jié)點Ti∈T的父節(jié)點集Pa(Ti)合由術(shù)語節(jié)點T′i及Ti的同義詞節(jié)點T′j組成。利用同義詞擴展術(shù)語子網(wǎng),加入模擬術(shù)語節(jié)點間直接關(guān)系的弧,這樣就可以檢索到那些與查詢術(shù)語語義相同或相似的文檔,以此提高檢索性能。

新模型的最下面一層是復(fù)合的文檔層,其中任何一個文檔節(jié)點Dj的父節(jié)點都是由DEj和DSj組成,也就是說通過最終的文檔層將整個網(wǎng)絡(luò)左右兩部分進(jìn)行歸并,進(jìn)一步提高檢索性能。

2 概率分布

在兩層術(shù)語節(jié)點的貝葉斯網(wǎng)絡(luò)檢索中,對于任意根術(shù)語節(jié)點T′i的相關(guān)邊緣概率[1] 定義為 (M表示測試集合中的術(shù)語總數(shù)),不相關(guān)的概率[1]則可以表示為 。已知Ti為任意非根術(shù)語節(jié)點,Pa(Ti)中每個術(shù)語變量取值(相關(guān)或不相關(guān))后的一個組合表示為pa(Ti),則利用一般正則模型的概率函數(shù)[2]可以得到如下表達(dá)式:

其中,vij為權(quán)重,用來反應(yīng)查詢術(shù)語 對術(shù)語Ti的影響力度, 表示只將Pa(Ti)中取值為相關(guān)的術(shù)語的權(quán)重加起來。術(shù)語Ti如果有多個父節(jié)點,權(quán)重vij的定義如(2)式所示:

Ti如果只有一個父節(jié)點T′i,權(quán)重vij=0。公式(2)中 為Ti的父節(jié)點個數(shù),?茁為調(diào)節(jié)權(quán)重影響力度的參數(shù)。該定義可以很好的區(qū)分不同同義詞對查詢術(shù)語的影響力度。

文檔層D中的文檔節(jié)點DSj和DEj的條件概率 和 的計算與簡單貝葉斯網(wǎng)絡(luò)檢索模型中概率計算相同。

3 推理和檢索機制

查詢Q是由用戶所提供的初始查詢,對于簡單貝葉斯網(wǎng)絡(luò)檢索模型,最終計算出每篇文檔DSj與查詢Q的相關(guān)度 [2];對于兩層節(jié)點的貝葉斯網(wǎng)絡(luò)檢索模型,最終計算出每篇文檔DEj與查詢Q 的相關(guān)度 。基于新模型的檢索過程,最終要計算出每篇文檔Dj與查詢Q的相關(guān)度, 由 和 共同決定,即新模型的檢索結(jié)果是對兩層節(jié)點的貝葉斯網(wǎng)絡(luò)檢索模型和簡單貝葉斯網(wǎng)絡(luò)檢索模型的檢索結(jié)果的歸并。

在簡單貝葉斯網(wǎng)絡(luò)檢索模型中,不包含查詢術(shù)語Q的文檔,即使?jié)M足用戶的檢索需求,但是其相關(guān)度 的值一般都非常小,所以這類文檔一般不會提供給用戶;與之相反,包含查詢術(shù)語Q中的部分或全部術(shù)語的文檔,其相關(guān)度 的值一般都比較大,從理論上講一般可以滿足用戶的檢索需求。此外,如果文檔中包含查詢Q的同義詞、近義詞或相關(guān)詞,這類文檔與用戶的檢索需要也具有一定的關(guān)聯(lián)。所以要按照 和 綜合之后的相關(guān)度對文檔排序,將相關(guān)度大于某個值的文檔進(jìn)行遞減排序,最終呈現(xiàn)給用戶。

用戶把查詢Q提交給檢索系統(tǒng)時,檢索過程開始,檢索過程的執(zhí)行過程主要是歸并簡單模型的檢索過程和兩層術(shù)語節(jié)點模型的檢索過程。其相應(yīng)的檢索推理過程如下:

①利用一般正則模型的概率函數(shù)[1]估計兩層術(shù)語節(jié)點的貝葉斯網(wǎng)絡(luò)中術(shù)語層T中任意術(shù)語Ti的后驗概率 :

因為術(shù)語層中的術(shù)語相互邊緣獨立,所以 時,則(3)式中的 ,否則 。注意,對于只有一個父節(jié)點 的術(shù)語Ti而言 ,若 ,由(3)式可得 ,否則 。若術(shù)語Ti有多個父節(jié)點,vij用公式(2)代替,則 為:

公式(4)考慮了Ti的所有父節(jié)點對其產(chǎn)生的影響。

②計算文檔DEj的最終后驗概率 :

③基于以上推理并利用一般正則模型的概率函數(shù)[1]對文檔Dj的最終后驗概率 估計如下:

其中,usj和uEj為衡量文檔DSj和DEj分別在查詢Q作用下對Dj相關(guān)度影響程度的權(quán)重,定義為

④按照文檔相關(guān)度進(jìn)行排序,將相關(guān)度大于某個值的文檔提交給用戶,完成檢索過程。

4 結(jié)束語

語義檢索是未來信息檢索領(lǐng)域的一個發(fā)展趨勢。本文將貝葉斯網(wǎng)絡(luò)和語義相結(jié)合,提出基于貝葉斯網(wǎng)絡(luò)的語義檢索模型,該模型能夠根據(jù)詞語的含義檢索到與用戶需求相關(guān)的文檔,擴大了檢索的范圍,且查全率和查準(zhǔn)率方面都得到了提高,實現(xiàn)了智能語義檢索,檢索性能更加優(yōu)越。

參考文獻(xiàn):

[1]LUIS M. DE CAMPOS, JUAN M. FERNANDEZ-LUNA, JUAN F. HUETE. The BNR model: foundations and performance of a Bayesian network-based retrieval model [J]. International Journal of Approximate Reasoning. 2003, 34(2-3): 265-285.

[2]SILVIA ACID, LUIS M. DE CAMPOS, JUAN M. FERNANDEZ-LUNA, et al. An information retrieval model based on simple Bayesian networks [J]. International Journal of Intelligent Systems. 2003, 18(2): 251-265.

猜你喜歡
語義用戶模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
語言與語義
關(guān)注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
3D打印中的模型分割與打包
關(guān)注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
“上”與“下”語義的不對稱性及其認(rèn)知闡釋
關(guān)注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
認(rèn)知范疇模糊與語義模糊
主站蜘蛛池模板: 国产成人精品高清不卡在线| 亚洲天堂成人在线观看| 98超碰在线观看| 好吊日免费视频| 免费高清a毛片| 国产www网站| 亚洲成人精品在线| 免费欧美一级| 香蕉久久永久视频| 日韩美女福利视频| 久久精品人妻中文视频| 亚洲天堂区| a在线亚洲男人的天堂试看| 国产人前露出系列视频| 国产高清在线精品一区二区三区| 亚瑟天堂久久一区二区影院| 在线观看视频99| 欧美日韩第三页| 亚洲精品麻豆| 欧美日韩导航| 成人在线天堂| 国产杨幂丝袜av在线播放| 国产国产人成免费视频77777| 综合天天色| 国产亚洲日韩av在线| 免费a在线观看播放| 亚洲精品手机在线| 午夜视频在线观看区二区| 中文字幕无码av专区久久| 9啪在线视频| 色AV色 综合网站| 香蕉国产精品视频| 狠狠v日韩v欧美v| 18禁影院亚洲专区| 亚洲女同一区二区| 高清欧美性猛交XXXX黑人猛交 | 成人蜜桃网| 麻豆精品在线视频| 亚洲床戏一区| 草逼视频国产| 18禁高潮出水呻吟娇喘蜜芽| 无码日韩视频| 欧美亚洲综合免费精品高清在线观看| 亚洲精品动漫| 亚洲精选无码久久久| 亚洲成人在线免费观看| 久久中文字幕2021精品| 97在线观看视频免费| 国产女人喷水视频| 日韩亚洲高清一区二区| 久久综合伊人 六十路| 欧美午夜在线观看| 免费看a毛片| 国产福利微拍精品一区二区| 亚洲美女久久| 试看120秒男女啪啪免费| 乱人伦视频中文字幕在线| 99久久人妻精品免费二区| 亚洲免费毛片| 欧美无专区| 亚洲黄色网站视频| 日韩欧美网址| 亚洲 欧美 中文 AⅤ在线视频| 国产乱人乱偷精品视频a人人澡| 99国产精品一区二区| 欧美 亚洲 日韩 国产| 国内精品九九久久久精品| 国产精品网拍在线| 亚洲啪啪网| 一本久道久久综合多人| 看你懂的巨臀中文字幕一区二区| 国产91无码福利在线| 国产精品久久自在自2021| 午夜日b视频| 在线免费看片a| 欧美第一页在线| 久久激情影院| 99青青青精品视频在线| 欧美在线视频不卡| 国产在线无码一区二区三区| 黄色网址手机国内免费在线观看| 欧美午夜理伦三级在线观看|