999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

優(yōu)先聚合運(yùn)算:用戶需求信息檢索的優(yōu)化

2019-09-10 06:32:32蔣大平
綏化學(xué)院學(xué)報(bào) 2019年8期
關(guān)鍵詞:信息檢索滿意度標(biāo)準(zhǔn)

蔣大平

(綏化學(xué)院圖書館 黑龍江綏化 152061)

Web上的充斥著大量信息,我們急需一個(gè)有效的信息系統(tǒng),能夠定位和檢索與用戶興趣相關(guān)的信息。而相關(guān)性評(píng)價(jià)通?;诙鄠€(gè)標(biāo)準(zhǔn)的評(píng)價(jià),也就是相關(guān)性維度,旨在捕獲所考慮的文檔或文檔上下文的不同方面或?qū)傩裕?]。相關(guān)性維度應(yīng)估計(jì)文檔對(duì)于用戶的查詢效用,例如,搜索引擎中頁(yè)面熱度概念有效利用了文檔相關(guān)性評(píng)估的評(píng)價(jià)標(biāo)準(zhǔn)。具體而言,與每個(gè)檢索到的文檔相關(guān)聯(lián)的總體相關(guān)性的得分計(jì)算,是基于表示評(píng)價(jià)標(biāo)準(zhǔn)滿意度的若干得分的計(jì)算。作為直接結(jié)果,需要將與單個(gè)標(biāo)準(zhǔn)評(píng)估相關(guān)的得分聚合為表示總體相關(guān)性估計(jì)的總體得分。盡管這個(gè)聚合步驟在文檔的最終排名中起著重要的作用,但在一些研究中,并沒有引起應(yīng)有的重視。

傳統(tǒng)的平均聚合算子是完全補(bǔ)償?shù)?,即缺乏滿意度評(píng)價(jià)標(biāo)準(zhǔn),可以通過(guò)另一個(gè)剩余滿足來(lái)補(bǔ)償[2]。這種性質(zhì)在許多實(shí)際應(yīng)用中并不現(xiàn)實(shí),特別是在信息檢索(IR)領(lǐng)域。

為了說(shuō)明和評(píng)估優(yōu)先級(jí)聚合算子,我們使用一個(gè)信息檢索個(gè)性化設(shè)置,信息檢索IR 的個(gè)性化設(shè)置使用用戶興趣的正式表示即用戶資料,來(lái)評(píng)估信息檢索相關(guān)性與用戶查詢的關(guān)系。這種方式特別有效,如果用戶經(jīng)常公式化他的個(gè)人資料中固有的興趣查詢,搜索個(gè)性化就能戰(zhàn)勝傳統(tǒng)檢索方法,這種方法不考慮用戶的背景和檢索目的,用相同的檢索表達(dá)式,面對(duì)不同的用戶產(chǎn)生相同的檢索結(jié)果。近年來(lái),越來(lái)越多的研究致力于使信息檢索技術(shù)盡可能地利用上下文因素,以便為特定用戶定制搜索結(jié)果[3]。

一、優(yōu)先級(jí)多準(zhǔn)則聚合

在多準(zhǔn)則決策設(shè)置中,考慮多維標(biāo)準(zhǔn)之間優(yōu)先關(guān)系是典型的問(wèn)題。在缺乏更高優(yōu)先級(jí)標(biāo)準(zhǔn)滿意度的情況下,不可能用較低優(yōu)先級(jí)的標(biāo)準(zhǔn)滿意度來(lái)補(bǔ)償。我們給出下面一個(gè)簡(jiǎn)單的現(xiàn)實(shí)生活中的例子,對(duì)其進(jìn)行解釋。

讓假設(shè)李女士正在尋找件羽絨服。她的選擇基于兩種標(biāo)準(zhǔn)。第一個(gè)標(biāo)準(zhǔn)是“保暖”,第二標(biāo)準(zhǔn)是“不貴”。對(duì)李女士來(lái)說(shuō),更重要的是保暖,而不是便宜。因此,他想買一件首先是保暖的羽絨服,然后,如果可能的話便宜一些。我們可以考慮兩種情況。

a如果李女士沒有找到任何便宜的保暖羽絨服,他可以買到保暖昂貴的羽絨服(因此,廉價(jià)標(biāo)準(zhǔn)的不滿足可以在某種程度上通過(guò)保暖標(biāo)準(zhǔn)的滿足來(lái)補(bǔ)償)。

b李女士沒有多少錢。她仍然認(rèn)為保暖比成本更重要,然而,她負(fù)擔(dān)不起巨額費(fèi)用。在這種情況下,李女士首先會(huì)找一件比較保暖又便宜的羽絨服。因此,在這種情況下,廉價(jià)標(biāo)準(zhǔn)的不滿足不能通過(guò)保暖標(biāo)準(zhǔn)的滿足來(lái)補(bǔ)償。

要注意到,在這兩種情況下,先需要一個(gè)優(yōu)先聚合算子,然而,對(duì)于第一個(gè)合適的算子不同于對(duì)于第二種情況合適的算子。與相對(duì)于第一種情況,第二種情況的是,羽絨服是保暖的,但不夠便宜,李女士不會(huì)考慮;相反,相對(duì)于第二種情況第一種情況是,一件便宜但不保暖的羽絨服不會(huì)被考慮,因?yàn)楸E亲钪匾臏?zhǔn)則。明顯看到,這個(gè)問(wèn)題是一個(gè)多準(zhǔn)則決策問(wèn)題,從現(xiàn)實(shí)生活實(shí)例到信息檢索語(yǔ)境,所考慮的標(biāo)準(zhǔn)是不同的關(guān)聯(lián)維度。

二、優(yōu)先聚合運(yùn)算符

這里涉及兩個(gè)優(yōu)先聚合運(yùn)算符(‘score’運(yùn)算符和‘a(chǎn)nd’運(yùn)算符),于2009年由佩雷拉等人首次提出,主要是將所提出的算子應(yīng)用加權(quán),聚合中與所考慮的標(biāo)準(zhǔn)即關(guān)聯(lián)性維數(shù)相關(guān)的重要性權(quán)值基于指定的優(yōu)先級(jí)順序。這意味著與標(biāo)準(zhǔn)相關(guān)的權(quán)重取決于更高的滿意度[4]。

(一)問(wèn)題表征。

首先,假設(shè)C 集合是評(píng)價(jià)標(biāo)準(zhǔn)集合,有n 個(gè)評(píng)價(jià)標(biāo)準(zhǔn)組成,即C={C1,C2,…,Cn},

其中,Ci表示對(duì)第i個(gè)標(biāo)準(zhǔn)的評(píng)價(jià)函數(shù)。

然后,用D 表示文件集合,d∈D 表示文件元素。聚合函數(shù)F用于計(jì)算文件d的對(duì)于給定標(biāo)準(zhǔn)的總評(píng)分。

Score F(C1(d),C2(d),…,Cn(d))=RSV(d)

這意味著通過(guò)考慮同一組標(biāo)準(zhǔn),對(duì)于不同的用戶,給定文檔查詢的相關(guān)性評(píng)估,可能會(huì)產(chǎn)生不同的分?jǐn)?shù)(不同的RSV)。并且對(duì)于同一用戶具有不同搜索意圖的檢索也會(huì)產(chǎn)生不同的分?jǐn)?shù)。這是因?yàn)闃?biāo)準(zhǔn)的優(yōu)先級(jí)順序是用戶依賴的,因此,要對(duì)每個(gè)標(biāo)準(zhǔn)賦予不同的重要性權(quán)值,使得不同的用戶有不同的標(biāo)準(zhǔn)優(yōu)先級(jí)排序,盡可能做到對(duì)于同一篇文件不同的用戶使用不同的重要性權(quán)值[5]。

這里,選擇用C1表示最重要標(biāo)準(zhǔn),用Cn表示最不重要的標(biāo)準(zhǔn),假設(shè)Ci重要性優(yōu)先于Cj,i<j。假設(shè)序列“C0,C1,C2,…,Cn”被看做是用戶定義的標(biāo)準(zhǔn)序列,對(duì)于用戶來(lái)說(shuō),C0是最重要的條件,Cn是最不重要的條件。定義的計(jì)算與每個(gè)準(zhǔn)則Cj相關(guān)聯(lián)的權(quán)重?cái)?shù)值的方法既依賴于文檔的滿意度又依賴于用戶興趣。它實(shí)際上首先取決于用戶表達(dá)的標(biāo)準(zhǔn)偏好順序,并且還取決于文檔對(duì)標(biāo)準(zhǔn)Cj-1的滿意度,Cj-1的權(quán)值。

假設(shè)對(duì)于文件d,標(biāo)準(zhǔn)Ci的重要性權(quán)值λi∈[0,1]。對(duì)不同的用戶,任意的文件d,設(shè)λ1=1。Ci,i∈[2,n]。λi=λi-1·Ci-1(d)。Ci-1(d)是由文件d確定的標(biāo)準(zhǔn)Ci-1的滿意度。λi-1是標(biāo)準(zhǔn)Ci-1的重要性權(quán)值。

(二)優(yōu)先得分模型。即給出“score”優(yōu)先聚合算子Fs的表達(dá)式和性質(zhì)。這個(gè)聚合算子允許從多個(gè)標(biāo)準(zhǔn)評(píng)價(jià)中計(jì)算總體得分,其中每個(gè)標(biāo)準(zhǔn)的權(quán)重取決于滿意度,在最重要的標(biāo)準(zhǔn)上滿意度越高,權(quán)重越高。更重要的標(biāo)準(zhǔn)是,一個(gè)不太重要的標(biāo)準(zhǔn)的滿意度越大,對(duì)總成績(jī)的影響越大。

(三)“and”算子。2009年由Pereira等人提出的優(yōu)先聚合算子“and”。此運(yùn)算符允許建模,總體滿意度強(qiáng)烈地依賴于最不滿意標(biāo)準(zhǔn)的滿意度[6]。這種算子的與傳統(tǒng)的“and”算子不同。它的特征在于考慮最不重要準(zhǔn)則對(duì)用戶的滿足程度。如果它根本不重要,則在聚合過(guò)程中不應(yīng)該考慮它的滿意度,而如果它是用戶最重要的標(biāo)準(zhǔn),則只考慮它的滿意度。標(biāo)準(zhǔn)越不重要,代表整體滿意度的機(jī)會(huì)就越低。

聚合算子算法:

RSVa(d)=Fa(C1(d),C2(d),…,Cn(d))=min({C1(d),C2(d),…,Cn(d)})

對(duì)于上例中,設(shè)C1(d)代表“保暖”,C2(d)代表“不貴”,C1(d)=0.9,C2(d)=0.2,λ1=1,λ2=0.9。

RSVs(d)=λ1·C1(d)+λ2·C2(d)=0.9+0.18=1.08

RSVa(d)=min({C1(d),C2(d)})=min(0.91+0.180.9)=0.213

RSVs(d)∈[0,2]優(yōu)于RSVa(d)∈[0,1]的結(jié)果。

三、相關(guān)標(biāo)準(zhǔn)的優(yōu)先級(jí)排序

評(píng)估信息檢索算法有效性的傳統(tǒng)方法是基于Cranfield范式的,該范式允許所謂的基于實(shí)驗(yàn)室的評(píng)估。實(shí)際上,當(dāng)應(yīng)用優(yōu)先級(jí)聚合策略時(shí),根據(jù)所采用的依賴于用戶的優(yōu)先級(jí)化方案,針對(duì)相同查詢?cè)u(píng)估的相同文檔可以產(chǎn)生不同的評(píng)估分?jǐn)?shù)[7]。

相關(guān)標(biāo)準(zhǔn)的優(yōu)先級(jí)順序取決于用戶的搜索意圖。為了進(jìn)行有意義的評(píng)估,基于相關(guān)性維度的語(yǔ)義,我們識(shí)別出與不同的搜索意圖相對(duì)應(yīng)的三個(gè)用戶類別,在所考慮的相關(guān)性維度上歸納出三個(gè)不同的優(yōu)先級(jí)順序,所識(shí)別的類別構(gòu)成了需要考慮到評(píng)價(jià)目標(biāo)的評(píng)價(jià)情景[8]。

第一個(gè)評(píng)估場(chǎng)景,主要考慮當(dāng)用戶制定僅關(guān)注他/她的興趣的查詢時(shí)的情況;在這種情況下,假設(shè)用戶旨在定位首先與他/她的興趣相關(guān)的文檔,同時(shí)要求搜索的文檔do不要關(guān)注除了查詢所表示的其他主題之外的其他主題。

比如,假設(shè)用戶正在尋找關(guān)于“金”的文檔,他/她感興趣的是化學(xué)而不是經(jīng)濟(jì)學(xué)。這意味著用戶正在查找“金”作為化學(xué)元素的文檔,而不是“金”作為存儲(chǔ)的價(jià)值。根據(jù)這個(gè)搜索場(chǎng)景,繼續(xù)識(shí)別第一個(gè)用戶類別,我們稱之為“覆蓋搜索器”。使用該用戶類別,我們將以下優(yōu)先級(jí)順序與四個(gè)考慮的關(guān)聯(lián)維度關(guān)聯(lián):

coverage appropriateness aboutness reliability

很重要的一點(diǎn)是,稍微不同的優(yōu)先級(jí)順序可以與這個(gè)用戶類別相關(guān)聯(lián),以及與以下兩個(gè)用戶類別一起指定。

第二種情況,當(dāng)用戶的意圖是找到文件,完全適合他/她的興趣。我們將此第二用戶命名為“適當(dāng)性搜索者”,我們認(rèn)為它在四種標(biāo)準(zhǔn)中處于最高優(yōu)先級(jí)。

appropriateness aboutness coverage reliability;

我們介紹的第三個(gè)用戶類別是指優(yōu)先考慮檢索到的文檔的信息源的可靠性的用戶;我們稱屬于該類別的用戶是謹(jǐn)慎的;這些用戶給予可靠性標(biāo)準(zhǔn)比其他標(biāo)準(zhǔn)更大的優(yōu)先級(jí)。使用這個(gè)用戶類別,我們將以下優(yōu)先級(jí)順序與四個(gè)考慮的關(guān)聯(lián)維度關(guān)聯(lián)起來(lái)。

reliability aboutness appropriateness coverage

結(jié)論

不同類型的用戶,具有不同的搜索意圖。優(yōu)先排序聚合方案特點(diǎn)是,對(duì)于相同的查詢和相同的用戶,可以根據(jù)相關(guān)維度的不同優(yōu)先級(jí)順序,獲得不同的文件排序。本文提出的聚合模型是通用的,因此可以應(yīng)用于任何相關(guān)維度的集合。實(shí)例證明,優(yōu)先聚合算子的有效性。優(yōu)先級(jí)“score”算子塑造了一種情況,不太重要標(biāo)準(zhǔn)的權(quán)值與比較重要標(biāo)準(zhǔn)的滿意度成比例。評(píng)估實(shí)驗(yàn)表明,優(yōu)先聚合算子“score”,符允許當(dāng)用戶制定與興趣相關(guān)的查詢時(shí),以及當(dāng)用戶沒有興趣或制定與用戶興趣無(wú)關(guān)的查詢時(shí),改變與用戶興趣相關(guān)的文檔優(yōu)先級(jí)排序。文檔的排序類似于使用平均算子獲得的排序[9]。而優(yōu)先聚合算子“和”的特性也是它與傳統(tǒng)的“和”算子的區(qū)別,即最不滿意標(biāo)準(zhǔn)程度被考慮在總體滿意度中,并且該程度取決于它的滿意度和對(duì)用戶的重要性。該模型適用于當(dāng)每個(gè)標(biāo)準(zhǔn)是必不可少的,并且在不影響用戶興趣目的情況下不能丟棄任何需求時(shí),以及根據(jù)這些需求處理用戶偏好順序時(shí),改進(jìn)文檔的排序。所執(zhí)行的評(píng)估表明,當(dāng)用戶制定與興趣相關(guān)的查詢時(shí),所提出的操作符提高了與用戶興趣相關(guān)的文檔的排序,否則該操作符不適合。所提出的算子的優(yōu)點(diǎn)是,它們?cè)试S以簡(jiǎn)單的方式計(jì)算標(biāo)準(zhǔn)的權(quán)重。

猜你喜歡
信息檢索滿意度標(biāo)準(zhǔn)
多感謝,生活滿意度高
2022 年3 月實(shí)施的工程建設(shè)標(biāo)準(zhǔn)
16城市公共服務(wù)滿意度排行
小康(2021年7期)2021-03-15 05:29:03
淺談如何提升脫貧攻堅(jiān)滿意度
活力(2019年19期)2020-01-06 07:34:38
明天村里調(diào)查滿意度
雜文月刊(2019年15期)2019-09-26 00:53:54
忠誠(chéng)的標(biāo)準(zhǔn)
美還是丑?
醫(yī)學(xué)期刊編輯中文獻(xiàn)信息檢索的應(yīng)用
新聞傳播(2016年18期)2016-07-19 10:12:06
一家之言:新標(biāo)準(zhǔn)將解決快遞業(yè)“成長(zhǎng)中的煩惱”
專用汽車(2016年4期)2016-03-01 04:13:43
基于神經(jīng)網(wǎng)絡(luò)的個(gè)性化信息檢索模型研究
主站蜘蛛池模板: 亚洲欧洲综合| 久久久久中文字幕精品视频| 99国产精品一区二区| 毛片免费视频| 四虎永久免费网站| 国产午夜小视频| 免费Aⅴ片在线观看蜜芽Tⅴ| 色综合日本| 四虎精品国产AV二区| 午夜电影在线观看国产1区| www.国产福利| 亚洲天堂视频网| 国产成人精品综合| 91色国产在线| 婷婷丁香在线观看| 九九九精品成人免费视频7| 欧美视频二区| 中文字幕在线视频免费| 区国产精品搜索视频| 小说 亚洲 无码 精品| 成人伊人色一区二区三区| 亚洲无码37.| 女人一级毛片| 久久久久亚洲精品成人网 | 91亚洲精品第一| 国产精品xxx| 欧美综合一区二区三区| 免费A级毛片无码免费视频| 91青青在线视频| 国产中文一区二区苍井空| 宅男噜噜噜66国产在线观看| 蜜芽国产尤物av尤物在线看| 熟妇人妻无乱码中文字幕真矢织江 | 久久久久久国产精品mv| 国产国语一级毛片在线视频| 国产精品久久久久久久久久98| 久久香蕉国产线看观看亚洲片| 在线国产你懂的| 欧美劲爆第一页| 在线观看国产小视频| 国产精品人人做人人爽人人添| 欧美性猛交一区二区三区| 欧洲一区二区三区无码| 综合亚洲网| 四虎国产精品永久一区| 久久国产成人精品国产成人亚洲 | 91精品啪在线观看国产91| 91成人精品视频| 思思99思思久久最新精品| 99热在线只有精品| 成人欧美日韩| 中国精品自拍| 97免费在线观看视频| 国产亚洲欧美日本一二三本道| 欧美日韩国产高清一区二区三区| 亚洲一区二区三区香蕉| 88国产经典欧美一区二区三区| 国产亚洲欧美另类一区二区| 欧洲成人在线观看| 日本a级免费| 欧美爱爱网| 欧美中文字幕第一页线路一| 国内精品手机在线观看视频| 久久人妻xunleige无码| 美女高潮全身流白浆福利区| 亚洲永久免费网站| 秋霞国产在线| 国模私拍一区二区| av一区二区无码在线| 欧美激情视频一区二区三区免费| 国产欧美专区在线观看| 亚洲男女在线| 国产男人天堂| 91网红精品在线观看| 亚洲永久色| 2020国产精品视频| 国产主播在线观看| 亚洲一区二区无码视频| 一级毛片免费不卡在线| 操操操综合网| 99re66精品视频在线观看| 国产精品自在线拍国产电影|