999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于自然語言理解的智能化多媒體信息檢索系統研究*

2011-05-17 09:09:10師東生
網絡安全與數據管理 2011年6期
關鍵詞:信息檢索語義用戶

師東生

(內蒙古科技大學信息工程學院,內蒙古 呼和浩特 014010)

信息檢索 IR(Information Retrieval)是指把用戶所需信息按一定的方式組織起來的過程和技術[1]。傳統的方式是用戶通過輸入關鍵字,從大量的文本庫中檢索出滿足需求的文本,來判別文本是否相關并對相關文本進行排序的數學模型。然而隨著網絡的發展,信息資源不再以單一的純文本傳遞為主,越來越多的信息資源以其他多媒體形式存儲,如圖像、視頻、音頻等,針對多媒體信息的檢索近年來逐漸成為多媒體信息檢索領域的研究熱點[2]。參考文獻[3]提出了基于本體信息檢索系統的框架,該系統能夠提取和利用網絡上的語義信息,根據用戶的檢索條件進行推理,進而得出較為準確的結果;參考文獻[4]提出了基于方法聚類的Web服務檢索技術,該技術充分利用Web服務的描述信息生成基于方法層的Web服務建模方法,通過服務類聚算法產生基于方法層的服務檢索模型及其相關算法;參考文獻[5]提出了基于Web的智能信息采集處理系統,采用高效的URL去重和基于模版的下載機制,提高了采集Web資源的性能,并應用自然語言處理技術,對采集信息做智能分類和摘要,在發布上突出個性化的信息服務;參考文獻[6][7]闡述了多媒體信息檢索技術的發展現狀。然而其研究仍存在以下不足:(1)搜索方式單一,信息相關性差;(2)不能準確地把握用戶需求,容易產生搜索歧義;(3)搜索技術不具備智能化,搜索效率不高。為了解決上述問題,提出了基于自然語言理解的智能化多媒體信息檢索系統IMIRSTNLU(Intelligent Multimedia Information Retrieval System based on The Natural Language Understanding)。

1 IMIRSTNLU模型概述

在該模型中,對多媒體信息的檢索效果由詞語分析和搜索服務共同決定,只有對多媒體信息詞語分析準確,搜索服務才能夠快速查找到與多媒體信息資源庫中最貼近的資源,從而提供最貼近用戶需求的多媒體信息。

該系統首先基于多媒體信息的資源分類,即通過對多媒體信息資源的自然理解,結合語言學和語義學學科知識、專家知識及信息資源管理模式等,對多媒體信息資源在語義和知識層面上進行挖掘,訓練成文本、視頻、圖像和音頻四種常見格式的知識庫[8]。

檢索服務開始時,首先對用戶輸入的詞語進行詞語分析,挖掘出與用戶輸入詞語相關度高的輔助語義,并提供給用戶以確定最終檢索語句。開始檢索時,針對詞語分析確定的語義條件,對知識庫中的知識元采取相似度匹配方法,對多媒體信息的所有知識庫啟動二級搜索模式,即精確搜索和模糊搜索相結合。精確搜索某一模式知識庫時,對另一模式知識庫進行模糊搜索,若查找無結果,模糊搜索快速啟動成為精確搜索,同時產生模糊搜索對未搜索知識庫進行搜索。該方法針對用戶輸入詞語進行詞語分析,有效地提高了檢索的準確率;對知識庫的二級模式搜索,有效地提高了檢索的效率。

檢索結束后,對檢索結果進行綜合處理,去除無效鏈接、空鏈接及冗余數據等,依據與用戶檢索詞語關聯度的高低排列知識庫中的資源記錄,用戶也可設定排列模式,如時間等。同時對檢索情況的處理結果,如某一知識元按照用戶檢索習慣,應分類于哪一類知識庫,更新多媒體信息資源的知識庫。與此同時,保存用戶的檢索記錄于用戶資源列表,以便于下次檢索生成更為確切的輔助語義。

2 IMIRSTNLU定義

2.1 基礎定義

定義1 相似度匹配

數據以矩陣的形式存儲于數據庫表中,數據之間存在矩陣的相關性以及存儲距離,因此根據不同形式的數據,其存儲距離的大小不同,可以判定其相似度的大小。設數據信息E與X和Y的相似度為P,則:

其中PE的相似度為式(1)和式(2)的最小值,且 PE∈P[0,tA],t為知識庫閥值。

定義2 貼近度

若PE的相似度值超過閥值tA,選擇與之最貼近的閥值知識庫進行相似度匹配。假設 PE>tA,且 PE<tB<tC<tD,則對知識庫B進行搜索。

定義3詞語分析

對詞語經過解釋處理,形成便于用戶理解、有利于搜索的查詢條件。設詞語分析為M,則它包括M同義詞分析、M近義詞分析、M語義分析和 M歧義分析4個步驟。 設數據信息E,對其進行詞語分析,首先會派生數據信息E關鍵詞語相類同的多種信息,其中篩選與數據信息E的關鍵詞描述意思相同的數據信息E同義,然后對其進行近義詞分析,擴大數據信息 E的查詢范圍,生成數據信息E近義,然后對數據信息E同義和E近義進行語義分析,篩選與搜索詞語相貼近的數據信息E語義,最后經過歧義分析,形成搜索查詢條件。

定義4輔助語義

在詞語分析的基礎上,根據用戶使用習慣、個人興趣愛好、搜索歷史等條件對用戶搜索查詢條件給予一定的參考,幫助其提交合適、完善和更加準確的搜索查詢條件。

3 模型介紹

該系統由以下幾部分組成:(1)人機交互層。當用戶輸入檢索詞語后,系統提供相應的輔助語義提交給用戶參考,用戶確定滿足實際需求的最終檢索條件。信息檢索結束后,搜索內容輸出,顯示給用戶。(2)詞語分析層。當用戶輸入搜索詞語時,系統首先進行詞語分析,對輸入詞語進行數據挖掘,分析與之相關聯的數據信息,進行同義詞分析、近義詞分析、語義分析、歧義分析等,然后將挖掘的與之相關聯的輔助語義推薦給用戶,以供用戶參考。(3)信息檢索層。用戶確定檢索詞語后,根據數據相似度匹配原則,啟動精確搜索和模糊搜索相結合的模式,對多媒體信息資源知識庫中滿足檢索條件的知識庫記錄進行查找。當相似度值確定后,屬于某一知識庫,即對該知識庫啟動精確搜索,同時啟動模糊搜索對其余知識庫進行搜索。如果搜索為空,則返回該搜索沒有答案。否則輸出該知識庫中的信息記錄。(4)搜索處理層。對搜索結果進行綜合處理,去除無效鏈接,重復鏈接等,對信息的關鍵程度進行排序,保存搜索記錄于知識庫,并對知識庫進行更新[9],同時把用戶的搜索習慣添加進用戶習慣資源列表,以供下次搜索參考。通過不斷收集用戶搜索習慣和搜索結果,更新用戶習慣資源列表和知識庫,實現了用戶個性化搜索。通過對搜索詞語的自然理解解釋,對知識庫的動態更新、對搜索的二級模式設置、對輔助語義的記錄等,實現了智能化,為以后快速定位搜索,創造了條件。具體框架圖如圖1所示。

4 算法分析

IMIRSTNLU模型采用自然語言理解技術,結合數據挖掘方法,對用戶搜索的數據信息進行檢索。

知識庫訓練分類算法:

//輔助語義添加到用戶習慣資源列表隊列;算法流程圖如圖2所示。

5 性能分析

由于目前針對多媒體信息檢索研究還沒有公認的數據集,所以本實驗設計的數據庫為文本、音頻、視頻和圖像各10 000份所組成的實驗數據庫。實驗平臺為服務器一臺 IBM3650,基本配置為 2×4 core 2 GB CPU;8 GB內存;500 GB硬盤;操作系統為WIN2003 SERVER標準版;編程環境為VC++2005。由于事先設定了各知識庫的文件數量,所以知識庫的組成已經得知,如表1所示。

表1 IMIRSTNLU系統知識庫組成

對實驗結果的評測,采取信息檢索中常用的三個指標:檢全率 Recall、檢準率 Precision和 F1-measure值,其定義如下:

其中I為檢索到的滿足檢索方法的檢索數,R為檢索結果數,W為可供選擇的檢索數。實驗時分別輸入針對4種知識庫檢索的檢索條件,經由IMIRSTNLU系統對其進行搜索,經過式(3)、式(4)和式(5)對實驗數據進行處理計算,結果如表2所示。

同時該實驗對多媒體信息檢索的效果與參考文獻[10]的檢索效果進行了對比,具體如圖3所示。其中星號表示該實驗的F1-measure值,圓圈表示參考文獻[10]的F1-measure,通過對比可知,該系統的檢準率與參考文獻[10]相比有明顯的提高,能夠基本實現智能化理解用戶檢索需求,同時由綜合評價F1-measure值可以看到,該系統的檢索服務是高效和準確的。

表2 IMIRSTNLU系統實驗數據分析

本文經過對自然語言和數據挖掘技術的理解,提出了一種智能化多媒體信息檢索系統,通過對用戶輸入詞語進行詞語分析,生成輔助語義幫助用戶參考搜索查詢條件,啟動二級模式搜索,對知識庫實現全面和準確的搜索,同時對搜索結果進行綜合處理,對知識庫實現不斷更新,對用戶使用習慣進行存儲記憶,有效地解決了檢索語義模糊不清,查找范圍不全和準確率不高的問題。

[1]Liu Ying,Tang Yonglin,Zeng Yuan.A study on improving information retrieval effectiveness for scientific and technical novelty retrieval[C].Proceedings of International Forum on Technological Innovation and Competitive Technical Intelligence’2008,2008:338-347.

[2]JAIN P.Intelligent information retrieval[C].SETIT 2005 3rd International Conference:Sciences of Electronic,Technologies of Information and Telecommunications,2005,3:27-31.

[3]KANNAN R.Topic map:an ontology framework for information Retrieval[C].Proc.of National Conference on Advances in Knowledge Management 2010:195-198.

[4]Peng Dunlu,Zhou Aoying.Web service retrieval technology based on the method of clustering[J].Computer Applications,2007,27(10):2365-2368.

[5]Zhang Fan,Li Linna,Yang Bingru.The intelligent information collection and processing system design and implementation based on the Web[J].Computer Engineering,2007,33(18):265-267.

[6]GOYAL P,BEHERA L,MCGINNITY T M.Application of bayesian framework in natural language understanding[J].IETE Tech Rev,2008,25(5):251-269.

[7]TANENHAUS M K,SARAH B S.Language processing in the natural world[J].Phil’s Trans R Soc Lund B Boil Sic.2008,363(1493):1105-1122.

[8]LEE C,LEE G, JANG M.Dependency structure language model for information retrieval[C].ETRI,2006,28(3):337-346.

[9]CAO G,NIE J,BAI J.Integrating word relationships into language models[C].Proc.28th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval.Brazil.2005:298-305.

[10]Liu Wei,Chen Junjie.A framework for intelligent metasearch Engine Based on Agent[J].Computer Engineering end Application,2005,3:137-211.

猜你喜歡
信息檢索語義用戶
語言與語義
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
醫學期刊編輯中文獻信息檢索的應用
新聞傳播(2016年18期)2016-07-19 10:12:06
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
基于神經網絡的個性化信息檢索模型研究
認知范疇模糊與語義模糊
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
教學型大學《信息檢索》公選課的設計與實施
河南科技(2014年11期)2014-02-27 14:10:19
主站蜘蛛池模板: 成人国产免费| 亚洲自偷自拍另类小说| 国产最爽的乱婬视频国语对白| 久久精品丝袜高跟鞋| 一本无码在线观看| 久久青青草原亚洲av无码| 亚洲中文无码av永久伊人| 欧美日韩另类在线| 看国产毛片| 青青操国产| 国产不卡在线看| 青青青国产视频手机| 久久99国产精品成人欧美| 久久精品人人做人人综合试看 | 日韩无码黄色网站| 91成人在线免费观看| 乱人伦99久久| 一级全黄毛片| 国产av剧情无码精品色午夜| 国产一级特黄aa级特黄裸毛片| 欧美a在线看| 国产极品美女在线播放| 1024你懂的国产精品| 久久九九热视频| 在线欧美日韩国产| 中文字幕啪啪| 亚洲狼网站狼狼鲁亚洲下载| 99精品在线视频观看| 精品自拍视频在线观看| 欧美激情视频一区二区三区免费| 99免费在线观看视频| 中文字幕在线不卡视频| 91精选国产大片| 少妇极品熟妇人妻专区视频| 国产精品福利导航| 日韩精品一区二区三区swag| 91视频精品| 亚洲Va中文字幕久久一区| 久久人午夜亚洲精品无码区| 国产91av在线| 亚洲人成人无码www| 在线欧美国产| 男人天堂伊人网| 老司国产精品视频91| 毛片一级在线| 在线观看91香蕉国产免费| 黄色网在线| 波多野结衣一二三| 国产亚洲视频中文字幕视频| 日本少妇又色又爽又高潮| 国产成人在线小视频| 69av在线| 黄色福利在线| 中文字幕亚洲综久久2021| 国产视频a| 国产一二视频| 中美日韩在线网免费毛片视频| 91精品人妻互换| 亚洲国模精品一区| 久久国产精品嫖妓| 色婷婷电影网| 91色在线观看| 亚洲美女操| 国产色爱av资源综合区| 免费A级毛片无码无遮挡| 国内精自线i品一区202| 美女被狂躁www在线观看| 亚洲成人网在线观看| 国产在线无码av完整版在线观看| 波多野结衣一级毛片| 国产成人av一区二区三区| 天堂网国产| 亚洲人精品亚洲人成在线| 成人午夜在线播放| 四虎国产在线观看| 成人福利在线看| 久久毛片网| 国产成人综合久久精品尤物| 丝袜久久剧情精品国产| 怡红院美国分院一区二区| 国产精彩视频在线观看| 一区二区在线视频免费观看|