999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種面向圖情信息的快速檢索優化算法

2023-12-18 08:58:34徐繼維
現代電子技術 2023年24期
關鍵詞:特征提取文本用戶

徐繼維

(長安大學 圖書館, 陜西 西安 710064)

隨著計算機、大數據技術的發展,數字圖書館已經成為了社會數字信息資源的重要組成部分[1-2]。數字圖書館的基礎信息是數字信息資源,這些資源一部分來自于圖書、期刊、報紙、音像等傳統文獻的電子版,還有一部分來源于各種數據庫和互聯網[3-4]。20 世紀70 年代初,聯機公共檢索目錄(Online Public Access Catalog,OPAC)誕生,這是最早的因特網館藏資源遠程檢索工具。但隨著網絡資源信息的爆炸式增長,各高校、公共圖書館、政府情報部門等單位的數字圖書資源不斷涌入網絡,數字資源的形式也由單純的文本信息向多媒體形式轉變。因此,信息資源的數字化、信息形式的多媒體化和信息存取的網絡化成為了數字圖書資源信息的顯著特點。在這種趨勢下,如何快速地檢索出有效信息并提升讀者的用戶體驗,成為了目前的研究熱點之一。

1 理論分析與方法架構設計

1.1 數字圖書信息檢索流程

優化、提升圖書信息檢索效率的關鍵在于梳理清楚信息的檢索流程,圖1 所示為本文梳理出的用戶在進行信息檢索時前端和后端的業務交互流程。

圖1 數字圖書信息檢索流程

如圖1 所示,為了實現數字圖書信息的檢索,在采集完所有的圖書信息后,首先進行海量的信息存儲;然后,為了便于用戶的檢索,需要實現信息的自動化標注;隨后用戶通過相關檢索系統的查詢接口,利用索引詞在系統中通過標注得到所需的信息[5-7]。綜上所述,數據信息的自動化標注是實現信息快速檢索的關鍵。因此,文中主要對基于人工智能理論的自動化標注方法進行研究。在設計圖書信息的檢索算法時,基于現有理論進行優化與改進可以提升設計效率,故本文在信息標注時,引入了相似度作為深度學習模型的特征。對于多媒體信息,可以從圖像屬性相似度、文本相似度以及參與檢索的用戶相似度方面進行分析[8-10]。

圖像相似度主要是指采集的圖書圖像信息在采集時間、地點、類別、文本描述等相關屬性信息上的相似度,具體計算公式如下:

式中:a、b分別代表兩個采集的不同圖像;PP、PT分別為基于屬性和文本描述的相似度;w1、w2分別為其權重,且滿足:

文本相似度主要用于評價所采集的數字圖書相關描述信息的相似度,其計算公式如下:

式中:T1、T2分別是兩條待比對的文本;DIS 為文本的編輯距離,該距離通過計算一個字符串轉換到另一個字符串的最小操作數來評估文本的相似性;len(·)為文本長度的計算函數。

用戶相似度則是指用戶進行檢索時,可以根據用戶對于某時間的關注度、對于某領域的興趣進行快速推薦,從而提高檢索效率。其具體計算公式如下:

式中:u、v分別代表兩個不同的用戶;SL、ST、SF分別是用戶的位置、標簽和社交信息的相似度;w1、w2、w3分別是各自的權重。w1、w2、w3的關系為:

當得到信息的總相似度后,若直接根據數據庫已有的標簽對其進行標注則可能會引入錯誤標注,降低信息標注的準確性。因此,文中采用TF-IDF 作為標注降噪的標準[11-12]:

式中:Ti為算法生成的標注;Ni表示Ti在相似標注中出現的頻次;N為所有相似標注的總和;Di為Ti的逆文檔率。本文算法為所有生成的標注設置了一定的TFIDF 閾值,當低于閾值時,數據庫中將不再保留算法生成的標注。

1.2 基于區域劃分的信息標注方法

在進行數字圖書多媒體信息標注時,如果僅采用1.1 節所述方法,則可能存在原始數據庫中無相似信息的情況,此時就會出現待標注的信息本身不夠豐富或者無法完成標注的情況。為此,本文針對圖書的圖像信息,引入了RCNN 網絡[13-14]選取圖像的最相關區域:

劃分區域的RCNN 網絡框架如圖2 所示。所設計的RCNN 網絡包含兩個通道,其中左通道對主要區域進行標注,右通道對候選的次要區域進行標注。在進行特征提取時,主要使用卷積和全連接運算,其中Score 運算的定義如式(8)所示。疊加后,通過Softmax 層確定該信息的具體標注:

圖2 劃分區域的RCNN 網絡

式中:s為當前待識別的數字圖書圖像信息;S為信息的標識集合;I為區域r中的特征向量。

模型在訓練時,基于誤差的反向傳播思想,使用梯度下降法實現訓練[15],定義模型標識時所采用的損失函數為:

2 算法實現與測試分析

2.1 仿真實驗設計

為了評估模型的性能,本文從某高校圖書館的數據庫中導出了現有數字圖書的圖像信息作為數據集進行驗證仿真,表1 為圖像的類別及數量信息。

表1 數據集中數字圖書信息

為了評估模型在進行信息檢索時的識別準確度,采用準確率P和召回率R作為評價指標。提取信息特征的網絡由多個卷積層與池化層組成,文中以目前業界較成熟的兩個網絡ZF-Net 和VGG-16 作為特征提取網絡,網絡的區別如表2 所示。

表2 ZF-Net 和VGG-16 的網絡特征

通過對比兩個網絡的性能和適用場景,本文選擇VGG-16 作為特征提取網絡。在使用時,主要利用其全連接層之前的結構,具體的網絡參數如表3 所示。

表3 VGG-16 的具體參數設置

文中的特征提取網絡包括13 個卷積層和4 個池化層,卷積層中使用ReLU 作為激活函數,網絡中所有的卷積運算使用的卷積核尺寸均為3×3,訓練參數如表4所示。

表4 VGG-16 的訓練參數

信息經過特征提取網絡后,被劃分為3 個通道,其中一個是所設計的RCNN 候選框調整網絡,另外兩個通道的結構如表5 所示。

2.2 仿真結果分析

首先評估算法在單純依靠相似度時對于圖書信息的標注效率,計算結果如表6 所示。

表6 基于相似度的信息標注結果

從表6 中可以看出:通過文本的方式對數字圖書信息進行標注時,由于采集的文本信息夾雜了大量與圖書信息不相關的內容,導致正確標注剛剛過半;單純引入多維相似度標注方法時,由于未經過降噪,因此也會生成不相關的標注,這反而惡化了實際的標注效果。在對已標注的信息進行TF-IDF 降噪后性能明顯提升,相比基于文本的傳統信息標注方式,其準確率提升了0.121,召回率提升了0.291。圖3 給出了不同相似度時準確率的變化趨勢,可以看出本文引入的相似度指標與標注的準確率呈正相關,這證明了多源評價指標體系的可行性。

圖3 相似度與準確率的關系曲線

隨后對引入RCNN 網絡的標注方法進行評估,記k為次要區域的個數,對模型在不同k取值時進行訓練,所得到的P值如表7 所示。

表7 不同次要區域下的訓練準確率

當k=0 時,RCNN 網絡和普通的CNN 網絡結構相同。當k取值增加時,P隨之增加。當k=6 時,P取得最大值,因此文中選取k=6。此時,訓練完成的模型在測試集上得到的準確率如表8 所示。

表8 不同算法在測試集上的準確率

由表8 可以看出,引入RCNN 網絡后,多源信息相似度標注方法的精確度有所提升,證明了多區域信息特征提取的必要性。此外,相較于現有OTC、Mop-CNN、ImageNet-CNN 等人工智能網絡,在本算法框架下,準確率分別提升了0.372、0.093、0.201。

3 結 語

針對當前數字圖書信息的檢索問題,本文研究了基于融合數據的信息標注方法,通過提升信息標注的準確性,優化圖書信息的檢索流程,降低了用戶在信息檢索時的消耗,并提升了在線查找時的用戶體驗。仿真結果表明,本算法可以有效提取多媒體形式的數字圖書信息特征。隨著數字圖書資源的不斷豐富,所提算法將有更為廣闊的應用前景。

猜你喜歡
特征提取文本用戶
在808DA上文本顯示的改善
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
一種基于LBP 特征提取和稀疏表示的肝病識別算法
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
基于MED和循環域解調的多故障特征提取
主站蜘蛛池模板: 国产免费久久精品99re丫丫一| 亚洲欧洲自拍拍偷午夜色无码| 九九九精品成人免费视频7| 欧美日韩国产系列在线观看| 久久一本精品久久久ー99| 911亚洲精品| 精品超清无码视频在线观看| 亚洲日韩在线满18点击进入| 无码粉嫩虎白一线天在线观看| 国产99精品视频| 免费久久一级欧美特大黄| 国产视频a| 国产欧美高清| 666精品国产精品亚洲| 蜜芽一区二区国产精品| 亚洲男人天堂网址| 国产毛片高清一级国语| 激情综合网址| 9啪在线视频| 色网在线视频| 婷婷成人综合| 国产高清自拍视频| 97视频精品全国免费观看| 乱色熟女综合一区二区| 人人爱天天做夜夜爽| 99无码中文字幕视频| 色偷偷综合网| 欧美亚洲国产精品第一页| 午夜视频日本| 亚洲成人精品| 伊人精品视频免费在线| 伊人久久精品亚洲午夜| 欧美专区在线观看| 九九九久久国产精品| 国产swag在线观看| 思思热在线视频精品| 伦伦影院精品一区| 国产白浆在线| 免费aa毛片| 青草精品视频| 国产黄色视频综合| 91亚洲免费| 99re视频在线| 性喷潮久久久久久久久| 亚洲日韩久久综合中文字幕| 亚洲国产AV无码综合原创| 亚洲狼网站狼狼鲁亚洲下载| 国产成人h在线观看网站站| 国产精品尤物在线| 香蕉伊思人视频| 欧美在线黄| 欧美性猛交xxxx乱大交极品| 中文字幕在线永久在线视频2020| 波多野结衣一区二区三视频 | 五月婷婷伊人网| www亚洲精品| 国内毛片视频| 欧美精品啪啪| 毛片免费试看| 在线观看国产精品日本不卡网| 国产午夜无码专区喷水| 久久国产热| 国产精品视频白浆免费视频| 亚洲人成电影在线播放| 亚洲成人精品久久| 亚洲综合色婷婷中文字幕| 国产精品久久久久婷婷五月| 成人免费午夜视频| 国产福利2021最新在线观看| 日韩在线永久免费播放| 国产中文一区a级毛片视频| 国产亚洲欧美在线专区| 国产一区二区三区免费观看| 精品欧美一区二区三区在线| 内射人妻无套中出无码| 国产极品美女在线播放| 狼友视频一区二区三区| 在线日韩一区二区| 国产精品手机在线播放| 欧美精品在线视频观看| 国产综合精品日本亚洲777| 欧美精品导航|