999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

檔案信息檢索技術(shù)探析

2017-05-30 10:46:47馬木生
科技風 2017年13期
關(guān)鍵詞:檔案管理

馬木生

摘要:信息技術(shù)為人們的生活帶來了巨大的改變,隨著社會信息化程度的加深,各個行業(yè)、各個領(lǐng)域逐漸涉及到信息技術(shù),逐漸開始重視對信息的處理與審視。信息管理與審視的主要手段是利用信息管理系統(tǒng)進行操作,目前在社會各個領(lǐng)域中備受關(guān)注。其中尤其檔案信息管理是目前比較常用的信息管理系統(tǒng),而且檔案信息管理技術(shù)對于機關(guān)、企業(yè)等領(lǐng)域來說非常重要,有著獨特的屬性,如何提高檔案信息管理的效率,筆者認為要從檔案信息檢索技術(shù)入手,提高檔案信息檢索技術(shù)的有效性將會是檔案信息管理工作現(xiàn)階段以及未來必須重視的課題。

關(guān)鍵詞:檔案信息;檢索技術(shù);檔案管理

隨著時代的進步,科學技術(shù)日益完善,信息技術(shù)的發(fā)展與更新未來傳統(tǒng)檔案管理帶來了新的挑戰(zhàn),經(jīng)過很多年的累積、收集、整理檔案數(shù)量十分龐大,而且目前對檔案利用的方式卻發(fā)生很大的變化。從傳統(tǒng)的檔案管理來看,主要是以手工信息檢索的為主,在檢索之前需要制作帶有目錄的條目卡片,讓后續(xù)使用更加方便。隨著時代的發(fā)展,機械式信息檢索隨之出現(xiàn),主要是設(shè)備上的進步,采用了打孔機、分類機等等設(shè)備,能夠?qū)Χ挝墨I進行更好的記錄與收集,而且可以通過電刷進行更加有效率的檢索。每一次對檢索方式進行改善都是一次進步。在信息技術(shù)的支持下,這些傳統(tǒng)方式都無法滿足現(xiàn)代檔案信息管理與使用的要求,對設(shè)備依賴大,而且非常復雜,并且檢索效率與檢索質(zhì)量都不高。因此,檔案信息檢索技術(shù)在這樣的背景之下產(chǎn)生,利用計算機能夠提高檔案檢索的效率與質(zhì)量。目前,為了提高對檔案的使用率,廣大研究者逐步開發(fā)了檔案管理系統(tǒng),為了達到實現(xiàn)檔案信息共享還建立了檔案數(shù)字化館,不僅實現(xiàn)了實現(xiàn)了檔案信息化檢索的目標,而且擴大了檢索的范圍,質(zhì)量更高,能夠滿足廣大人群事實檢索的要求。可以說,檔案信息檢索技術(shù)的推出,讓檔案信息再次“活”起來。

一、檔案信息檢索技術(shù)的發(fā)展

信息化的發(fā)展帶來新的技術(shù)、新的文化以及新的交際方式。信息技術(shù)在檔案管理的應(yīng)用中得到了前所未有的發(fā)展,但是從目前發(fā)展的現(xiàn)狀來看,還有很多地方需要進行改善。目前,檔案管理系統(tǒng)開發(fā)了檔案信息檢索功能,廣大用戶可以通過檔案信息檢索系統(tǒng)進行目標查詢,用戶一般在查詢檔案信息時采用的是關(guān)鍵字模糊查詢,而相關(guān)查詢結(jié)果則是事先經(jīng)過錄入做好順利排列之后進行輸出的,雖然具備檢索的功能,但是其檢索結(jié)果并沒有像預期一樣達到用戶真正需要的檢索意圖,甚至沒有對查詢中一些關(guān)鍵因素進行深入的分析,比如,關(guān)于關(guān)鍵詞出現(xiàn)的頻率,關(guān)鍵詞出現(xiàn)的位置以及關(guān)鍵詞的重要程度等等,因此,很多時候檢索結(jié)果都是無序狀態(tài),甚至和用戶想要查詢的結(jié)果沒有存在基本的關(guān)聯(lián)性,最終無法并沒有真正滿足到客戶的實際需求。類似這樣的檔案信息檢索結(jié)果并沒有真正的意義,尤其是從廣大用戶的角度來看,這樣的檢索不僅浪費時間,而且整個檢索過程異常乏味,而且大部分用戶不可能去一一查看結(jié)果。因此,針對目前的檔案信息檢索存在的一些普遍問題,本文的研究主要是基于原來的基礎(chǔ)上進行改進,主要是針對目前默認的查詢結(jié)果進行改善,讓查詢結(jié)果排序更加人性化,以相關(guān)度為依據(jù)從高到底來進行顯示,這樣能夠讓用戶在極短的時間內(nèi)檢索到自己想要的信息。

檔案的價值最終體現(xiàn)在“用”這個環(huán)節(jié)上,如果檔案一直被存放在庫房而沒有被使用,檔案也就失去了原有的價值,更是一張張等著發(fā)霉的廢紙。如何針對檔案信息化系統(tǒng)進行改進,如何做好檔案信息檢索,如何才能在龐大的檔案信息中準確找到自己的想要的信息,這才是我們必須要關(guān)注并且解決的問題。隨著信息技術(shù)的發(fā)展,數(shù)字化檔案建設(shè)之后瀏覽的人數(shù)與日俱增。而且不同的人有自己不同的思維模式,就大部分人來說他們對檔案的記憶都是非常模糊的、片段的,本身自己的查詢意圖就不明確,在查詢時一開始都是以試探的方式進行。如何滿足這些用戶的實際需求,如何讓用戶能夠準毫無遺留的找到檔案信息,這就要檔案信息管理系統(tǒng)必須具備一套非常強大并且人性化的檢索功能,讓廣大客戶能夠根據(jù)檢索具備的基礎(chǔ)條件進行更好的查詢,這樣查詢結(jié)果將會更加準確、更加效率。目前,能夠滿足不同的用戶不同需求的檢索功能,主要包括了全文檢索、圖片檢索、目錄檢索等。

二、檔案信息檢索技術(shù)

(一)信息檢索的原理

所謂信息檢索是一般是根據(jù)某種方式將各種信息進行重新組織,然后根據(jù)用戶的查詢需求將對應(yīng)的信息反映給用戶的一個過程。檔案信息檢索包括了:索引檢索、查詢處理、文檔檢索幾個方面。

第一,索引生成。設(shè)計檔案信息檢索系統(tǒng)時必然會涉及到索引生成,那么如何選擇索引與如何選擇索引方法以及關(guān)鍵詞表分詞方法都顯得非常重要。索引生成會涉及到EM算法、NGram算法、HMM算法等,它們都是統(tǒng)計學原理當中的分詞方法,但是這種計算方法使用的范圍比較小,而且工作量也很大。

第二,查詢處理。檔案信息在具體檢索的過程中,用戶在使用的過程匯提出查詢條件,比如:關(guān)鍵詞、自然語言、表達式等等,而且整個檔案信息檢索功能對于用戶輸入的查詢條件不能肆意更改。例如,檔案信息檢索系統(tǒng)如果沒有對用戶給出的查詢條件進行及時的處理,這樣便會影響查詢的準確率。因此,根據(jù)用戶的查詢條件一般要做好語義處理,這樣才能準確領(lǐng)悟到用戶想要表達的一切查詢意圖,通常使用的處理方法有關(guān)聯(lián)矩陣、相關(guān)反饋、潛語義分析等等技術(shù)。

第三,檢索。檢索系統(tǒng)直觀理解就是對關(guān)鍵詞進行查詢的處理方式,給用戶及時提供查詢出來的結(jié)果。檢索系統(tǒng)的工作程序比較簡單,通常可以利用對應(yīng)的模型來對查詢結(jié)果的關(guān)聯(lián)性進行排列,主要的方式有:概率模型、布爾模型以及向量模型。

(二)檢索的相關(guān)性

第一,系統(tǒng)相關(guān)性。系統(tǒng)相關(guān)性是查詢結(jié)果與提出文檔之間的匹配關(guān)系,在具體操作中會受到用戶的個人習慣操作習慣的影響,文檔的特征與實際操作包含了:語法表述、分類表、索引、文獻組織、分析檢索提問等等。系統(tǒng)相關(guān)性從本質(zhì)屬性上來分析是比較片面的,通常是將重心放在整個查詢過程的系統(tǒng)的當中,這樣就會忽略了用戶的實際感受。

第二,用戶相關(guān)性,是用戶發(fā)出的查詢結(jié)果與信息需求之間的匹配關(guān)系。目前,檔案信息檢索過程涉及到的數(shù)據(jù)量也非常巨大的,此時用戶的實際操作將會影響到整個信息檢索過程。而且需要考慮到用戶在實際查詢過程中一個心理變化過程,因此,要將用戶相關(guān)性與檔案信息檢索的相關(guān)性充分結(jié)合起來,經(jīng)過對比分析之后,得知前者更加能夠提高檢索結(jié)果的準確率。

三、 檔案信息模糊檢索

早在1956年,美國著名的自動控制專家、加州大學著名教授扎德第一次將模糊集合理論提出來,最開始是為了解決一些模糊不清的問題,目的是通過模糊集合理論將這些模糊繁雜的問題集中化、明確化。隨著時代的發(fā)展,模糊集合理論被引用到信息領(lǐng)域當中,并且有了很快的發(fā)展,目前在檔案信息檢索中有屬于一種非常常用的信息處理方式。檔案信息模糊檢索主要在檢索的過程中針對字符串或者文件中一些相關(guān)部分將其作為關(guān)鍵詞進行檢索的一種方法,例如,如果檢索的內(nèi)容特別多,那么用戶只需要記住想要查詢內(nèi)容的一部分作為關(guān)鍵詞就可以進行信息檢索,從而提高檢索系統(tǒng)的可用性。

目前,很多系統(tǒng)的所有數(shù)據(jù)都提供了模糊檢索功能,例如,SQL Server 數(shù)據(jù)庫,針對這兩個數(shù)據(jù)庫進行模糊檢索的時,要通過like關(guān)鍵字對定義檢索類型進行約束從而形成模糊檢索,同時還需要使用通配符號來進行模糊定義,例如:SELECT Field Name List FROM Table Name List WHERE Condition LIKE“aa<通配符>”,表示從表 Table Name List 中檢索關(guān)鍵字是“aa<通配符>”的 Field Name List 字段。針對查詢條件來看,通配符有這些表達形式:

第一,%,也就是代表多個任意字符;

第二,_,代表長度為1的單個任意字符;

第三,[],指定[]中某個對應(yīng)的字符;

第四,[^],主要是指一種差值上的操作,可以理解為除[]之外的單個字符。

檔案信息模糊檢索與精確檢索對比起來,模糊檢索在結(jié)果范圍上會更大,從而有效的提高了查全率。模糊檢索在軟件上的配置能夠提高軟件的實用性。基于模糊查詢的實現(xiàn)原理來看,模糊檢索的優(yōu)點主要有這些:

第一,方便。模糊檢索可以說為一些非專業(yè)領(lǐng)域的用戶提供了很大的便利,在模糊檢索的引導下更加容易理解與操作,用戶不需要掌握專業(yè)技術(shù)、專業(yè)內(nèi)容、專業(yè)規(guī)章,就可以直接通過軟件或者系統(tǒng)提供的模糊檢索功能通過關(guān)鍵詞開始進行檢索。

第二,易用。模糊檢索一般采用的語言是常用的自然語言,這與受控語言有很大的區(qū)別,自然語言有一個非常大的優(yōu)勢便是非常符合用戶平常的檢索系統(tǒng),有了模糊檢索的這項功能,用戶在使用檢索功能時就不需要對關(guān)鍵詞進行概念轉(zhuǎn)化。通常自然語言具有比較豐富的標引檢索入口詞,因此可以提高檢全率,從而為廣大用戶提供更加便利的服務(wù),由于其實際操作非常簡單,適合的人群就比較廣泛。

第三,啟發(fā)。模糊檢索的范圍很廣,但是經(jīng)常獲得冗余結(jié)果,這樣也不會影響到用戶的檢索需求,例如,查詢結(jié)果集非常大,用戶則可以根據(jù)當前結(jié)合的啟發(fā),再從里面選取需要查詢的關(guān)鍵字,從而實現(xiàn)更加準確的檢索。

四、檔案著錄與檔案標引分析

檔案著錄與檔案標引是檔案信息檢索系統(tǒng)的基礎(chǔ)。檔案著錄主要從整個檔案信息中提煉出符合用戶查詢要求的索引信息,將其完整收錄下來,并且針對檔案內(nèi)容的主題進行分析,從而判斷出該檔案信息是否符合用戶查詢的要求。在經(jīng)過概念轉(zhuǎn)換之后能夠讓檢索語言的整個過程更加規(guī)范化,然后再利用檔案標引能夠?qū)n案信息中與一些文本信息不同之處揭示出來,這個過程有著比較顯著的特點:

第一,目前,大部分檔案所收集、記錄、歸檔的信息是屬于原始類信息,一般要更改原始類信息的可能性還是非常低的;

第二,檔案信息內(nèi)容涉及面非常廣,但是分類非常明晰;

第三,無論什么類型的檔案信息必須要符合專業(yè)標準,例如,要具備一級目錄、二級目錄、三級目錄等等,并且還要具有文號信息、實體分類號、全宗號、案卷號以及文件號。

第四,檔案信息要具備可以準確、快速被識別的特點,也就是每一個檔案信息都必須要有對應(yīng)的檔案編號,編號是獨一無二的。

第五,檔案信息密級劃分一般是5個級別,每一個級別所包含的授權(quán)信息內(nèi)容與權(quán)限都不一樣,不能混淆。

第六,檔案信息的保管期限劃分為3種,過期的檔案要及時銷毀。

第七,關(guān)于檔案信息的必要追究責任。檔案信息本身要具備非常明確的歸檔單位,要有對應(yīng)的負責人,如果檔案信息出現(xiàn)刪除、篡改、泄漏等等情況,要對其追究法律責任。

五、結(jié)果統(tǒng)計排序方法分析

檔案信息檢索的最終目的是將檢索的結(jié)果及時反饋給用戶,但是由于現(xiàn)在的檔案信息量特別大,導致信息檢索的結(jié)果數(shù)量也非常大,一般用戶是不會將檢索結(jié)果一一全部瀏覽完,而且這本身也不符合檔案信息檢索開發(fā)的便利性原則。目前,檔案信息檢索主要采用的是模糊檢索,而模糊檢索一般情況下無法有效避免出現(xiàn)繁雜結(jié)果的問題,而繁雜的結(jié)果必然會影響到用戶對檢索結(jié)果的閱覽性。因此,需要一個良好的結(jié)果統(tǒng)計排序機制,有效控制繁雜結(jié)果的出現(xiàn),為廣大用戶提供更好的服務(wù)。從檔案信息檢索結(jié)果來看,結(jié)果之間地位肯定不會是對等的。根據(jù)結(jié)果是否能夠滿足用戶檢索的預期目標,一般將檢索結(jié)果劃分為目標結(jié)果與冗余結(jié)果,當然用戶在對檔案信息進行檢索時肯定希望能夠得到滿意的結(jié)果,通常只會關(guān)注檢索結(jié)果的最靠前的幾條記錄。由此可見,對檔案信息檢索結(jié)果的排序就顯得非常重要,而且良好的排序也直接影響到用戶的使用體驗。排序無疑是檢索的最為關(guān)鍵的一步,假如沒有進行合理的排序,那么檔案信息檢索出來的結(jié)果必將失去價值。檢索排序是基礎(chǔ)性工作,也就是檢索的必經(jīng)步驟。而檢索技術(shù)是對信息有效過濾最為有效的方法,通過檢索才能獲得高質(zhì)量的信息。

綜上所述,檔案信息檢索技術(shù)要從檢索的基本原理入手,對檢索的過程相關(guān)性分析,尤其是要了解檢索相關(guān)性與用戶相關(guān)性。另外,模糊檢索是當前檔案信息檢索最為有效的檢索功能,雖然無可避免模糊檢索過程中會帶來目標結(jié)果與冗余結(jié)果,但只要從這方面深入研究,結(jié)合檔案信息的特殊性,從而對結(jié)果統(tǒng)計進行合理的排序,提高檔案信息的利用率。

參考文獻:

[1]趙進龍,霍明明.RFID技術(shù)在檔案信息檢索中的應(yīng)用研究[J].電子世界,2016,(14):53.

[2]孫梅霞.新形勢下檔案信息公共服務(wù)方式研究[J].蘭臺世界,2015,(23):105106.

[3]方婷.信息技術(shù)在檔案中的應(yīng)用[J].東方企業(yè)文化,2015,(02):66+68.

[4]于雪紅.數(shù)字檔案信息安全防護對策分析[J].黑龍江史志,2014,(09):160.

[5]劉華珍.檔案信息檢索研究成果的統(tǒng)計分析[D].遼寧大學,2014.

[6]趙春苗.計算機技術(shù)在檔案信息管理中的應(yīng)用[J].科技創(chuàng)新與應(yīng)用,2014,(07):250.

猜你喜歡
檔案管理
如何規(guī)范檔案管理
對加強城建檔案管理的相關(guān)思考
檔案管理中的電子檔案管理
檔案管理與企業(yè)內(nèi)部控制關(guān)系的思考
消費導刊(2017年24期)2018-01-31 01:29:20
煤炭企業(yè)檔案管理的創(chuàng)新
論如何做好檔案管理工作
論科研項目檔案管理
西藏科技(2015年12期)2015-09-26 12:13:40
健康檔案管理的“云”前景
關(guān)于電力企業(yè)檔案管理之創(chuàng)新探討
河南科技(2014年7期)2014-02-27 14:11:32
加強工程項目檔案管理的有效途徑
主站蜘蛛池模板: 久久亚洲国产一区二区| 无码精品一区二区久久久| 日本道中文字幕久久一区| 成人av手机在线观看| 99精品福利视频| 国产精品第三页在线看| a毛片免费观看| 欧美激情视频二区| 亚洲人成网址| 亚洲日韩精品无码专区97| 精品无码人妻一区二区| 午夜a视频| 在线无码av一区二区三区| 国产一级无码不卡视频| 一本久道久综合久久鬼色| 久久精品91麻豆| 日韩在线欧美在线| 2021精品国产自在现线看| 婷婷亚洲天堂| 国产麻豆91网在线看| 国产自在线拍| 国产第四页| 超清人妻系列无码专区| 97se亚洲综合在线天天| 国产视频一区二区在线观看| 国产成人啪视频一区二区三区| 国产高清在线丝袜精品一区| 国产高清不卡视频| 亚洲二三区| 精品1区2区3区| 99热最新在线| 欧洲高清无码在线| 人妻丰满熟妇av五码区| 日韩AV手机在线观看蜜芽| 久操中文在线| 在线观看国产一区二区三区99| 92午夜福利影院一区二区三区| 亚洲手机在线| 日本成人福利视频| 欧美国产三级| 久久公开视频| 91在线日韩在线播放| 精品一区国产精品| 亚洲精品午夜天堂网页| 九色国产在线| 中文字幕有乳无码| 青草视频免费在线观看| 国模在线视频一区二区三区| 久久99国产综合精品1| 国产日韩AV高潮在线| 亚洲高清中文字幕在线看不卡| 中文字幕亚洲另类天堂| 中文字幕1区2区| 欧美色亚洲| 免费AV在线播放观看18禁强制| 国产综合精品一区二区| 欧美日韩激情在线| 日韩少妇激情一区二区| 国产v欧美v日韩v综合精品| 亚洲无码高清一区| 亚洲成人高清无码| 91色爱欧美精品www| 欧美笫一页| 超碰91免费人妻| 国产日韩欧美中文| 欧美日韩精品一区二区在线线| 欧洲高清无码在线| 久久精品无码专区免费| 国产极品美女在线观看| 一级毛片高清| 伊大人香蕉久久网欧美| 国产又黄又硬又粗| 色综合天天娱乐综合网| 天堂av高清一区二区三区| 亚洲有码在线播放| 午夜高清国产拍精品| 四虎国产精品永久一区| 国产精品久久自在自2021| 玩两个丰满老熟女久久网| 91麻豆国产视频| 2019年国产精品自拍不卡| 丁香婷婷综合激情|