關鍵詞:網絡信息檢索;檢索工具;發展趨勢
摘 要:論述了信息檢索的概念、類型、意義、主要方式、原理以及網絡信息檢索的發展趨勢。
中圖分類號:G252.7 文獻標識碼:A 文章編號:1003-1588(2011)01-0007-03
Research based on Information Retrieval and Development Trends
Wang Xiao-bo
(Library of Scientific and technological institute of Heilongjiang, HeilongjiangHarbin150027,China)
Key words:Web Information Retrieval; Retrieval Tools; DevelopmentTrend
Abstract:This paper discusses the concept of information retrieval, type, meaning, the main method, principle and the development trend of Web information retrieval.
1 信息檢索的產生和概念
從眾多的信息中查找出符合特定需要的文獻,或某一問題的答案(數據、事實經過或結論等),這樣一個查找過程,通常被稱為信息檢索。雖然這種查找行為很早就萌芽于圖書館的參考工作之中,但信息檢索的概念直到本世紀五十年代以后才產生。它是現代記錄下來的知識急劇增長而需要給以合理的存儲,人們查尋的著眼點更多地指向包含在文獻中的信息而不是文獻本身,以及電子計算機應用到信息工作領域使人們擁有強有力的信息處理手段而導致出現的名詞。
完整的信息檢索概念包括兩項工作:(1)信息存儲過程,即搜集、篩選、整理、積累現有信息及檢索工具,建立信息檢索系統。(2)信息檢索工程,即利用信息檢索工具查找所需要的信息。廣義的信息檢索過程包括信息的存儲與檢索兩個過程。狹義的信息檢索僅指檢索過程。
2 信息檢索的類型
2.1 按照信息存儲的載體和實現查找的技術手段劃分,信息檢索可以分為以下幾種:手工檢索。即檢索者翻閱、查找印刷型檢索工具,這種檢索靈活方便,但是檢索效率低。機械檢索。即利用探針或檢索器件,對代表檢索標識的穿孔卡片進行選取,可大大提高檢索效率。光電檢索。即把檢索標識變成黑白點矩陣或條形碼,存儲在縮微介質上,利用光電效應,通過檢索機進行查找。計算機檢索。即把檢索標識轉換成二進制編碼,存儲在磁性載體上,由計算機根據程序進行查找和輸出。
2.2 根據存儲與檢索對象來劃分,信息檢索可以分為:文獻檢索。即以特定的文獻為檢索對象,包括全文、文摘等。事實檢索。即以特定的事項為檢索對象,凡是查找有關人物、地名、術語、時間等,都屬于事實檢索的范疇。數據檢索。即以特定的數據為檢索對象,如篇數、人數等。
3 信息檢索的意義
3.1 開發信息資源
由于以不同形式存在的信息經過積累和傳遞,作用于物質活動過程時,能更好地利用和開發物質資源;與資本和勞動結合時,則可以為人類創造新的物質財富,因而信息資源與能量資源、物質資源并稱為當代社會的三大資源。信息資源管理與開發水平已成為衡量一個國家信息文明程度的重要標志。信息檢索是信息存儲和信息傳遞的重要環節,是信息產業的重要基礎之一;信息檢索技能的提高和手段的日益現代化,將大大加快社會信息資源的開發速度和程度。
3.2 避免重復勞動
人類積累起來的大量文獻信息資源是一個巨大的知識寶庫,是人們從事科學研究、技術開發、文學與藝術創作所不可缺少的信息資源;重視信息資源的開發,重視信息檢索和傳遞工作,可以確保學術研究和文藝創作、避免盲目性和重復勞動,可以幫助我們充分利用他人研究成果,在他人研究的基礎上有所改進和創新,從而創造出更多質量更高的信息資源。
3.3 節省勞動時間
信息檢索是研究工作的基礎和必要環節,成功的信息檢索可以起到事半功倍的效果;尤其是隨著信息技術的更新發展,研究者可以在很少時間里完成信息調研,從而節省勞動時間,提高工作效率。
3.4 協助管理決策
管理決策必須依賴信息咨詢才能保證其科學性、公正性,信息咨詢成功的基礎則是通過科學合理的信息檢索獲取大量有用的信息資源。
3.5 提供科學方法
有人曾用信息爆炸一詞來描述當今社會中信息生產與信息載體數量的迅猛增長,在浩如煙海的信息資料之中盲目地找尋自己所需要的信息資源,自然是一種非常困難的事情。信息檢索則為人們提供了一套較完整的開發、利用信息資料的方法,包括信息檢索工具的選擇、信息檢索策略的制定、信息檢索手段的選擇等等。
4 信息檢索的主要方式
4.1 直接檢索
直接檢索就是從瀏覽、閱讀文獻信息資源中獲取所需要的情報信息過程,它是研究者習慣使用的方法,具有以下幾個優點:(1)易于把握文獻信息實質內容。(2)可直接對信息內容判斷取舍。(3)簡便易行。(4)信息獲取速度快,時效高。
4.2 間接檢索
間接檢索就是以檢索工具為導向,進而查找原始文獻信息資源以獲得所需信息的過程,其優越性在于:(1)使盲目的分散檢索成為有目的的集中檢索,因為檢索工具將分散在不同學科、不同類型、不同語種中但主題內容相同的文獻信息集中在一起,這樣就可避免直接檢索的分散性、盲目性,大幅度提高檢索效率。(2)檢索工具中的信息源不限于某一個或幾個信息機構,這樣就可以為用戶提供廣泛的信息來源。(3)提供有規律的檢索途徑,因而檢索者只要掌握檢索工具所提供檢索途徑的規律性,就可以實現有效的信息檢索。(4)消除語言障礙,因為檢索工具通常只用一種文字寫成,檢索者只需掌握常用文種,即可實現多語種信息檢索。(5)檢索工具通常提供相關主題的題錄或文摘而不是全文,因而可加快檢索速度。
5 信息檢索的原理
信息存儲工作包括文獻收集、信息加工整理,最后形成有序的、具有存儲標志的文獻信息數據庫;信息檢索工作則包括用戶提出課題檢索要求、通過分析形成檢索標志,然后到文獻信息數據庫中進行檢索標志與存儲標志的匹配,凡是匹配成功的,相應信息款目即為只能改選檢索結果。
因而,所謂信息檢索原理,簡單地講,就是檢索提問標志與存儲在檢索工具中的文獻特征標志進行比較或稱匹配,然后提取相符合的文獻信息的檢索方法。在機檢中所采用的檢索原理通常是依靠邏輯運算的布爾檢索方式,這種方法是運用以“與”(and)、“或”(or)以及“非”(not)為主的邏輯運算來檢索所需信息的。
6 網絡信息檢索的發展趨勢
6.1 可視化趨勢將會更加明顯
網絡信息檢索的可視化是指將數據庫中的不可見的語義關系用圖像形式可視化顯示并表達用戶檢索過程。可視化的網絡信息檢索可以使文獻或檢索式內部的語義關系簡化,用戶能夠很容易的判斷一個檢索中的相關的文獻,可視化的網絡信息檢索是一個透明的檢索過程,不僅使檢索更容易、有效,還為用戶展示了更豐富、更直觀的信息。可視化網絡信息檢索使用戶進行交互式輸入,允許在信息空間進行動態移動,允許用戶修改數據的顯示方式,使他們理解數據的個人偏好可視化。如今,可視化技術在地理信息系統(Geographic Information System)、產品設計(Product Design)、城鎮建設與規劃(Urban Construction and Plan)等領域得到了應用。所以可視化的網絡信息檢索將會更加明顯。
6.2 個性化服務將進一步提高
網絡信息檢索的個性化是指各個網站針對不同的用戶需求提供給用戶有特色的服務內容。網站提供個性化服務的實質是提供適應用戶需要的產品。事實上,網上已經開始出現專門收錄某一領域信息的網站,尤其是在一些熱門領域。一些大型的搜索引擎已經注意到個性化信息服務的提供。目前支持個性化信息服務所需的支撐技術已經基本成熟,如數據推送技術、網頁動態生成技術和智能代理技術。可以預見,將來網絡的“個性化”功能將得到進一步加強。用戶可以根據個人喜愛的方式來檢索信息,并且可以在一定程度上改變檢索顯示的結果格式,用戶還可以對命中的檢索結果進行限制,要求僅提供權威的結果,從而提高檢索質量。
6.3 用戶友好化進一步提高
未來科技的發展都要以人為本,網絡信息檢索也不例外。用戶友好化的目的就是讓用戶更方便地訪問信息資源。它主要包括兩個方面的內容:一是用戶界面友好化,例如利用窗口、圖標瀏覽器和超文本等用戶友好界面技術,使用戶不必知道所要查找的信息在網絡存放的位置,也不必掌握許多操作命令,同樣能得到滿意的檢索結果。另一方面是更好的為檢索結果提供方式,使用戶方便地進行瀏覽、選擇和利用。
6.4 網絡信息檢索提供全文檢索
全文檢索是指以各類數據諸如文字、聲音、圖像等為主要處理對象,根據數據資料的內容,而不是外在特征來實現的信息檢索手段。它是信息檢索發展的最前沿和目前的最高階段。與其他檢索技術相比,全文檢索技術的新穎之處在于,它可以使用原文中任何一個有實際意義的詞作為檢索入口,而且得到的檢索結果是原文文獻而不是文獻線索,從而使人們能快速方便地查到他們想要的文獻原文。
6.5 網絡信息檢索主動性發展趨勢
網絡環境使世界范圍內的信息傳播成為現實,網絡環境中的電子圖書、網絡期刊等出版物,可以自動形成人名、地名、年代等關鍵詞,具有自動編制書本式索引的功能,提供豐富的檢索點,具有較強的檢索功能和靈活多樣的檢索結果輸出形式,并可以通過網絡主動分發給信息用戶。
6.6 網絡信息檢索標準化發展趨勢
網上信息的多樣性、復雜性以及分散和無序,嚴重地影響了網絡信息檢索,因此,必須規范網絡信息的計量標準,結束當前這種無序的狀態,建立一整套網絡信息錄入、數據組織、信息檢索以及檢索結果規范化的標準。標準化是網絡信息檢索的當務之急,也是網絡環境中信息檢索的發展趨勢。
6.7 網絡信息檢索語音化發展趨勢
隨著綜合科技的高速發展,在不遠的將來,語音識別系統就會像文字輸入法一樣普及,它的普及,可以減輕用戶的手、眼、腰的疲勞,而且盲人也能方便的進行網上檢索,系統通過語音合成技術,把所檢索的信息轉化成聲音,以供盲人使用。語音化檢索是網絡信息檢索的一個重要的發展趨勢。
綜上所述,隨著網絡技術的新興和發展,信息檢索技術也必將隨之發展,技術發展是無限的,而技術的發展也都是為了用戶信息檢索的方便和實用而服務的,這是一種趨勢。
參考文獻:
[1] 沈固朝.網絡信息檢索工具、方法、實踐[M].北京:高等教育出版社,2004.
[2] 馬文峰.人文社會科學信息檢索[M].北京:北京圖書館出版社,2004.
[3] 許家良.信息檢索[M].北京:國防工業出版社,2004.
[4] 陳軍蓮.網絡信息檢索中存在的問題及對策[J].圖書館,2007(5).
[5] 賀曉利.信息資源網絡檢索的特點、問題及對策[J].現代情報,2007(5).
[6] 孔為民.信息檢索技術的新趨勢[J].農業圖書情報學刊,2009(3).
(編校:馬懷云)