武漢科技大學圖書館 張旭幫
盡管因特網(wǎng)技術發(fā)展迅速,人們可免費從網(wǎng)上獲取的信息不斷豐富,但就其信息資源的系統(tǒng)性、完整性、可靠性而言,還是難以與大型的商業(yè)化聯(lián)機檢索系統(tǒng)相匹敵。聯(lián)機檢索,是指檢索者利用終端設備,通過遠程通信線路或網(wǎng)絡,使用一些特定指令和檢索提問式,并采用“人—機對話”的方式,對聯(lián)機檢索系統(tǒng)的幾個或幾十個數(shù)據(jù)庫同時進行搜索的過程。
美國DIALOG系統(tǒng)是當今世界規(guī)模最大的國際聯(lián)機檢索系統(tǒng),也是運作最為成功的商業(yè)化聯(lián)機數(shù)據(jù)庫系統(tǒng)。其信息容量大、數(shù)據(jù)質量高、文獻類型齊全、資料來源可靠、更新速度快、專業(yè)面廣,基本上包括了所有學科領域。它以功能強大的檢索軟件為支撐,其檢索算符、檢索途徑眾多,查詢搜索方便靈活、快捷簡便,更兼有數(shù)據(jù)庫總索引瀏覽、聯(lián)機詞典輔助檢索等別具特色的功能;具有其他網(wǎng)絡數(shù)據(jù)庫系統(tǒng)無可比擬的技術、資源優(yōu)勢。在實際利用中,只要使用者的檢索策略得當,一般都能達到較高的查準率和查全率,獲得滿意的效果。
因此,多年來DIALOG系統(tǒng)一直是我國科技查新工作中的主要檢索工具,同時也是國內科技、經(jīng)濟信息檢索服務中利用率最高的國際聯(lián)機檢索系統(tǒng)。在進行國際聯(lián)機檢索時,一般可采取下列幾個步驟:
國際聯(lián)機檢索前最好先對相應的檢索刊物進行手工試檢,或利用因特網(wǎng)搜索相關信息,了解專業(yè)文獻分布情況,初步估算文獻量,以便確定相應的聯(lián)機檢索方案;手檢(或因特網(wǎng)搜索)摸底有助于準確地掌握專業(yè)用詞,以提高下一步檢索的準確性。有時通過試檢發(fā)現(xiàn),手工檢索或因特網(wǎng)搜索也能滿足信息需求,這時放棄國際聯(lián)機檢索,便可節(jié)省不少的費用。
這是一個分析課題內容,確定主題概念,選擇檢索詞,構造提問式的過程。但要注意的是,在國際聯(lián)機檢索時,我們常用的是一些英文數(shù)據(jù)庫,因此不要想當然地使用一些“中式英語”的信息提問。現(xiàn)以“國外教育管理現(xiàn)代化” 的檢索為例:當今發(fā)達國家的教育管理本身就包含有現(xiàn)代化管理的內容,如用“現(xiàn)代化”這個概念去搜索,既顯得多余,同時也不符合人家的表述習慣。
選擇數(shù)據(jù)庫一般有這幾種方式:①利用數(shù)據(jù)庫一覽表或數(shù)據(jù)庫簡介資料來選擇;②參考與數(shù)據(jù)庫對應的檢索刊物(如“化學文摘”、“工程索引”、“科學文摘”……等等)進行選擇;③利用檢索系統(tǒng)的索引文檔篩選。例如,在檢索中,若選用的數(shù)據(jù)庫較多,這時可先利用DIALOG系統(tǒng)的411索引文檔進行預檢掃描,以顯示各數(shù)據(jù)庫的檢索效果,便可確定合適的數(shù)據(jù)庫。
各種國際聯(lián)機檢索提問單均大同小異,一般有:課題名稱、內容簡介、檢索詞、檢索邏輯式、數(shù)據(jù)庫……等等。可按順序依次填寫。但對“輸出要求”項,應注意以下幾點:①國際聯(lián)機檢索通常采用脫機打印,以減少聯(lián)機費。②一般情況下,聯(lián)機檢索中直接指定輸出文獻數(shù)量的方式通常要比限定年代輸出的方式簡便,這既節(jié)省機時,又能合理地控制文獻量,其效果較好。
確定了檢索策略,再填寫好檢索提問單,交給聯(lián)機檢索操作人員,便可以檢索了。
由于國際聯(lián)機檢索費用較高,因此,在動手檢索前,應針對聯(lián)機檢索過程中可能出現(xiàn)的各種情況(如:命中文獻量太多或太少、檢索結果為零、不相關文獻居多等),準備幾套備用方案,以便隨時根據(jù)終端屏幕顯示的情況,及時、有效地進行調節(jié)、修正,不斷完善檢索策略,力爭以最短的時間、最少的花費,獲得最佳的檢索效果。
對檢索結果進行分析、研究,總結經(jīng)驗;并根據(jù)篩選出的切題文獻記錄的出處索取原文。
計算機檢索的效果,既是廣大信息用戶的利益所在,也是專業(yè)檢索人員密切關注的問題,它還直接影響著檢索系統(tǒng)在信息市場上的競爭能力。通過評價數(shù)據(jù)庫系統(tǒng)的檢索質量,研究影響檢索效果的各種因素,將有助于我們在計算機信息檢索的實踐中提高檢索質量,改善檢索效果。
衡量檢索效果主要有兩個標準:查全率和查準率。查全率是指檢出的相關文獻量與數(shù)據(jù)庫中相關文獻總量的比率,它反映了相關文獻被檢出的程度。
查全率=[檢出相關文獻量/數(shù)據(jù)庫內相關文獻總量]×100%
查準率是指檢出的相關文獻量與檢出文獻總量的比率,它反映系統(tǒng)拒絕非相關文獻的能力。
查準率=[檢出相關文獻量/檢出文獻總量]×100%
英國學者在分析、研究了大量的有關數(shù)據(jù)后,提出查全率和查準率之間存在著一種“互逆相關”的規(guī)律。也就是說,為了提高查全率而放寬檢索范圍,往往使查準率下降;要想提高查準率而縮小檢索范圍,則常使查全率降低。在實際中,偶爾也會出現(xiàn)查全率和查準率同時達到很高的值,但這只是極個別的情況。而查全率和查準率之間互相制約的現(xiàn)象卻是普遍存在。
由于高查全率和高查準率難以同時獲得,因此在確定檢索目標時,應對檢索結果的查全率和查準率有所考慮。如果能事先明確優(yōu)先保證查全率或查準率,將有助于制定相應的檢索策略,取得檢索過程中的主動權。對于工礦企業(yè)從事應用研究和工藝流程設計的用戶,他們往往只要求檢索的結果能解決他們的實際問題,不一定需要很多文獻,而要求較高的查準率。對于一些從事基礎理論研究或為申請專利而“查新”的用戶,他們往往需要全面、系統(tǒng)地收集某一主題范圍的資料,因此對查全率要求較高。不同的用戶,根據(jù)從事工作的性質不同,以及研究階段的不同,對查全率和查準率將有所側重。在一般的情況下,不必過分地求全求準,以免造成顧此失彼的結果。
計算機檢索的效果取決于許多因素,如標引質量、系統(tǒng)功能、數(shù)據(jù)庫結構及檢索策略等。標引的深度是指標引一篇文獻所用的標識數(shù)量,標引深度越大,則提供的檢索標識就越多,所標引的文獻被檢出的概率就越大,查全率也就越高。然而,過度的標引又會引起誤差,影響查準率。因此,標引深度即不宜過淺,也不能過度,問題的關鍵就是如何才能做到適度標引。合理的標引必須遵循這樣的原則:正確地選擇標識,準確地表達文獻的主題概念;全面地揭示主題內容,不遺漏有價值的信息;進行合理的取舍,不過量標引;保持標引的前后一致性。要達到這些標準是很困難的;在實際中,標引的質量主要取決于詞表(主題詞表、標題詞表和分類表等)的質量和標引人員的專業(yè)知識、工作經(jīng)驗以及對檢索語言的掌握程度等。
一般來說,受過一定機檢訓練的用戶,常常能夠保證檢索的質量。因為各專業(yè)人員熟悉自己所研究的學科領域,檢索目的明確;在掌握了必要的機檢知識和方法后,就能夠制定較為合理的檢索策略,并能在反饋調節(jié)中作出準確地判斷,從而獲得滿意的檢索效果。要達到這一步,還有待于在各專業(yè)人員中廣泛地普及計算機信息檢索知識;同時也應在高校文獻檢索教學中進一步地充實、完善機檢的內容,使大學生、研究生掌握一定的檢索技能,以便在今后工作中能夠有效地利用計算機檢索這一現(xiàn)代化的信息手段,快速、準確、全面地獲得相關信息,緊跟世界科技發(fā)展的新形勢。
國際聯(lián)機檢索系統(tǒng)擁有龐大的信息資源,所涉及的內容包羅萬象,十分豐富。可以說人類從來沒有像今天這樣可以方便地獲取各類的信息。在當今信息量極大、通信業(yè)極為發(fā)達的時代,掌握信息更加重要。面對如此巨大的信息海洋,如果不掌握獲取信息的方法和技巧,只能是望洋興嘆!因此,掌握網(wǎng)絡信息檢索技能,及時準確、全面獲取信息,提高鑒別、選擇與利用文獻信息的能力,有利于消化新信息,吸收所需的專門知識,從而更好地從事科研和各種管理活動,快速獲取成功。
[1]蔣瑤.淺談關于網(wǎng)絡信息檢索的認識.大眾文藝:學術版,2010(9).