[摘要]本文著重總結分析了運用EV2平臺查詢文章收錄時可以整合的現代信息檢索技術及軟件工具,具體包括截詞運算、位置運算、公式運算、TAG,運用Refworks訂制RSS等。以上技術及工具的綜合利用可以提高查全查準率、簡化工作程序、提高工作效率。
[關鍵詞]EV2;截詞檢索;位置檢索;TAG;RSS;RefWorks
[中圖分類號]G354[文獻標志碼]B[文章編號]1005-6041(2008)02-0065-04[HT]
1 運用截詞檢索
截詞檢索是檢索英文數據庫的一項常見技術,在EI數據庫檢索中用“,”代替單個字符,用“*”代替多個字符。筆者從以下課題切入,具體分析該技術在查詢收錄中的應用。
檢索課題:請從查全與查準兩個角度出發,分別采取不同的策略,對1995到2005年間哈爾濱工程大學師生公開發表或參會論文被Compendex數據庫收錄情況進行徹查。
為求查全,我們編制了一條表達式(以下稱策略一):(HarbinEng*Univ*)wnafandCOREwndt(注:wn=within,af=authoraffiliation,dt=documenttype)
經檢索統計,具體結果見表1。

策略一主要運用了EI檢索中的截詞技術,“*”是通配符,能夠代表所有在該位置出現的字母。CORE用來代表核心數據。從作者機構字段入手,返回所有字段中包含HarbinEng*Univ*字樣的數據。用策略一的好處是,一個也漏不掉,保證查全率。關于哈爾濱工程大學的各種寫法,縮略語和發生拼寫錯誤的詞組也能囊括其中。查全率可以做到百分之百。但它的弊端也是很明顯的。
在EI數據庫中,由于截詞算符不能與位置算符(near、onear)同時使用,因此策略一無法控制檢索式中每個單詞出現的順序和位置,數據庫除了會返回所有哈爾濱工程大學的文章之外,還會把二級學院中有Engineering字樣,機構名稱中包含Harbin或University的數據一并返回,如:Institute Of Electrical And Electronic Engineering,Harbin University Of Science And Technology(哈爾濱科技大學);School Of Electrome chanical Engineering,Northeast For estry University(東北林業大學);Department of Electrical Engineering,Northeast Agricultural University(東北農業大學);School Of Computer And Information Engineering,Harbin University Of Commerce(哈爾濱商業大學);Schoolof Electronic Engineering,Heilongjiang University(黑龍江大學)等。因此每一次返回的結果都得進行人工篩選,將其他學校排除。
2 運用位置檢索
在EI數據庫中,用來表示位置檢索的算符有兩個:NEAR和ONEAR,其中NEAR不限定詞間順序,ONEAR要求詞間順序。
同樣上面的課題,如果采用位置檢索,并要求與截詞檢索有同樣的效果,該如何進行呢?為求查準,并力爭查全,我們編制了以下八條表達式(下稱策略二)。
檢索策略二:
檢索式一(#1):(Harbinonear/0Engineeringonear/0Univ)wnafandCOREwndt
檢索式二(#2):(Harbinonear/0EngOnear/0Univ)wnafandCOREwndt
檢索式三(#3):(Harbinonear/0Engineeringonear/0University)wnafandCOREwndt
檢索式四(#4):(Harbinonear/0Univofonear/0Engineering)wnafandcorewndt
檢索式五(#5):(Harbinonear/0Universityofonear/0Engineering)wnafandcorewndt
檢索式六(#6):(Harbinonear/0Univofonear/0Eng)wnafandCOREwndt
檢索式七(#7):(Harbinonear/0Engonear/0University)wnafandcorewndt
檢索式八(#8):(Universityofonear/0Harbinonear/0Engineering)wnafandcorewndt
(注:wn=within,af=authoraffiliation,dt=documenttype)
實施檢索后,具體數據見表2。

策略二主要運用了EI檢索中的位置算符(near、onear),其中onear要求詞間有嚴格的順序。這樣做的優點就是顧全了策略一無法兼顧的查準率,使得返回的每一條數據都是我們所需要的。但是這種策略要求我們有統一并且規范的機構名稱。通過對十一年間哈爾濱工程大學論文被EI收錄的數據的觀察整理,筆者一共找到關于哈爾濱工程大學英譯名的八種寫法,按十年間被使用的頻次排序如下:
(1)HarbinEngineeringUniversity(462)
(2)HarbinEng.Unvi.(299)
(3)HarbinEngineeringUniv.(163)
(4)UniversityofHarbinEngineering(5)
(5)HarbinUniv.ofEngineering(4)
(6)HarbinUniversityofEngineering(2)
(7)HarbinEng.University(1)
(8)HarbinUniv.ofEng(1)
(9)HarbinEngineeringUnivrsity(1)
顯然,用策略二,為了避免遺漏,得將八個檢索式的返回結果相加,才能達到與策略一一樣的結果。并且,一旦發生拼寫錯誤,被檢到的可能性為零。
3 運用公式檢索
我們都知道,EI數據庫的數據是每周更新的,如果能夠跟蹤每周變化的情況,將一段時間的大任務細劃到以周為單位的小任務,同樣可以實現將工作簡化,提高效率的目的。這時,運用公式運算就是最佳的選擇。可以將以下這段表達式加入到我們的檢索式中:
…yyyyww-yyyywwwnwk…
比如:如果想鎖定哈爾濱工程大學師生發表或參會文章在2007年第一周被EI收錄的情況,就可以編制以下表達式:
(200701-200701)wnwkand(HarbinEng*Univ*)wnaf
利用公式就可以在任意時間之后去檢索某一年某一周數據庫增加的內容,當這一周過去,這一周增加的內容就凝固在這個公式中,無論何時都可以方便快捷地把它們找出來。
如例中所示,公式運算可以根據需要與截詞或位置運算相結合。
4 運用TAG
Tags,標簽,是EV2平臺整合的新功能。Tags作為Web2.0的新應用之一較常出現在BLOG或網頁里用來分類,Tags也可以與查詢收錄結合起來。
在通常的查收查引工作中,我們會將一個自然年內收錄的文章發布在學校或圖書館的主頁上供在校師生查詢,在日常的咨詢工作中也經常會接待要求查詢文章收錄情況的讀者。如何讓發布與我們的工作同步,Tags是一個不錯的思路。
工作人員可以隨時將檢索出的記錄分院系打上Tags,設定為MyInstitution。那么所有老師與同學就可以在打上院系Tags的文章中檢索自己發表的內容,最限度地縮小了范圍,節省了檢索的時間。
第一步:找到相關記錄,打上Tags。

第二步:編輯并為Tags命名。

第三步:在同一Tags內檢索。

另外,共同做查詢工作的同事也可以通過Tags建立共享,先設立一個共享團隊,通過TAG共享檢出的記錄,使工作配合更加默契,也可節省大量重復檢索的時間。
5 運用RSS訂制及Refworks
隨時跟蹤數據庫收錄的變化,RSS是一個不錯的助手??梢岳肦SS訂制與推送的功能將成熟的策略訂制到任意一款RSS閱讀器中。RefWorks作為參考文獻管理系統也有RSS訂制功能。
第一步:設計策略進行檢索,以哈爾濱工程大學為例,檢索式為:(200701-200753)wnwkand(HarbinEng*Univ*)wnafandCOREwndt。在檢索結果頁面,占擊。

第二步:在彈出窗口中粘貼URL至RefWorks,如下圖。

至此,訂制就結束了,當前更新會看到12條記錄,為第2007年第26周符合策略的更新記錄。
[參考文獻]
[1]工程索引數據庫[DB/OL].[2006-07-13].http://www.engineeringvillage2.org.cn/controller/servlet/Controller?CID=quickSearchdatabase=3.
[收稿時間]2007-10-31
[作者簡介]程波(1975?—),女,1999年本科畢業于黑龍江大學信息管理系,2005年碩士畢業于哈爾濱工程大學人文學院,咨詢館員。