謝桂蘋 劉斌
〔摘 要〕CSCD作為國內最具權威性的引文信息源,其引文檢索的滿意度直接影響了各種科學評價的結果。本文結合實例,就如何提高CSCD引文檢索的查全率,從來源文獻的完善、檢索詞的選取及檢索詞間的邏輯組配等多種角度,提出了探討性意見。
〔關鍵詞〕CSCD;中國科學引文索引;引文檢索;查全率
1 CSCD概況
中國科學引文數據庫(Chinese Science Citation Database,簡稱CSCD)創建于1989年,是我國第一個引文數據庫。收錄我國數學、物理、化學、天文學、地學、生物學、農林科學、醫藥衛生、工程技術、環境科學和管理科學等領域出版的中英文科技核心期刊和優秀期刊千余種,目前已積累從1989年到現在的論文記錄300萬條,引文記錄近1 700萬條[1]。
CSCD憑借其建庫歷史最為悠久、專業性強、數據準確規范、檢索方式多樣、完整、方便等特點,已經在我國科研院所、高等學校的課題查新、基金資助、項目評估、成果申報、人才選拔以及文獻計量與評價研究等多方面作為權威文獻檢索工具獲得廣泛應用[2],深受用戶好評,被譽為“中國的SCI[2]”。
CSCD檢索系統除具備一般的檢索功能外,還提供新型的索引關系——引文索引,使用該功能,用戶可迅速從數百萬條引文中查詢到某篇科技文獻(專著、期刊論文、會議文獻、專利、學位論文等)被引用的詳細情況,還可以從一篇早期的重要文獻或著者姓名入手,檢索到一批近期發表的相關文獻,對交叉學科和新學科的發展研究具有十分重要的參考價值[3]。
學術論文的收錄從論文產出的“量”的角度反映被評價對象的學術價值,而由于學術論文引用行為的目的性,使得引文從“質”的角度反映了被評價對象的學術價值[4]。因此,引文的計量與分析成為科學評價體系中最為重要的組成部分。CSCD作為國內上最具權威性的引文信息源,其引文檢索的滿意度也必然地成為關乎科研成果評價是否公正、準確的重要環節。
2 CSCD引文檢索的基本流程
2.1 明確檢索目的,檢索相關信息
CSCD引文檢索界面提供了被引作者、被引第一作者、被引來源、被引機構、被引實驗室、被引文獻主編6個檢索字段,因此,應明確檢索目的,根據檢索內容,搜集檢索課題中與6個檢索字段相關的信息。
2.1.1 個人學術論文被引檢索
一般應整理出:①作者姓名,英文姓名全拼。②作者單位,包括檢索時間范圍內作者服務過的所有單位。③已經發表的論文目錄,包括中文篇名、英文篇名、期刊名稱及卷期頁、書名或專利號、發表時間;會議論文應包括會議名稱、會議時間、會議地點,按照論文類型、語種分類,同時以論文發表時間排序。
2.1.2 來源文獻檢索
一般應整理出:①出版物所有歷史名稱的全稱,全稱拼音或英文名稱;②中英文出版物名稱以及各種縮寫形式。
2.1.3 科研機構論文被引檢索
機構所有作者學術論文被引情況的匯總。按“個人學術論文被引檢索”課題提供相應的信息。
2.2 分析檢索內容,確定檢索途徑
2.2.1 檢索課題中包括學術論文收錄要求
如果檢索課題中包括學術論文收錄的內容,可通過“來源文獻檢索”檢索論文收錄情況,包括某種刊、某個機構、某作者等的論文產出量。
2.2.2 檢索課題中只包括引文要求
①個人學術論文檢索:一般選擇引文檢索的“被引作者”或者“被引第一作者”字段。英文文獻作者姓名的鍵入一般為“姓、名的全拼”或“姓全拼”、“名首字母”的各種縮寫方式。為了提高檢索結果的查全率,CSCD作者引文檢索一般通過第一作者檢索獲取引文信息。②科學出版物檢索:一般選擇引文檢索的“被引來源”字段。在該字段輸入文獻刊名、書名、會議錄、專利號或其它一些名稱的縮略式。③機構引文檢索:選擇引文檢索的“被引機構”字段,在該字段輸入要檢索的機構名稱的各種變化,可以使用邏輯算符“OR”和其他字段組合檢索。
2.3 分析檢索結果,及時調整策略
CSCD引文檢索界面提供的6個檢索字段之間均可進行邏輯算符進行組合檢索,因而可根據檢索結果返回情況,隨時調整檢索策略,通過幾個字段相結合的途徑,從多個入口進行引文的檢索。并可限定論文被引年份和論文發表年份。
2.4 輸出檢索結果,出據檢索報告
將選中的引文添加到結果列表中,選擇“打印”或“下載”導出結果。整理檢索結果,并根據讀者要求將數據進行整理出據完整的檢索報告。
3 提高CSCD引文檢索查全率的基本方法
CSCD引文檢索通過兩種途徑獲得:
(1)從來源文獻中獲得,僅限于CSCD收錄的中文期刊和中國出版的英文版期刊,由于引證文獻中作者的多種著錄格式,收錄文獻中所揭示的引用次數不是該文章的最終次數,僅限于參考。
(2)從引文檢索界面實現。CSCD引文檢索一般使用第一作者檢索被引文獻。引文檢索時,如果不限定第一作者,雖然可以檢索到部分非第一作者文獻被引用的情況,但是檢索結果不全。例如,某作者以第三作者發表的論文,如果引證文獻中的參考文獻只標注了第一作者姓名,那么在做引文檢索時,用非第一作者姓名檢索時就查不到,所以非第一作者被引文獻檢索時建議使用第一作者進行檢索。
被引文獻的表達:CSCD在做標引的時候沒有將被引文獻進行規范化著錄,導致檢索結果中同一篇被引文獻可能出現多個命中,有時候還不排列在相近的位置,檢索時需要格外仔細,因此,提高CSCD引文檢索的查全率,不但要了解CSCD的編排和處理規則,還要不斷地從實踐中總結各種可能遺漏的情況和判斷結果的方法。
3.1 完善來源文獻信息
由于來源文獻信息是核實引文檢索結果的重要依據,而被評價對象在提供論文信息時往往存在論文目錄不全、個別論文信息不全甚至錯誤、以中國出版的英文版期刊或發表的國際學術期刊論文缺少關鍵性英文信息等。因此,在實施檢索前發現問題及時與論文作者溝通,將目錄信息補充完整,或通過檢索《中國期刊全文數據庫》、館藏OPAC系統以及網絡搜索引擎等方式把目錄清單補充完整。
3.2 查全檢索詞的多種縮寫
3.2.1 被引作者
CSCD中英文引文的著錄格式沒有統一標準,中國作者名稱及縮寫形式多種方式甚至錯誤的拼寫都可以檢索到結果。
如:張樹霖
Zhang shulin=(shulin zhang)
Zhang shu-lin=(zhang shu lin)
Zhang sl
Zhang s l=(Zhang s-l)
Zhang s
Zhang shl
(1)不同的拼寫
例一:鄭綿平論文的引文檢索結果中同一篇文獻的不同拼寫(見表1)。
例二:鄭綿平著作的引文檢索結果中同一篇文獻的錯誤拼寫(見表4)。
為避免由于作者名拼寫的不同造成的漏檢,一般利用截詞符或多種拼寫的同字段組配方式檢索,但如果檢索結
果數量過大,就要采取分次輸入檢索詞,并結合與其他檢索字段的組配,以提高檢索效率。
3.2.2 被引來源
對于中文語種的出版物,既要了解其更名歷史,又要將其名稱準確英譯,并給出各種可能的縮寫形式。
例:《物理化學學報》在CSCD索引中提供的全稱及多種縮形式均有檢索結果(見表5)。
為避免漏檢, 英文刊名的檢索可選取來源文獻名稱中的任意一個詞作為檢索詞, 并與其他檢索字段進行組配,檢索結果與來源文獻信息核對確認。
3.2.3 被引文獻出版年
引文檢索時,如果被引作者和被引來源檢索結果量大時,可限定被引出版年和論文發表時間。但由于引文信息中的年段著錄經常出現錯誤,如同一篇文章年不一致:
侯增謙 地球科學.1990,16(2):153 4
侯增謙 地球科學.1991,16(2):153 7
因此,利用該檢索字段時,應將論文發表時間進行適當的擴展,以提高查全率。
3.3 寬泛檢索字段的邏輯組配
被引作者、被引第一作者、被引來源、被引機構、被引實驗室、被引文獻主編、被引文獻出版年和論文發表年之間均可進行邏輯組配,可以有效地提高查準率、查全率和檢索效率。但因被引作者、被引著作均有多種拼寫且各檢索字段均有可能出現錯誤,因此,只有在單一字段的檢索結果過于龐大的情況下,才使用不同字段組配的方式,但組配的字段不宜過多,更不能把檢索詞定的過于嚴格,應根據檢出結果,靈活調整檢索策略。
3.4 利用相關信息確認檢索結果
在實際檢索中,同一篇學術論文的引用信息經常出現差異。如:
4 問題及建議
通過以上案例分析,為了有效的提高CSCD引文檢索的查全率查準率,CSCD數據庫還需要不斷的完善。以下是檢索過程中常見問題及建議:
4.1 增加邏輯組合檢索字段
能否給用戶提供多途徑的查詢,是評價數據庫的一個重要指標,方便用戶檢索的字段也同樣重要,CSCD數據庫中的邏輯組合檢索項只有3項,邏輯組合字段不能任意添加,引文檢索時,面對作者多種拼寫方式時,不能一次完成檢索,建議增加邏輯組合檢索字段,以提高效率。
4.2 適量增加核心期刊和優秀期刊的收錄
CSCD只收錄國內出版的核心期刊和少量的優秀期刊,是影響查全率的因素之一,可以適量增加核心期刊和優秀期刊的收錄。
4.3 增加精確檢索
引文檢索時,輸入被檢作者的各種拼寫方式進行檢索時,數據庫檢出的結果默認的是模糊檢索,例如檢索作者xiao d時,在作者項輸入xiao d,檢出結果包含Xiao D;Xiao D N;XIAO S D;XIAO D W;Xiao D M;D R Xiao;等等,必須使用英文狀態下的引號括起來,建議增加精確檢索。
4.4 著錄標引規范化
CSCD中英文引文的著錄格式沒有統一標準,來源文獻及作者名稱的縮寫形式多種方式甚至錯誤的拼寫都可以檢索到結果。檢索過程繁瑣,導致檢索結果中同一篇被引文獻可能出現多個命中,并且不排列在相近的位置,需要檢索人員整合數據。建議加強對發表論文中參考文獻著錄的規范控制;也建議中國科學文獻服務系統建立相應的機制,除更好地規范引文標引外,應及時地更改現有的不夠準確甚至錯誤的標引,賦予CSCD更高品質的引文索引。
4.5 增加來源文獻檢索字段
檢索字段少,建議適當增加來源文獻所在頁碼、ISSN、ISBN號等相關信息的檢索點,以提高檢索效率。
5 結 語
CSCD引文檢索是一種比較復雜的信息檢索,如何制定優良的檢索策略是關系到能否獲得滿意檢索結果的核心問題。檢索人員除了必須清楚CSCD的編排結構,編排時對特殊符號、非英文語種、著者名稱等的處理規則外,應善于積累個案,善于將實際檢索中所觸及到的一些常見的典型問題進行匯總分析,不斷提高引文檢索的技巧,有效地保障引文檢索的查全率與查準率。
參考文獻
[1]http:∥sdb.csdl.ac.cn/indexzmore5.jsp[EB].
[2]樂平.用CSCD數據庫作各學科定量評價工具有缺陷[J].科技情報開發與經濟,2006,(10):238-239.
[3]周靜怡,廖鳳,劉小兵,等.CSCD個性化服務研究與設計[J].圖書情報工作,2011,(7):106-110.
[4]趙蓉英,雷將,馬瑞敏,等.我國五大數據庫引文功能的比較研究[J].情報理論與實踐,2008,(4):589-593,605.