康洋
摘 要:科技查新檢索與普通的文獻檢索存在著很大的區別,科技查新的對象是科學技術內容,如:申報新產品、科技成果轉讓等,普通文件檢測只需要滿足課題就可以,而科技查詢檢索中需要綜合分析查詢內容的專業信息,評估查詢對象是否具有新穎性、先進性以及創造性。科技查詢檢索中,關鍵詞選擇是一項重要的內容,準確選擇關鍵詞有利于提高科技查詢檢索的水平和準確性。由此,文章主要探討科技查詢檢索中關鍵詞的選擇。
關鍵詞:科技查新;檢索;關鍵詞;選擇
中圖分類號:G252.7 文獻標志碼:A 文章編號:2095-2945(2018)04-0163-03
Abstract: There is a great difference between scientific and technological novelty retrieval and common literature retrieval. The object of scientific and technological novelty retrieval is science- and technology-related contents, such as declaring new products, transferring scientific and technological achievements, and so on. Ordinary file detection only needs to meet the subject, while in the scientific and technological query retrieval, we need to comprehensively analyze the professional information of the query content, and evaluate whether the query object has novelty, advanced nature and creativity. Keyword selection is an important content in scientific and technological query and retrieval. The accurate selection of keywords is helpful to improve the level and accuracy of scientific and technological query and retrieval. Therefore, this paper mainly discusses the choice of keywords in scientific and technological query and retrieval.
Keywords: sci-tech novelty retrieval; retrieval; keyword; selection
現階段普通文獻檢索利用關鍵詞直接搜集資料,關鍵詞檢索的目的性強,不需要做歸納、整理的操作,而科技查詢檢索需要出具查新的報告,對選擇關鍵詞的要求比較高,關鍵詞要具備調取數據庫內相關文獻的能力,而且關鍵詞要查全、查準所需文獻,根據科技查詢的要求完成科技查詢的報告。關鍵詞選擇是科技查新時的重要工作,關鍵詞的選擇直接關系到科技查新的組配結果,決定了科技查新的準確性與全面性。
1 科技查新檢索中關鍵詞的選擇問題
科技查新本身是一項專業的工作內容,科技查新要求檢索者具有專業、綜合的能力,由此才能向委托人提供優質的服務,準確找出可用的文獻資源。科技查新中的一項重要工作就是選擇關鍵詞,關鍵詞關聯著數據庫中的文獻資源,準確選擇關鍵詞才能保證科技查新的質量[1]。關鍵詞選擇的難度高,檢索者很難在海量的文獻中選擇對應的關鍵詞,只能逐步優化關鍵詞的選擇,才能獲取對應的文獻。科技查新檢索中關鍵詞的選擇問題是不能忽視的功能,我國詞庫中的詞匯量非常大,存在“一物多名”的情況,正是此類情況就引起文獻漏檢以及錯誤的問題,嚴重時還會引起產權糾紛、專利重復立項的問題,而且關鍵詞本身就容易發生混淆,導致關鍵詞中出現真偽詞匯混合的情況,增加了科技查新工作的困難度,也會在關鍵詞選擇中形成各種類型的問題。
2 科技查新檢索中關鍵詞的選擇方法
關鍵詞是科技查新檢索的主要方法,科技查新檢索中如果選用簡單的關鍵詞就會引起檢索不準確、不合理的情況,不能為科技查新提供對應的檢索文件。科技查新檢索中必須要注意關鍵詞的選擇,選擇關鍵詞時要注意組合、擴展、組配,在此基礎上準確檢索科技查新的文件,保障關鍵詞的檢索效率。例舉科技查新檢索中關鍵詞的選擇方法,如下:
2.1 組合檢索
關鍵詞選擇中的組合檢索方法,是指在明確關鍵詞初次檢查委托人的關鍵詞,初檢過程中很容易遇到關鍵詞選擇不恰當的問題,此時就要采用組合選擇的方法調整匹配的關鍵詞,確保科技查新中能夠檢索到對應的文獻[2]。科技查新的文獻內容較為深奧,簡單或有限的關鍵詞很難準確的描述科技查新的需求,容易出現檢索漏洞,導致大量有用的文獻檢索不到,而組合關鍵詞中利用了“分類號-關鍵詞”的組合方式,其可補充關鍵詞檢索的不足之處,更重要的是此類組合關鍵詞中的分類號是文獻的標志語言,其根據文獻的類別、屬性區分了各類科技查新的文獻,分類號與關鍵詞組合檢索中能夠直接找到屬性類似的文獻,同時把屬性類似的文獻集中起來。關鍵詞選擇中采用組合的方法檢索時首先要明確科技查新所需文件的類屬,從類屬目錄下按照關鍵詞進行檢索,保障科技查新的質量,快速找到科技查新的對應文獻。
2.2 擴展檢索
科技查新檢索選擇關鍵詞時采用擴展的方法,以基礎關鍵詞為主擴展相關的關鍵詞。擴展檢索促使關鍵詞可以達到合理的檢索標準,關鍵詞擴展檢索的選擇方法中,一定要注意委托人提供的關鍵詞,直接參考委托人的關鍵詞,組織擴展的工作,致力于向委托人提供技術型的科技查新資料,幫助委托人獲取可用的查新點[3]。關鍵詞擴展選擇檢索工作中,需要篩選、提煉、補充、審核等操作,有效確定出符合科技查新要求的關鍵詞。擴展關鍵詞后首先要初檢,如果初檢中發現關鍵詞不符合科技查新的需求,就要重新安排關鍵詞擴展的工作,直到找出與科技查新主題相符的關鍵詞。關鍵詞擴展檢索的過程中利用了詞典、詞表等工具,提高科技查新文件的檢出率,擴展時分析關鍵詞的近義、同義詞匯,經過一系列的專業分析后選擇出擴展關鍵詞。endprint
2.3 組配檢索
科技查新檢索選擇關鍵詞時通過布爾邏輯算法組配關鍵詞,以便正確選用關鍵詞。布爾邏輯算法可以表明科技查新檢索中各個關鍵詞之間的關聯,檢索關鍵詞時準確選出邏輯算符,實現關鍵詞之間的邏輯組配,達到準確檢索的目的。組配檢索中選擇的關鍵詞,可以控制關鍵詞的數量,同時拓寬關鍵詞在數據庫中的檢索途徑,改進關鍵詞檢索的范圍[4]。組配方法選擇關鍵詞方面最常用的方法就是布爾邏輯檢索,通過邏輯與、或、非的算符方法組合簡單的關鍵詞,促使關鍵詞可以組配成新型的檢索關鍵詞。組配關鍵詞檢索可以有目的地擴大、縮小文獻檢索的范圍,去除科技查新檢索中不相關的檢索結果,更加注重科技查新檢索目標的準確性。基于布爾邏輯算法的組配關鍵詞選擇方法,促使科技查新檢索的結果更加符合實際需求,促使檢索者可以判斷科技查新檢索文獻是否創新。
3 科技查新檢索中關鍵詞的選擇優化
科技查新檢索中關鍵詞選擇方法的優化,有利于提高關鍵詞的選擇質量,保障科技查新檢索的速率和效率。優化過程可以改善關鍵詞在科技查新中的檢索過程,優化選擇向關鍵詞提供了限定條件,目的是準確選擇科技查新時的關鍵詞。結合科技查新檢索中關鍵詞的選擇,例舉幾項優化的措施,如下:
3.1 限定檢索優化
科技查新檢索中的關鍵詞選擇,優化時采用限定檢索的優化方法。限定檢索向關鍵詞選擇提供了不同類型的限定語法,限定并約束關鍵詞在文獻中的檢索范圍,有效縮減關鍵詞選擇的范圍,而且保障文獻檢索的準確性[5]。限定檢索優化方法解決了自然詞匯中出現的檢索問題,過濾掉與科技查新檢索文獻相類似或者近義的資源,保障科技查新關鍵詞的準確性。限定檢索優化的方法促使關鍵詞的詞義更為明確,精簡了文獻輸出的檢索信息。限定檢索在關鍵詞選擇的優化方法中,合理運用限制格式、限制字段、限制語言、限制地域的方法把控文獻檢索的具體范圍,在范圍限制方面的效果非常明顯,在有限的檢索范圍中找出最符合科技查新的文獻。
3.2 截詞檢索優化
截詞檢索優化途徑中要借助計算機系統,計算機向關鍵詞提供了固有、指定位對比方法,經過對比分析后判斷出有效的關鍵詞。截詞檢索優化可以比較標引詞和不完整次,做好匹配檢索的工作后直接截取關鍵詞的某個位置。截詞檢索優化的核心是在詞匯上添加截詞符號,以便查找關鍵詞對應不同形式的文獻。例如:截詞檢索優化中可以為關鍵詞添加前綴、后綴,進而獲取更多意義的派生詞匯,一來可以預防檢索遺漏,二來保證科技查新檢索的效率。截詞檢索優化中經常采用位置截斷或者截斷字符的方法,按照科技查新關鍵詞的需求完成截詞檢索的優化選擇。
3.3 加權檢索優化
加權檢索優化在組配檢索的布爾檢索上實行了改進處理,關鍵詞加權選擇中采用了“+”、“-”的方法,權是指關鍵詞的重要程度,專門針對含有關鍵詞的文獻安排加權計算,根據權值的大小判斷科技文獻相關度的高低,按照加權優化的順序輸出檢索的文獻。加權檢索優化后選擇的關鍵詞具有一定的重要性,促使文獻具有順序性的特征,預防發生漏檢問題。
3.4 位置算符優化
科技查新檢索中關鍵詞選擇時采用位置算符檢索優化的方法,利用特殊符號控制關鍵詞的位置[6]。例如:科技查新中的關鍵詞為詞組時就可以選擇位置算符隔開詞組,位置算符優化分成了四類,第一是(W),表示關鍵詞組隔開后的順序且順序不能顛倒;第二是(N),關鍵詞隔開的順序而順序可以顛倒;第三是(S),同一字段中連續的兩個關鍵詞,順序不限,第四是(L),從屬關系的關鍵詞,按照上位、下位的概念關系限定關鍵詞的位置。
4 科技查新檢索中關鍵詞的選擇案例
以某科技查新委托為例,分析科技查新檢索中關鍵詞的選擇過程。該案例科技查新者在接收到委托任務后立即和委托人進行了溝通交流,查新者了解了科技查新委托課題的相關內容,如:課題的技術背景、參數,以及國內文獻和國外文獻的差異。查新者要求委托人提供與科技查新相關的詳細文獻,同時由委托人提供查新項目的參考文獻,在此基礎上查新者選擇并確定關鍵詞。
該案例中采用了四種方法選擇科技查新檢索的關鍵詞,以便為委托人提供理想的查新結果。首先是查新者把科技查新檢索的題目原樣輸入到檢索頁面中,根據題目查詢可用的文獻篇章,題目越詳細查新結果越少,檢索的文獻也就越不準確,接下來查新者利用布爾邏輯組配關鍵詞,根據關鍵詞在題目中的語句關系和邏輯運算,匹配可精確查詢的關鍵詞,適當精簡關鍵詞,案例中此次查新仍舊不能滿足委托者的要求,查新者去掉了關鍵詞中的冗余成分,例如該查新中關鍵詞后綴有“技術”一詞,查新者去掉了“技術”,檢索文獻數量達到了257條,比原來增加了101條,其中相關文獻增加了35篇,之后查新者又實行了同義詞擴展的選擇方法,檢索與關鍵詞相近的文獻,向委托人提供文獻參考。
5 結束語
科技查新檢索中選擇關鍵詞時,全面了解科技查新數據庫的發展,數據庫更新速度非常快,一定要注意關鍵詞的創新選擇,滿足科技創新的基本需求,同時還能提高科技查新檢索的專業性。科技查新檢索中準確選擇關鍵詞,通過關鍵詞檢索科技查新所需的數據信息,完成報告整理與創新工作。
參考文獻:
[1]王培霞,余海,陳力,等.科技查新中檢索詞智能抽取系統的設計與實現[J].現代圖書情報技術,2016(11):82-93.
[2]任偉萍.化工領域科技查新技巧[J].內蒙古科技與經濟,2016(05):13+15.
[3]張曉英.科技查新工作中的問題與對策[J].甘肅科技縱橫,2015,44(08):14-15+33.
[4]邢春國.科技查新預檢索及醫學實例分析[J].現代情報,2011,31(11):86-89.
[5]陳予琳.關鍵詞檢索方法在科技查新中的應用研究[J].河南師范大學學報(自然科學版),2011,39(03):171-173.
[6]張柏秋,吳曉 .科技查新檢索中的關鍵詞選擇[J].情報科學,2008(09):1344-1348.endprint