999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于文獻(xiàn)資料科技查新關(guān)鍵詞的選擇方法

2021-04-11 16:23:42謝雨珊
甘肅科技 2021年18期
關(guān)鍵詞:科技方法

張 勇,謝雨珊

(1.甘肅省科學(xué)技術(shù)情報研究所,甘肅 蘭州 730000;2.蘭州交通大學(xué)外國語學(xué)院,甘肅 蘭州 730070)

近年來科學(xué)技術(shù)高速發(fā)展,科技查新委托量迅猛增長,公眾對科技文獻(xiàn)查新服務(wù)質(zhì)量的要求越來越高。科技查新已成為成果轉(zhuǎn)化、新產(chǎn)品鑒定、科技進(jìn)步獎評定、設(shè)立創(chuàng)新基金、專利申請和科研立項等申報過程中必不可少的一環(huán)。至2009 年世界上總計有超過5000 萬篇科技論文[1],而每年新增的期刊論文數(shù)量超250 萬[2],同時專利申請量的劇增帶來了巨量專利文獻(xiàn)。如何從海量的數(shù)據(jù)庫中挖掘出符合查新項目所屬技術(shù)要求的相關(guān)文獻(xiàn),給查新工作提出了更高的要求,查新質(zhì)量管控建設(shè)對查新機(jī)構(gòu)越發(fā)重要。在開展科技查新時,關(guān)鍵詞、檢索式是重中之重。如何全、準(zhǔn)、快地從數(shù)據(jù)庫獲得相關(guān)文獻(xiàn),并不是十分容易的事。一方面,查新員受知識面、外語水平、文獻(xiàn)檢索能力等綜合業(yè)務(wù)素質(zhì)和社會責(zé)任感的影響,阻礙了其對委托查新項目包含的技術(shù)要點深層次的理解;另一方面,委托人由于各種原因不能通過技術(shù)交底書將項目的技術(shù)要點充分地表達(dá)出來;再有,沒有建立一套規(guī)范的查新標(biāo)準(zhǔn)化工作程序和使用科學(xué)的檢索方法。實際上,查新機(jī)構(gòu)已經(jīng)意識到以上問題的存在,同時已經(jīng)在逐步改進(jìn)其工作方法并研究制定相應(yīng)的工作流程,如開展查新人員業(yè)務(wù)培訓(xùn)、進(jìn)行工作心得交流、舉辦委托人學(xué)習(xí)班、設(shè)置受理業(yè)務(wù)崗等。而“關(guān)鍵詞”的選擇一直以來卻無法有統(tǒng)一的標(biāo)準(zhǔn),都是因人而異進(jìn)行操作。

1 關(guān)鍵詞在科技文獻(xiàn)查新中的作用

關(guān)鍵詞是圖書館學(xué)中的專有名詞,也是使用詞頻最高的文獻(xiàn)檢索詞語,早期來源于英文“keywords”。確定關(guān)鍵詞是開展查新工作的起點。人們一般都是在進(jìn)行專利檢索時認(rèn)識“檢索詞”,了解科技查新與專利檢索的不同,專利“檢索詞”與科技查新“關(guān)鍵詞”的區(qū)別對我們掌握科學(xué)的查新方法提高查新質(zhì)量非常有益,通過研究比較二者的區(qū)別了解“關(guān)鍵詞”在科技查新中所起的作用能更好地理解其在實際工作中的應(yīng)用價值。

(1)作用不同。專利檢索中使用“檢索詞”、利用檢索工具開展檢索工作,是對在一定時間內(nèi)已公布的國內(nèi)外公開出版物進(jìn)行所指技術(shù)的新穎性,創(chuàng)造性的檢索,檢索詞提供了查找專利文件的渠道和方法。文獻(xiàn)查新中的“關(guān)鍵詞”反映了查新項目主題內(nèi)容的查新點,借此獲取密切相關(guān)文獻(xiàn),并運(yùn)用綜合分析和對比方法,對技術(shù)要點的新穎性、創(chuàng)造性做出文獻(xiàn)評價和情報咨詢服務(wù)[3]。

(2)目的不同。通過專利檢索詞獲取的對比文獻(xiàn),是為了將文獻(xiàn)中的技術(shù)與現(xiàn)有技術(shù)進(jìn)行比對,對擬申請專利的技術(shù)方案做出新穎性、創(chuàng)造性的判斷,目標(biāo)為文獻(xiàn)記載的技術(shù)方案(說明書和權(quán)利要求書)。而科技查新是通過科技文獻(xiàn)查新結(jié)合科技咨詢?yōu)榭蒲辛㈨椇丸b定工作提供鑒證,是對查新項目的新穎性、創(chuàng)造性做出基于文獻(xiàn)報道的相關(guān)技術(shù)的評價,對比的是包含有相關(guān)技術(shù)的文獻(xiàn)。

(3)主體不同。專利檢索的主體是與專利有關(guān)的利害關(guān)系人,文獻(xiàn)查新的主體是與該項技術(shù)有關(guān)的創(chuàng)新者。

(4)檢索(查新)報告的結(jié)論不一樣。專利檢索的結(jié)論必須明確,對擬申請專利的技術(shù)方案作出是否具有新穎性、創(chuàng)造性的判斷;而文獻(xiàn)查新是找出與技術(shù)要點相關(guān)、不同、以及完全相同的公開發(fā)表文獻(xiàn),查新結(jié)論實際上是對相關(guān)公開文獻(xiàn)與技術(shù)要點對比后做出的評價報告。

科技查新采用的工作方法和過程都與專利檢索不同,它是文獻(xiàn)檢索和情報調(diào)研相結(jié)合的研究工作,且具有獨(dú)特性。由此可見,掌握一套科學(xué)的查新方法十分重要。“關(guān)鍵詞”就像一把打開通往數(shù)據(jù)庫大門的鑰匙,如何選擇關(guān)鍵詞直接關(guān)系到查新結(jié)果的準(zhǔn)確性與全面性。我們把“關(guān)鍵詞”理解為作為查新入口的關(guān)鍵性專業(yè)名詞術(shù)語更為恰當(dāng)。

2 研究資料與方法

(1)文獻(xiàn)來源:檢索2010 年1 月1 日-2020 年12 月31 日收錄在萬方數(shù)據(jù)知識服務(wù)平臺和中國知識資源總庫——CNKI 系列數(shù)據(jù)庫的文章。

(2)研究方法:選擇關(guān)鍵詞“科技查新、關(guān)鍵詞、選擇”組建檢索式,依數(shù)據(jù)庫特點進(jìn)行文獻(xiàn)查新,兩個數(shù)據(jù)庫共查到20 篇相關(guān)文獻(xiàn)。篩選出符合研究標(biāo)準(zhǔn)的文獻(xiàn),對有關(guān)“關(guān)鍵詞選擇”的方法及研究的文獻(xiàn)進(jìn)行分析比對。

3 研究目的

通過檢索科技查新中有關(guān)選擇關(guān)鍵詞的文獻(xiàn),整理總結(jié)出實際工作中選擇關(guān)鍵詞的步驟和常用方法,以此改進(jìn)現(xiàn)有查新方法與同行共勉。

4 研究過程

選擇關(guān)鍵詞必須要遵循科技查新快、準(zhǔn)、全的原則,這就使得選擇關(guān)鍵詞的方法具有一致性。但要兼顧三方面是不易做到的,它們之間存在矛盾性,導(dǎo)致關(guān)鍵詞的選擇始終伴隨著“擴(kuò)大或縮小”檢索范圍而貫穿查新工作的始終。

康陽[4]提出的采用組合選擇方法調(diào)整匹配關(guān)鍵詞即通過布爾邏輯算法組配關(guān)鍵詞和限定檢索優(yōu)化法即向已選關(guān)鍵詞提供不同類型的限定語法。該方法通過確定各關(guān)鍵詞之間的關(guān)聯(lián)性來制定檢索策略,實現(xiàn)數(shù)個關(guān)鍵詞之間的邏輯化組配。采用優(yōu)化方式限定關(guān)鍵詞數(shù)量、縮減關(guān)鍵詞選擇范圍以此約束文獻(xiàn)的檢索范圍,保障文獻(xiàn)檢索的準(zhǔn)確性。截詞檢索優(yōu)化、加權(quán)檢索優(yōu)化、位置算符優(yōu)化這些方法化解了關(guān)鍵詞選擇中的矛盾性,盡可能保證了其一致性的特征。該方法的優(yōu)點是:優(yōu)化關(guān)鍵詞,拓寬檢索途徑,約束檢索范圍,使檢索結(jié)果達(dá)到“全、準(zhǔn)”的要求。張柏秋,吳曉鐄[5]以“布氏桿菌病的防治研究課題”為例闡述了關(guān)鍵詞擴(kuò)展前后的檢出文獻(xiàn)篇數(shù)的差異性。選擇維普數(shù)據(jù)庫作為檢索數(shù)據(jù)來源,以布氏桿菌病防治為關(guān)鍵詞進(jìn)行檢索,共檢到83篇文獻(xiàn)。然而借助詞表對“布氏桿菌病”進(jìn)行擴(kuò)展,得到布魯桿菌病(49 篇)、布魯氏菌病(1352 篇)、布氏菌病(579 篇)等,如果使用以上擴(kuò)展詞進(jìn)行組合建立檢索式(布氏+布魯+傳染性流產(chǎn)+波狀熱+馬爾他熱+地中海熱)防治共檢到897 篇相關(guān)文獻(xiàn)。使用詞表擴(kuò)展關(guān)鍵詞對查新結(jié)果的客觀性、公正性的影響不言而喻,由此可見詞表在關(guān)鍵詞選擇中的作用非同小可。

近年來,同行從不同角度對選擇關(guān)鍵詞的方法做了大量研究工作。肖紅,連麗艷[6]提出了借助專業(yè)術(shù)語、標(biāo)準(zhǔn)、辭海、詞典、等工具書及檢出文獻(xiàn)的參考資料展開關(guān)鍵詞,利用關(guān)鍵詞的同義詞、近義詞以及上下位詞、外來詞等,綜合考慮關(guān)鍵詞的擴(kuò)展問題,使其成為關(guān)鍵詞選擇的常用方法,基本方法。邢春國[7]從查新人角度提出了“預(yù)檢索”概念,對其使用的自由詞法進(jìn)行了解釋。他認(rèn)為目前采用關(guān)鍵詞檢索法和主題詞檢索法是科技查新的主要途徑。關(guān)鍵詞法一般稱為自由詞法,是應(yīng)計算機(jī)自編索引而產(chǎn)生。實際經(jīng)驗告訴我們,濃縮文獻(xiàn)內(nèi)容的摘要是關(guān)鍵詞出現(xiàn)頻率最高的地方,從摘要中選出關(guān)鍵詞進(jìn)行文獻(xiàn)檢索結(jié)果更加可靠,比題目、全文檢索更快更準(zhǔn)確。如果把這種預(yù)見方法使用在諸如以查新為目的的檢索,達(dá)到“快”的目的更為有效。同時還提出了作者法、機(jī)構(gòu)檢索法、期刊瀏覽法、引文檢索法等檢索策略值得查新人員借鑒。

不可忽視,近年來國內(nèi)越來越多的高質(zhì)量學(xué)術(shù)論文都選擇了在國外期刊發(fā)表,國外文獻(xiàn)檢索日益增多。英文關(guān)鍵詞的選擇與中文存在較大差異,除了不同語言帶來的理解問題外還有兩種語言使用的詞語表達(dá)方式不盡相同的原因。諸如中文中的“一詞多義”和英語中“自由詞”問題,故進(jìn)行國外文獻(xiàn)檢索時選擇關(guān)鍵詞的方法有所不同。張美琦[8]分析了國外文獻(xiàn)查新中英文關(guān)鍵詞的選擇,提出的從網(wǎng)絡(luò)資源視角下英文關(guān)鍵詞的擴(kuò)展與完善策略不愧為一種創(chuàng)舉。文章指出,中文關(guān)鍵詞的選擇方法不適用于國外文獻(xiàn)檢索。初選英文關(guān)鍵詞后,借助CNKI 翻譯助手(http://dict.cnki.net)、歐洲專利局網(wǎng)站(http://ep.espacenet.com)、電子詞典(格斯翻譯家、有道詞霸和谷歌金山詞霸等)等,采用邏輯組配方法列出檢索式,進(jìn)入文獻(xiàn)數(shù)據(jù)庫開始試檢。英文關(guān)鍵詞通過這種方式依次完成復(fù)選、再篩選、擴(kuò)補(bǔ)和精煉、以能夠直接檢索到國際同行發(fā)表的英語相關(guān)文獻(xiàn)為目標(biāo)。這樣我們就可以較容易得到符合英語語法表達(dá)方式和語境的詞頻、雙語、新鮮詞等;合理地將 “自由詞” 轉(zhuǎn)化為符合查新關(guān)鍵詞的復(fù)核目的。

隨著大數(shù)據(jù)的發(fā)展,結(jié)合計算機(jī)技術(shù)的應(yīng)用,許多研究者已經(jīng)開始探索借助網(wǎng)絡(luò)技術(shù),基于大數(shù)據(jù)下的關(guān)鍵詞選擇方法,使AI 應(yīng)用于科技查新,克服手工工作量大、不規(guī)范、費(fèi)時費(fèi)力的突出問題,實現(xiàn)關(guān)鍵詞選擇過程的自動化、智能化、規(guī)范化。王培,霞余海,陳力[9]等提出了借助統(tǒng)計特征、基于主題模型和基于詞圖模型的關(guān)鍵詞自動抽取方法。兩種模型分別采取通過計算詞的某些特征(如詞頻、N-gram、TF-IDF 值等),結(jié)合其位置標(biāo)記(如題名、段首、首次出現(xiàn)的位置等)為詞分配權(quán)重,根據(jù)權(quán)重大小順序提取關(guān)鍵詞;通過大量已知的 “詞語-文檔” 矩陣和一系列訓(xùn)練推理出 “文檔-主題” 分布和 “主題-詞語” 分布的LDA 模型;以Text Rank 算法,將文檔構(gòu)建成一個詞圖,圖中每個節(jié)點對應(yīng)一個候選關(guān)鍵詞,每條邊代表候選關(guān)鍵詞之間的關(guān)系。該方法利用文獻(xiàn)本身作者標(biāo)注關(guān)鍵詞的領(lǐng)域?qū)I(yè)特性,有助于防止漏檢、提高查全率、查準(zhǔn)率,這與以文獻(xiàn)標(biāo)引為目的的關(guān)鍵詞抽取有很大區(qū)別。其優(yōu)點為:相關(guān)文獻(xiàn)的來源更豐富。通過檢索過程中產(chǎn)生的文獻(xiàn)語料,充分考慮相關(guān)文獻(xiàn)所屬領(lǐng)域的相關(guān)性、數(shù)據(jù)量、內(nèi)容及結(jié)論的權(quán)威性等,突出表現(xiàn)出檢索過程的顯著性特點。所抽取的關(guān)鍵詞通過網(wǎng)絡(luò)爬蟲在線獲取,可以與數(shù)據(jù)源保持同步,具有動態(tài)性、實時性,不會隨著時間的變化而發(fā)生過時的特點;抽取的關(guān)鍵詞通常是表示領(lǐng)域概念的基本要素,具有較強(qiáng)的指示性、領(lǐng)域區(qū)分能力,是檢索詞的重要來源。

5 研究結(jié)果

從科技查新質(zhì)量管控視角下研究關(guān)鍵詞的選擇方法,嘗試一些關(guān)鍵詞的選擇方法非常必要。科技查新中查全和查準(zhǔn)始終是矛盾體,但他們是評價某一檢索系統(tǒng)檢索性能高低的標(biāo)準(zhǔn)。在檢索過程中,查新員應(yīng)依勢靈活調(diào)整檢索策略,解決好查全率和查準(zhǔn)率之間的互逆關(guān)系。但在實際工作中,查全是整個查新工作的前提,查準(zhǔn)是必然結(jié)果。盡力做到根據(jù)查新目的不同合理解決二者的關(guān)系,對課題鑒定、產(chǎn)品查新、成果評價應(yīng)提高查準(zhǔn)率;對立項查新、科研申報應(yīng)重點保證查全率。選擇關(guān)鍵詞包括兩個步驟,即確定初選關(guān)鍵詞和擴(kuò)展關(guān)鍵詞。參考用戶提供的關(guān)鍵詞、通過項目名稱、技術(shù)方案、查新點等初步選擇關(guān)鍵詞。選擇有效方法調(diào)整匹配關(guān)鍵詞,使關(guān)鍵詞組配邏輯化,在“快、準(zhǔn)、全”的原則下使關(guān)鍵詞拓展與關(guān)鍵詞限定語法科學(xué)結(jié)合,既要有效縮減關(guān)鍵詞選擇范圍,又要保障檢索結(jié)果的準(zhǔn)確性;采用同義詞、近義詞、上下位詞、外來詞、以及反義詞,掌握不同領(lǐng)域詞表的使用方法,充分利用詞表的擴(kuò)展功能;利用網(wǎng)絡(luò)資源對英文關(guān)鍵詞進(jìn)行擴(kuò)展與完善;利用相關(guān)文獻(xiàn)的參考文獻(xiàn);大數(shù)據(jù)環(huán)境下采用基于計算機(jī)建模的關(guān)鍵詞選擇方法等。通過以上擴(kuò)展策略,對關(guān)鍵詞進(jìn)行重新復(fù)核、篩選、補(bǔ)充、精煉使其精確運(yùn)用于查新工作中。

猜你喜歡
科技方法
筆中“黑科技”
學(xué)習(xí)方法
科技助我來看云
科技在線
科技在線
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
科技在線
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 成人午夜视频在线| 91成人免费观看| 在线视频97| 无码中文字幕乱码免费2| 国产精品女人呻吟在线观看| 亚洲国产成人精品无码区性色| 国产高清在线观看91精品| 欧美激情视频在线观看一区| 91精品啪在线观看国产91| 国产黄色片在线看| 国产噜噜噜视频在线观看| 日韩福利视频导航| 国产亚洲现在一区二区中文| 992tv国产人成在线观看| 看国产一级毛片| 成人午夜视频免费看欧美| 久久这里只精品国产99热8| 亚洲A∨无码精品午夜在线观看| 黄色网在线| 亚洲第一黄色网址| 72种姿势欧美久久久久大黄蕉| 国产视频大全| 久久久久青草线综合超碰| аⅴ资源中文在线天堂| 久久人搡人人玩人妻精品一| 91精品情国产情侣高潮对白蜜| 一区二区三区国产精品视频| www.91在线播放| 亚洲欧美综合精品久久成人网| 国产人碰人摸人爱免费视频| 激情综合网址| 亚洲第一极品精品无码| 国产精欧美一区二区三区| 99资源在线| 欧美精品伊人久久| 日韩中文欧美| 精品三级网站| 国产丰满大乳无码免费播放| 日韩久草视频| 国产在线精彩视频论坛| 午夜毛片免费观看视频 | 国产精品视频999| 波多野结衣中文字幕一区| 亚洲AV电影不卡在线观看| 丰满少妇αⅴ无码区| 99视频在线免费观看| 国产一区二区网站| 亚洲第一黄色网址| 99久久精品美女高潮喷水| 啪啪免费视频一区二区| 成人国产免费| 亚洲第一中文字幕| 免费无遮挡AV| 久久久精品国产SM调教网站| 久久婷婷六月| 午夜毛片免费看| 日韩 欧美 国产 精品 综合| 中国成人在线视频| 亚洲成年人网| 亚洲女同一区二区| 高h视频在线| 成人综合网址| 日本在线欧美在线| 伊人丁香五月天久久综合| 麻豆AV网站免费进入| 日韩免费中文字幕| 高清国产在线| 国产乱子伦手机在线| 精品成人免费自拍视频| 欧美第一页在线| 国产高潮视频在线观看| 色网站在线免费观看| 香蕉久久永久视频| 扒开粉嫩的小缝隙喷白浆视频| 亚洲成人精品久久| 亚洲色婷婷一区二区| 成年看免费观看视频拍拍| 无码电影在线观看| 欧美成人在线免费| 无码网站免费观看| 91九色国产在线| 2021国产精品自拍|