999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺談Patentics智能語義檢索技巧

2020-05-29 09:02:18章文飛
科技視界 2020年11期
關鍵詞:排序語義數據庫

章文飛

摘 要

Patentics語義檢索目前在專利審查實踐中運用越來越廣泛,本文從選庫、常用檢索字段、算符和人工干預介紹了Patentics的檢索技巧。

關鍵詞

Patentics語義檢索;字段;算符;關鍵詞;人工干預

中圖分類號: G252.7;G306 ? ? ? ? ? ? ? ? ?文獻標識碼: A

DOI:10.19694/j.cnki.issn2095-2457.2020.11.018

0 前言

Patentics是基于大數據下的機器學習的智能語義檢索工具,其通過超大規模智能計算和機器學習,自動去理解海量專利文獻的內容,并根據專利文本內容進行智能語義檢索,將檢索結果按照關聯度進行由高到低的排序,極大地提高了檢索效率。本文從選庫、常用檢索字段、算符和人工干預介紹了Patentics的檢索技巧。

1 數據庫的選擇

采用Patentics檢索,選對數據庫很重要。Patentics包括中國(CN)、美國(US)、歐專局(EP)、日本(JP)、韓國(KR)、印度(IN)以及世界知識產權組織的PCT(WO)等多個國家和地區的數據庫,文獻量達千萬級。

我們在選庫時,考慮到Patentics的檢索原理,優先選擇在全文庫檢索,全文庫信息齊全且量大,適合進行語義模型訓練,而摘要庫內容少,只能作為備選數據庫。

檢索中國專利文獻時,只需要勾選“中國發明實用(CNAPP)”庫,“中國發明實用(CNAPP)”庫其實是中國申請庫,所有的發明和實用新型的申請文本都在這個庫里,由于申請文本和授權文本的說明書內容基本一致,“中國發明實用(CNAPP)”庫就必然包括“中國發明授權(CNPAT)”的文獻內容,若兩個庫都勾選,檢索結果中會出現重復文件,造成目標文件在海量文獻中排序靠后。同理,為了避免文獻重復,在歐洲、日本、韓國等數據庫進行專利檢索時,也僅需單獨勾選歐洲申請、日本申請、韓國申請。

但美國需要勾選“美國申請(USAPP)”庫和“美國授權(USPAT)”庫,這是為什么呢?因為美國從2001年3月15號之后才開始公開美國的申請版本,之前是不公開的。如果僅勾選“美國申請(USAPP)”庫,會造成2001年之前的申請版本漏檢;但如果僅勾選“美國授權(USPAT)”庫,會造成近年申請但未授權的文獻或者被駁回的文獻的漏檢。

因此,選擇數據庫時注意:優先選擇全文庫,文摘庫作為備選;中文庫和英文庫要分開檢索;單庫檢索要優于多庫檢索;檢索中國專利文獻時,只需要勾選“中國發明實用(CNAPP)”庫;歐洲、日本、韓國還有中國臺灣,僅需勾選申請庫;美國是特例,既要勾選“美國申請(USAPP)”庫,還要勾選“美國授權(USPAT)”庫。

2 常用檢索字段和算符

2.1 “R/”和“RDI/”

“R/”為Patentics系統默認的檢索字段,是Rerank的縮寫,也就是重排序的意思。“R/”命令后可以輸入文字內容或者專利號碼,例如“R/專利號碼”或者“R/文本(一段話)”。輸入專利號碼時,系統會自動提取該篇專利的全文文本進行語義檢索。

Patentics還提供“RDI/”命令,后可跟專利號碼,含義是檢索該專利申請日前公開的最接近專利文獻。與“R/”相比,“RDI/”對檢索的專利文獻的時間有了限定。

單獨使用“R/”命令或“RDI/”命令時,系統會對全庫進行語義重排序,但只會給出最相關的400篇專利文獻,因為系統在給出檢索結果時,已將更相關的放在了最前面,排名400以后的相關度會越來越低,因此會有默認的截斷。但如果檢索人員想查看更多的信息,可以使用“CTOP/”命令限定要查看的專利數量,例如“CTOP/1000”,查看最相關的1000篇。

在檢索時,通常采用常用檢索字段“R/”和“RDI/”進行初步檢索,將系列申請、抵觸申請以及明顯的新穎性或創造性對比文件查找出來。

2.2 “R / and DI /”

字段組合“R/ and DI/”,“R/”的用法與上述相同,“DI /”后可以跟專利號碼或者日期。當其使用方式為“R/專利號碼and ?DI/專利號碼”時,其作用與“RDI/專利號碼”相同,其中“DI/”取檢索結果中公開日在該專利申請日之前。

一般在進行追蹤檢索或對具有優先權的PCT申請進行檢索時,會采用“R/公開號(或中國申請號)and DI/日期”進行檢索,特別是對具有優先權的申請進行檢索時,“DI/”后面跟具體的日期,可以排除時間上不可用的大量文獻。

2.3 “B /”和“ A / ”

“B/關鍵詞”,其用于全文關鍵詞檢索。常用方式為“RDI/ and B/”,例如“RDI/cn103522482 ?and ?B/冰箱”,還可“RDI/cn103522 482 ?and ?B/((冰箱 or 冷柜)and 發泡 )”。

“A/關鍵詞”,用于檢索標題、摘要或權利要求中含有的關鍵詞。“A/”用法與上述類似,也可根據需要采用“RDI/”與“TTL/”、“ABST/”或“ACLM/”搭配檢索,例如“RDI/ ?and ACLM/ 關鍵詞”。

2.4 臨近算符“adj/x”和“adjn/x”

鄰近算符不能與()配合使用,需在雙引號中使用。

“adj/x”,為區分位置的臨近算符,使用方式為:B/”過濾 adj/3 發泡”,表示過濾和發泡間相距小于等于3個字,且過濾在發泡之前。

“adjn/x”,為不區分位置的臨近算符,使用方式為:B /”過濾 adjn/3 發泡”,表示過濾和發泡間相距小于等于3個字,過濾和發泡的前后位置不作區分,僅支持兩個詞的臨近運算。

2.5 同在算符“nw/x”和“np/x”

同在算符也不能與()配合使用,也是需在雙引號中使用。

“nw/x”,為區分位置的句同在算符,使用方式為:/”過濾 nw/3 發泡”,表示過濾和發泡出現在同一句子里,相隔不超過3個詞,且過濾在發泡之前;

“np/x”,為區分位置的段同在算符,使用方式為:/”過濾 np/3 發泡”,表示過濾和發泡出現在同一段,相隔不超過3個詞,且過濾在發泡之前。

3 人工干預

在僅使用“RDI/專利號碼”對全庫語義排序檢索效果不佳時,需要進行人工干預。人工干預的方式常見的有兩種,采用關鍵詞和/或分類號。

3.1 關鍵詞干預

關鍵詞干預的檢索式為“RDI/專利號and B/關鍵詞”,其含義為先用B/關鍵詞檢索出一個結果集,然后再對這個檢索結果集按照RDI/專利號的涵義進行語義排序。

采用關鍵詞干預時,可遵循“先檢準,再檢全”,優先采用發明點關鍵詞干預,其次采用改進基礎、目的、技術領域的關鍵詞干預;盡量避免采用常見的部件名稱關鍵詞進行干預,陷入海量對比文件瀏覽中;特殊領域,不確定的詞組表達可采用單字或詞根進行干預,再交給語義來排序;盡量選取命名單一的關鍵詞(如專業術語)進行人工干預,避免使用名稱不易準確表達、也難以擴展全面的關鍵詞;關鍵詞干預效果不理想時,可對關鍵詞進行替換,若還不理想,可再將代表不同部件的多個關鍵詞“and”;可以多個干預字段聯合使用,例如:RDI/ and B/詞1 ?and AIM/詞2。

3.2 分類號干預

分類號干預的檢索為:“RDI/專利號and IPC/分類號”,其含義為先用IPC/分類號檢索出一個結果集,然后再對這個檢索結果集按照RDI/專利號的涵義進行語義排序。

采用IPC分類號干預,也可遵循“先檢準再檢全”的規則,先用準確的分類號如小組分類號進行檢索,若無合適對比文件,則采用大組分類號進行檢索,再無合適對比文件,則可以采用小類分類號進行檢索。不用擔心采用小類分類號檢索范圍太大,有語義排序,能將最相關的前400篇文獻推出來。上述用小組、大組以及小類分類號檢索時,是可以結合關鍵詞一起檢索的,如:“R/公開號and B/關鍵詞and IPC/分類號”。

3.3 文本改寫干預

文本改寫干預主要是對“R/文本內容”中的文本內容進行改寫,也就是通過排序標準進行人工干預。

文本改寫的目的主要是縮小排序范圍、提升語義匹配度,在改寫時要選擇與發明點相關度高的部分進行改寫,刪除干擾信息、冗余信息,增加關鍵語段、關鍵詞語(同義詞或近義詞),改寫時對晦澀文字進行常規描述的改寫,最好用具體的下位詞語表達,不要用上位概念。

4 結語

本文從選庫、常用檢索字段、算符和人工干預介紹了Patentics語義檢索的檢索技巧:在選擇數據庫時,根據各國數據庫的特點進行選庫,再通過常用檢索字段“R/”和“RDI/”進行初步檢索,再采用“RDI/專利號碼+關鍵詞/分類號等”進行人工干預,進行關鍵詞干預時可以運用鄰進算符、同在算符,若還沒有找到合適的對比文件,最后還可通過“R/文本改寫”實現排序標準的人工干預。

猜你喜歡
排序語義數據庫
排序不等式
恐怖排序
語言與語義
節日排序
刻舟求劍
兒童繪本(2018年5期)2018-04-12 16:45:32
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
主站蜘蛛池模板: 91网在线| 青青久久91| 日本人又色又爽的视频| 亚洲国产日韩一区| 亚洲精品福利网站| 无码人妻热线精品视频| 无码av免费不卡在线观看| 亚洲色成人www在线观看| 男女男免费视频网站国产| 免费A级毛片无码免费视频| 国产成a人片在线播放| 亚洲日韩国产精品无码专区| 国产凹凸视频在线观看| 国产情侣一区二区三区| 免费在线色| 久操中文在线| 一本大道香蕉中文日本不卡高清二区| 国产剧情无码视频在线观看| 欧美a级完整在线观看| 91麻豆精品国产高清在线| 五月婷婷精品| 99免费视频观看| 九九视频免费在线观看| 国产18页| 亚洲成人精品| 四虎成人免费毛片| 香蕉久人久人青草青草| 天堂av高清一区二区三区| 一本一道波多野结衣av黑人在线| 国产精品亚欧美一区二区| 一区二区午夜| 亚洲欧美成人在线视频| 青青青亚洲精品国产| 国产免费黄| 伦伦影院精品一区| 自拍偷拍一区| 日本少妇又色又爽又高潮| 无码专区国产精品第一页| 精品国产污污免费网站| 久久香蕉国产线看观看式| 中文字幕不卡免费高清视频| 免费一级大毛片a一观看不卡| 亚洲国产黄色| 亚洲乱码在线播放| 国产午夜人做人免费视频中文 | 亚洲精品成人片在线播放| 亚洲日韩第九十九页| 国产青青操| 日韩小视频在线观看| 亚洲AV无码一二区三区在线播放| 国产黄网站在线观看| 久热这里只有精品6| 国产欧美在线| 日韩av资源在线| 欧美亚洲国产日韩电影在线| 三区在线视频| 国产欧美网站| 欧美日韩精品一区二区在线线| 高清无码一本到东京热| 露脸国产精品自产在线播| 四虎永久免费地址| 日韩中文欧美| 中国精品久久| 亚洲一区精品视频在线| 三级毛片在线播放| 国产一级毛片yw| 成人国产精品视频频| 一本一道波多野结衣一区二区| 久久综合婷婷| av色爱 天堂网| 国产日本一线在线观看免费| 久久香蕉国产线看观看式| 国产一区二区在线视频观看| 天堂中文在线资源| 久久久受www免费人成| 国产一区三区二区中文在线| 亚洲一区二区日韩欧美gif| 欧美三级不卡在线观看视频| 无码高潮喷水专区久久| 黄片一区二区三区| 91久久夜色精品国产网站| 一级毛片在线播放免费|