999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

論專利信息學

2012-04-29 00:00:00顧東蕾
現代情報 2012年10期

〔摘 要〕專利信息學是在全球經濟化浪潮之下的一個新興的研究領域。專利信息學的物質基礎是專利信息源,包括專利文件、專利數據庫及專利相關網站,由專利用戶的多樣性而形成的各種專利信息需求是專利信息學研究的對象,專利信息學的研究工具是專利軟件系統,專利信息學的未來是專利信息的智能化。

〔關鍵詞〕專利信息學;專利信息源;專利信息需求;專利軟件系統;專利智能

〔中圖分類號〕G255.53 〔文獻標識碼〕A 〔文章編號〕1008-0821(2012)10-0032-07

計算機和網絡等信息技術的進步,對當今社會發展產生了深刻影響。自然科學與信息學的融合,大大拓展了人們的認知和研究領域,生命科學與信息技術的碰撞,產生了生物信息學,化學與信息技術的碰撞,產生了化學信息學。隨著以專利為核心的知識產權在科技創新和經濟社會發展中的作用日益顯著,Vertex制藥公司高級研究員安東尼·特里普(Anthony J.Trippe)在Searcher上發表了“專利信息學:從無到有的尋覓”(Pafinformation:Identifying Haystacks from Space),定義了由專利與信息學交融組合而產生的“專利信息學”(Patinformation)的概念。專利信息學就是以計算機技術處理專利數據為政府和產業挖掘新技術的方向和趨勢,為決策者提供信息支撐。

1 專利信息源

專利信息源由專利文件、專利數據庫和專利相關網站組成。

1.1 專利文件

1.1.1 專利文件信息披露的不同階段

隨著不同的專利生命周期的變化,專利文件所反映的特征是不同的,其信息披露也是不一樣的(表1)。

1.1.2 專利文件技術信息的惟一性

專利文件所傳遞的技術信息有可能是惟一的,在非專利文獻中未報到的美國專利及商標局(USPTO)在“Eighth Technology Assessment and Forecast Report.Section II:The uniqueness of patents as a technological resource”中明確指出,10件美國專利中有8件專利文件中所含有的技術信息在非專利文獻中未見披露。同時專利文件中的信息比學術論文中的信息要詳盡,全面。這主要是因為像WIPO 這樣的國際標準要求專利文件必須有完整的元數據披露。一份標準的專利文件包括扉頁、背景描述、權利要求及附圖,如果可能的話,附上國際檢索報告。

1.1.3 專利文件的撰寫特色

專利文件顯現出一定的特色,顯著地長于原始的論文;不同的部分有著特定的寫作風格;常常含有一些多媒體數據、數學公式和化學結構式。這些特征在應用自動信息處理技術進行整序時必須考慮以特殊的分析及分類算法進行處理。專利文件提供了標準元數據:專利名稱,專利申請、公開和授權的日期及序號,申請人及發明人,專利分類。

1.1.4 專利分類法

國際專利分類法是一種國際統一化、標準化的專利分類方法。由于其具有完整性、科學性、適用性的特點,現在幾乎被世界上所有建立專利制度的國家采用。中國自1985年4月1日實行專利制度以來就采用了這種分類方法。

為了促進歐洲在科學技術上的密切合作和協調,1951年,歐洲理事會專利專家委員會決定成立專利分類法的專門工作組,并開始進行國際專利分類表的編制。經過3年的研究,1954年12月,英、法、德、意大利等15個歐洲國家在巴黎簽訂了《關于發明專利國際分類法歐洲協定》,并作為協定的附件,產生了一份《國際專利分類表》(European Convention on the International Classification of Patents Invention),該分類法和分類表(包括其分類號)均被縮寫成IPC(International Patents Classification)。該分類表由上述專利專家委員會修訂后,于1968年2月通過,并于1968年9月1日起公布生效。該分類表為第一版的《國際專利分類表》。

1.2 專利數據庫

專利文件被組織,形成從內容到檢索方法都大有差別的專利數據庫。內容以空間、時間和提供文件的完整性(全文或文摘)為特征;檢索方法從Boolean searches到advanced retrieval approaches。此外數據庫提供的文件的完整性,文件格式都是質量評判的因素。一般來說,較老一些的專利文件的格式為圖像(電子掃描過程中不帶有OCR);現代的專利文件都是電子格式,可以自動OCR啟動,具有糾錯功能。近年來的一些專利文件以XML格式處理。

專利數據庫有免費數據庫和商業數據庫,前者如各個國家、地區的知識產權組織的官方數據庫,像the European Patent Office(EPO),the United States Patent and Trademark Office3(USPTO)and The World Intellectual Property Organization(WIPO)。后者為一些需購買的授權數據庫,典型的有The World Patent Index,Derwent Innovition Index等。無論哪一類型的數據庫,其數據都存在著錯誤,有OCR識別錯誤,有元數據錯誤,最典型的是遠東語種與西方語種的翻譯錯誤(申請人和發明者的姓名翻譯錯誤)。這些錯誤給檢索帶來了困難,因此數據庫中必須配有合適的糾錯功能軟件。

基本的核心專利信息通常不足以滿足專利信息用戶的需求。所以將其它來源的信息與專利信息進行整合形成的數據庫也是極有意義的。例如,專利法律狀態數據庫,整合了某件專利的歷史數據;再如,研究論文數據庫,儲存了某件專利的參考背景知識。

1.3 專利相關網站

此外,專利論壇和博客交流著即時的專利互動信息,包括一般用戶和專業用戶,企業門戶網站也報道著專利的專題報告和專題新聞。Web 2.0 mash-ups使得整合的過程更加簡單有效。在此值得一提的是美國的Peer-To-Patent項目。

2007年,紐約法學院(New YorkLaw School,NYLS)與USPTO聯合推出了一個名為“公眾專利評審”的網上試驗平臺,網址為:www.peertopatent.org。該平臺首次允許公眾在一定程度上參與到專利審查過程中來,其主要宗旨在于通過網絡連接USPTO和公眾(特別是其中的科學技術人員)以提高專利質量。

2 專利信息需求

不同的專利信息用戶,根據不同的供職領域,其信息需求也不盡相同。申請人和發明者的需求在于檢索先進技術,查證手中的發明的新穎性,從而提出一件新的專利申請;同時他們還有著發現其擁有的授權專利的被侵權信息。研究人員的需求在于查詢專利信息,以避免重復研究和免費使用失效專利技術。管理人員的信息需求在于開發專利信息資源,發現競爭者、合作者和技術提供者,確證技術發展趨勢,挖掘新的商機。風險資本投資人員通過專利信息查詢,利用杠桿效應選擇其金融操作的目標。第三方中介通過獲取專利信息選擇技術賣家。

專利信息的用戶對專利信息的需求歸納起來主要包括以下幾個部分。

(1)整合的專利信息資源

將盡量完備的各國專利信息資源整合在一個數據庫中供用戶使用。包括各主要國家的專利信息,以及同族專利信息、法律狀態信息、專利權轉讓與受讓信息、專利許可信息復審/訴訟與無效信息對比文獻信息,對專利文獻的技術評估信息等。

(2)專利信息的翻譯

語言障礙是終端用戶對國外專利信息利用不夠的一個主要原因通過提供專利信息的在線翻譯能提高我國用戶對國外專利信息的使用。從全球的視角出發,尤其是在中韓等亞洲發展中國家出現的前所未有的專利申請量的飆升,就對跨語言查詢和自動翻譯提出了越來越高的要求。

(3)專利分析

終端用戶迫切需求能夠對專利信息進行分析,對專利信息的分析包括技術分析,競爭力分析,權利分析,引文分析組合分析,聚類分析,重點技術領域的產業發展現狀及前景分析等[1]。

一般來說專利信息用戶的專利信息需求有3個方面:專利檢索、專利分析和專利監控[2]。

2.1 專利檢索

表3列舉了各項專利任務的應用,解決的問題,最終的結果。專利性檢索、專利有效性檢索和專利侵權檢索構成了專利盡職檢索,這一部分檢索任務只局限于特定的技術領域。而技術方案及投資方案的決策性檢索是商業策劃和戰略投資的重要組成部分,這樣的檢索任務在廣泛的視野中進行。

2.2 專利分析

專利分析按照不同的應用可以有不同的分類,可以分為宏觀分析和微觀分析(表4),也可以分為商業需求分析(如知識產權評價)和技術分析。知識產權評價通過開發專利數據,像專利族的規模,引文量,進行專利評估[4-5]。專利地圖是技術分析的一種有效工具,專利地圖可以用于考察新技術的介入和退出情況,判斷研發機構的技術發展動向;它與地形圖結合,可以直觀地展示技術主題分布情況和技術熱點演進;專利地圖與技術路線圖整合,可用于進一步了解技術的未來發展;專利地圖與市場信息搭配,逐漸成為監控企業研發與產品布局的先前指標;專利地圖也可以用于分析國家與國家之前的產業競爭態勢,或是一國產業發展的研發實力[6-7]。

3.2 專利軟件的發展方向

3.2.1 高級檢索

支持相似文件和相似圖形的高級檢索,一方面使得檢索生手能從檢索提問中獲得較高匹配度的結果;另一方面減少專業檢索用戶的搜索時間。通常應用自然語言處理技術,文本檢索技術,多媒體技術和語義網實現。

網絡信息系統的檢索功能一般都帶有相似檢索選項,使用戶在檢索初始詞的同時看到近似詞,并可以選用近似詞幫助擴大查詢范圍。這項功能可以大大增加檢索的查全率,幫助用戶找到自己最想要的資源。但是在專利檢索方面,如中國國家知識產權局專利檢索與服務系統和中國知識產權網專利信息服務平臺,都沒有提供相似專利檢索的功能。

3.2.2 探索性檢索

對于無法直接找到答案的信息需求的搜索,都可以稱之為探索性檢索exploratory search。實際中存在著大量的這樣的需求,每個人都有這樣的需求。例如,對專利主題的關注;對某個主題專利感興趣,想要持續地了解這個主題的情況等等。這樣的信息需求都不是通過通用搜索引擎能夠解決的。

(1)探索性檢索的特性

①相關信息搜集

當用戶需要了解一個主題專利的時候,這個主題往往包括很多方面的信息。系統應該能夠將這個主題相關的信息分門別類、持續地提供給用戶。這里面的一個核心問題應該是信息相關性分析問題,即:一條專利信息是否跟該主題有密切的關系?是在哪方面的關系?等。

②協同工作

當然用戶可以獨立工作。但是,如果一群對某個特定主題都感興趣的人能夠在一起互相配合,共同學習、理解、發現,相信對每個人來說都是有幫助的。因此,這個服務應該是一個能支持具有相關興趣的人協同獲取信息,協同工作。

③收藏

當用戶開始關注某個主題專利的時候,一定會看到一些相關信息。系統應該支持用戶將這些專利信息搜藏起來,在需要的時候能夠隨時看到。

④特殊的數據挖掘能力

對于一些能夠統計的信息,根據需要,系統可以增加一定的數據挖掘服務。如:對某類主題專利的數量統計以及隨時間變化。

(2)相關性分析

專利探索性檢索中的核心問題是相關性分析,也就是說一件專利或一條信息和另一件專利或另一條信息的相關程度。怎么來衡量?傳統的信息相關度方法,如:用文本向量的夾角來衡量兩個文本之間的相關度,只能找出與一篇文章類似的文章。但是相關的文章卻并不一定是內容很類似的文章。這兒可以借鑒半監督(semi-supervised)的方法來支持用戶從不同的角度看同一件專利。

(3)專利探索性檢索的技術

專利探索性檢索通常使用結構化的分面檢索和異構化的專利聚類檢索實現,從而提高專利檢索的查全率和查準率。結構化的分面檢索有從專利的一些著錄項目入手,如專利號、專利權人、專利公開日期等;異構化的專利聚類檢索主要運用聚類分析的方法,結合文本空間向量、信息可視化技術等進行檢索。此外還可以通過對互聯網等信息的整合,從經濟學的角度對專利技術提供評估和決策。

3.2.3 跨語言和自動翻譯

跨語言信息檢索(Cross-Language Information Retrieval,CLIR)是使用某一種語言來查詢另外一種語言的文件,不過由于語言上的差異,通常都需要將查詢Query)轉換成跟文件一樣的語言。目前大多數的使用者會在因特網上使用搜尋引擎來查詢所需要的資料,當我們輸入中文的查詢字,執行檢索后我們可以發現結果可以包含其它語系與Query有關的相關信息,這就是因為搜尋引擎會自動將您的輸入的Query翻譯成其它的語系并執行檢索的動作,由此可知跨語言的信息檢索可以讓使用者方便使用自己熟悉的語言來檢索其它語系的文件。在跨語言信息檢索相關的研究中,大部分采用的方法可歸納成文件翻譯(Document Translation)和查詢翻譯(Query Translation)兩種,兩種技術的目標都是要將查詢和文件的語言轉為一致。使用文件翻譯的檢索方式必須將所有文件都翻譯和Query相同的語系,優點是文件與查詢都是使用相同的語言,使用者可以直接閱讀,缺點是翻譯所有的文件必須耗費大量的時間。查詢翻譯需先將Query翻譯成和文件相同的語言,目前在跨語言信息檢索中被廣泛的使用,此方法的好壞取決于Query是否被正確翻譯,而翻譯的方法有幾種被提出;有字典翻譯Dictionary-based translation)方法,語料庫翻譯(Corpus-based translation)方法,混和(Hybrid)方法,網絡翻譯擷取(web-based translation extraction)方法;由于因特網上的資源眾多,很多的專家學者利用此優勢,使用網絡查詢后再使用機率統計其結果,最后選擇最佳的翻譯當結果,使用網絡擷取翻譯方式可以降低詞匯涵蓋度的問題。

綜觀以上方法,主要的目標都是將查詢和文件轉化成相同的語言,再進行信息檢索,查詢的文字中某些關鍵詞詞若無法被正確地翻譯,將會影響跨語信息檢索的準確性。在跨語言信息檢索中,大部分的亞洲語言并不像英文一樣在每個單詞間都有分隔符號,因此斷詞這個步驟就顯得格外的重要,針對亞洲語系的斷詞使用不同方法,在處理日文斷詞方法采用bi-gram加上uni-gram可得到更好的效用[12]。

歐洲的CLEF和日本的NTCIR研討會是進行跨語言信息檢索評估的兩大主要平臺,其中NTCIR將跨語言專利信息檢索作為一個重要的測試任務。世界知識產權組織(wipo)的PATENTSCOPE也開發了跨語言檢索和機器翻譯功能。

中國國家知識產權局專利檢索與服務系統不僅在資源、功能方面具有明顯優勢,使用起來也方便快捷。如檢索功能中的“跨語言檢索”,用戶可用一種提問語言檢索出用另一種語言書寫的信息。只要用戶在特定字段中輸入中文或英文兩種語言中的一種,選擇進行“跨語言檢索”,系統就能夠自動命中匹配輸入條件語言的相關專利文獻,提高檢索效率。今后還會有更多的語言種類加入此項功能,目前日語跨語言檢索功能正在構建當中。

富士通研究開發中心有限公司研究開發了云之間的應用程序集成技術。通過協同日本與中國的云網關技術,融合現有的統計機器翻譯技術,實現了面向中國用戶的跨語言專利檢索系統。實現了對位于日本館林IDC的日文專利檢索服務和位于蘇州IDC的中日機器翻譯服務的有效集成。該跨域語言專利檢索系統目前已經上線風云網絡的SaaS中心,并開始向中國客戶提供試用服務。

圖1 跨語言專利檢索(中-日版)效果圖

4 結 論

專利信息在全球的經濟發展起著關鍵的作用,各種數據庫和軟件工具在很長一段時間中支撐著專利信息的應用和傳播。專利信息學在此大背景之下應運而生,吸引著越來越多的注意力,面臨著許多需要解決的課題,如:日益增加的多語種的專利申請量;有著從自然科學到社會科學不同的專業背景和知識結構的專利信息用戶的多樣性,包括技術人員,管理者、投資者等等;從防御性的知識產權研究到利用專利信息源挖掘新的技術空白點及商機。

專利信息學是一個新興的研究領域,專利信息源是構成專利信息學的物質基礎,專利信息需求是專利信息學的實踐對象,專利軟件系統是專利信息學的研究工具。專利信息學的未來是挖掘隱藏的知識及其關聯,通過語義網提供完備的專利信息檢索,完善專利分析及評估,實現專利信息的智能化。

參考文獻

[1]賈丹明.我國專利信息用戶的需求分析[J].中國發明與專利,2010,(9):68-69.

[2]Dario B et.al.Review of the state-of-the-art in patent information and forthcoming evolutions in intelligent patent informatics[J].World Patent Information,2010,32:30-38.

[3]Wanner L,Baeza-Yates R,Brügmann S,Codina J,Diallo B,Escorsa E,et al.Towards content-oriented patent document processing[J].World Patent Inform,2008,30(1):21-33.

[4]李振亞.基于四要素的專利價值評估方法研究[J].情報雜志,2010,29(8):87-90.

[5]張彥巧.企業專利價值量化評估模型實證研究[J].情報雜志,2010,29(2):51-54.

[6]鮑志彥.基于專利地圖的競爭情報挖掘及實證研究[J].情報雜志,2011,30(9):12.

[7]殷媛媛.專利地圖圖形學及解讀方法研究[J].圖書情報工作,2010,(S2):363-367.

[8]Hunt D,Nguyen L,Rodgers M.Patent searching:tools and techniques[M].John Wiley and Sons,2007:251.

[9]Porter A,Cunningham S.Tech mining:exploiting new technologies forcompetitive advantage[M].John Wiley and Sons,2005:142.

[10]Iwayama M,Furujii A,Kando N.Overview of classification subtask at NTCIR-5patent retrieval task[C].∥NTCIR-5 workshop meeting,2005:15.

[11]王根.基于地方知識產權戰略的專利情報分析軟件研究——以東莞市為例[J].情報科學,2011,29(9):1435-1440.

[12]鄧舜元.結合線上翻譯服務的跨語言專利檢索系統[EB/OL].www.aclweb.org/anthology/O/O08/O08-2009.pdf 2010-2-20,2012-04-15.

(本文責任編輯:孫國雷)

主站蜘蛛池模板: 亚洲第一视频免费在线| 亚洲AV电影不卡在线观看| 伦伦影院精品一区| 国产a在视频线精品视频下载| 国产性生大片免费观看性欧美| 亚洲国产综合自在线另类| 国产欧美在线观看一区| 亚洲AⅤ永久无码精品毛片| 国产成人禁片在线观看| 女人av社区男人的天堂| 久久一本精品久久久ー99| 天天干天天色综合网| h网址在线观看| 一级黄色网站在线免费看| 老司机久久99久久精品播放| 在线免费观看AV| 午夜毛片免费看| 99视频有精品视频免费观看| 午夜老司机永久免费看片| 国产91小视频在线观看 | 九九热在线视频| 亚洲天堂2014| 成人综合网址| 国产精品不卡片视频免费观看| 亚洲AV无码一区二区三区牲色| 国产精品不卡片视频免费观看| 在线观看免费AV网| 天天摸天天操免费播放小视频| 日本人妻一区二区三区不卡影院| 91免费观看视频| 污视频日本| 美女一级毛片无遮挡内谢| 中文无码日韩精品| 乱系列中文字幕在线视频| 国产 在线视频无码| 亚洲福利视频网址| 欧美日韩中文字幕二区三区| 亚洲av无码成人专区| 91网址在线播放| 国产美女无遮挡免费视频网站| 欧美精品成人一区二区在线观看| 97se亚洲综合在线天天| 99精品视频九九精品| 免费一级α片在线观看| 欧美日一级片| 欧美一区二区三区不卡免费| 国产性精品| 欧美精品1区2区| 亚洲综合一区国产精品| 日韩国产 在线| 久久女人网| 精品黑人一区二区三区| 999国内精品久久免费视频| 最新亚洲人成网站在线观看| 久草视频福利在线观看 | 亚洲性日韩精品一区二区| 一级成人a毛片免费播放| 国产一区成人| 欧美狠狠干| 一区二区三区毛片无码| 亚洲成人黄色在线观看| 草逼视频国产| 五月激情综合网| 国产精品3p视频| 性网站在线观看| 亚洲二区视频| 亚洲天堂区| 久久精品一卡日本电影| 亚洲欧洲日产国产无码AV| 波多野一区| 亚洲视频黄| 亚洲无码视频喷水| 中文字幕精品一区二区三区视频| 中文字幕久久精品波多野结| 露脸真实国语乱在线观看| 88国产经典欧美一区二区三区| 国产精品丝袜视频| 亚洲天堂首页| 88国产经典欧美一区二区三区| 亚洲国产亚洲综合在线尤物| 美女内射视频WWW网站午夜| 国产区免费|