陸薇薇,趙冬梅,楊秋霞,王寶清,付 國,陳月從,陳 普
(華北電力大學圖書館,北京 102206)
專利信息是重要的情報資源,可以幫助相關人員充分了解現有技術,提供研發思路,避免專利糾紛,制定競爭策略。
針對某個專題(行業、企業、產品、技術等)建立的專利信息數據庫,被稱為專利專題庫。行業專利專題數據庫是針對特定領域專業特點和用戶特色需求,從海量的初級專利信息數據中篩選,并進行一定的加工所形成的數據庫。通常專利專題庫不僅包含了專題范圍內的所有專利數據,具有檢索、下載、存儲等功能,定期進行數據更新,而且通常具有專利分析功能,即統計、分析、數據管理、圖表輸出等功能。
專利專題庫由檢索專家和技術專家協同建立,相關從業人員可以在專利專題庫中快速找到所關心技術分支的相關專利,省去了對專業技能和檢索技能要求較高、耗時很長的檢索策略及檢索式確定過程,提升了專利檢索的準確度,提高了工作效率,加快了項目進程。
各級知識產權公共信息服務平臺都將專利專題庫作為重要服務內容,提供了針對戰略新型產業和高精尖產業的大量專利專題庫,比如物聯網、云計算、新材料、航空航天、區塊鏈、新型疫苗等專題庫,對行業的發展起到了重要的作用。
大學是培養人才的地方,是科技創新的重要陣地。2022 年政府工作報告提出,推進高等教育內涵式發展,分類建設一流大學和一流學科。新時代的圖書館作為智庫,在雙一流建設中擔當重要職責,而知識產權信息服務在圖書館的服務內容中將越來越重要。2017 年國務院發布的《“十三五”國家知識產權保護和運用規劃》中提出加強公共圖書館、高校圖書館的知識產權信息服務能力建設,鼓勵高校和科研機構強化知識產權申請、運營權責,加大知識產權轉化力度[1]。自2017 年12 月15 日國家知識產權局辦公室和教育部辦公廳聯合印發了《高校知識產權信息服務中心建設實施辦法》 以來,至2022 年年底,已遴選出四批共103 家高校國家知識產權信息服務中心,向校內外提供知識產權信息服務,專利信息服務是知識產權信息服務的重點。
國家知識產權局辦公室和教育部辦公廳2021年發布的《高校知識產權信息服務中心建設實施辦法(修訂)》中指出“支持高校知識產權信息服務中心結合學科優勢,建設學科領域專業化知識產權信息數據庫和服務平臺”[2],大學圖書館應開展的12 項核心專利信息服務類型中,專利專題數據庫服務是重要內容之一[3]。國知局和成熟的商用專利數據庫的數據特點是大而全,不針對特定行業或者特定需求,而專利專題庫則著眼于特定需求(某一個行業、技術、產品、企業)。雖然知識產權信息服務中心針對特定需求可以提供專利分析服務,但是數據截止到某個時間點,而且提交專利分析報告后服務就結束,而專利專題庫由檢索專家和技術專家協同建立,數據可以定期更新,簡單的專利分析工作可由用戶自行利用專利專題庫的分析功能完成。
雙一流建設以學科為基礎,高校專利專題庫可針對學科方向及其研究熱點進行建設,服務教學和科研,有利促進了大學學科發展,具體優勢如下。一是專業人員建庫,方便師生查詢專利,了解某個專題專利現狀;二是明晰學校已有專利價值,重點進行推廣以促進專利轉移轉化;三是探索未來技術發展,確立研究方向;四是靈活建庫,以學科發展和科研活動為中心對專題庫進行調整和擴充。
高校知識產權信息服務中心的專利專題庫服務可以從兩方面開展,一是對校內外用戶提供按需建庫服務,即應用戶特定需求建庫;二是針對大學的學科特點和發展需要,自行提供一些專利專題庫資源供全校用戶使用。
首先確定專利專題庫的技術主題,針對技術主題進行建庫,然后進行技術分解。技術分解是檢索的前提,是采用模塊化的思想將大的主題進行合理切割,對技術主題進行細分化解,將需要檢索的內容分成層級分明、邏輯清晰的技術分支,相當于給檢索制定了路線圖。圖1 為針對氫能的一種技術分解方法。具體技術分解分幾級,按照什么思路去分解,沒有統一的標準,需要根據建庫的需求,參考產業分類標準,進行合理安排。

圖1 技術分解圖
根據技術分解表,針對每一項細節技術,選取適當的中英文關鍵詞和國際專利分類(International Patent Classification,IPC)或者聯合專利分類(Cooperative Patent Classification,CPC),制定檢索策略,進行檢索,去噪,反復調整檢索式,查驗查全率和查準率,所有分支檢索結果合并后即為上級技術分支的所有專利。
技術分支及相關數據是專利專題庫的核心,但是以什么樣的方式提供給用戶,是否需要其它功能模塊,比如檢索功能、分析功能等,需要軟件工程師結合需求進行軟件功能的設計和實現。
華北電力大學知識產權信息服務中心2021 年根據大學發展需求,開始著手建設首個能源電力行業專利專題庫,2022 年12 月完成項目第一期建設,并將系統部署完成,對校內用戶提供服務,運行良好。
華北電力大學(簡稱華電),是由國家電網有限公司等12 家特大型電力集團和中國電力企業聯合會組成的理事會與教育部共建的全國重點大學,是國家“世界一流學科建設高校”。華電的學科體系涵蓋了火力發電和生物質、太陽能、風能、核能等各類新能源發電技術,以及輸電、配電、供電等電力工業技術,已有相關領域豐富的研究成果。華電與電力企業幾十年來在各個研究領域有著密不可分的合作關系,畢業生數量眾多且遍布全國能源電力行業,華電被稱為“電力黃埔”。因此建設能源電力行業專利專題庫,對于大學的學科發展有著非常重要的推進作用。
對于能源電力行業,現有政府服務平臺和行業網站提供部分技術的專利數據庫,如:新能源、智能電網等,但仍然存在以下問題。一是產業覆蓋面較窄。數據資源分布零散,單個數據庫僅涵蓋某一細分產業方向,沒有整個行業的大型專利信息庫。二是技術主題分類不規范。各類數據庫采用的技術分解標準和方式不同,個別仍在沿用舊版產業分類。三是檢索策略不嚴謹。對于同樣的技術主題,各數據庫的底層檢索策略不統一,數據質量差別較大。有的數據庫檢索詞過少,有的數據庫甚至沒有進行任何去噪。四是檢索功能單一。部分數據庫只能進行分類檢索,不能滿足數據遴選過程中的二次篩選需求。部分專利庫只具有檢索功能,不具備專利分析功能,而專利分析,尤其是可視化分析,能夠即刻提供關于某個技術方向的申請趨勢、申請人、發明人、技術生命周期等雖常規但重要的信息統計分析。
華北電力大學高校知識產權信息服務中心針對整個能源電力行業,建立能源電力行業特色專利專題庫,具有以下特點。一是行業特色突出且集中。將各種能源發電和電力系統相關的專利信息到一個大平臺,用戶面更廣。二是專利分類導航合理。提出科學的技術分解表,對龐大的能源電力行業專利信息進行合理的分類和導航。三是建庫檢索策略科學。依托學校的優勢資源,由知識產權信息服務中心組織,聯合檢索專家和校內各細分領域的技術專家協同確定檢索策略,保證專題庫的數據質量。四是數據庫檢索功能豐富實用。多種檢索方式可以提高用戶使用專利信息庫的靈活度,節省檢索時間。五是專利分析功能簡單實用。多維度可視化的專利分析。
行業專利專題數據庫的內容包括某一種產品或某一類技術為主題的全球專利信息數據集合,具有檢索、統計、分析、數據管理、圖表輸出等功能[4]。本文所述能源電力行業特色專利專題庫包含專利導航、專利檢索、專利分析、系統管理四大模塊,建設方法按照專利專題庫的一般建設思路進行。
3.2.1 技術分解
本文首次提出建立能源電力行業專利專題庫,能源電力行業不僅數據量龐大,而且涉及技術、產業和應用范圍很廣,技術分解可以有多種方式,每種技術分解的方法都可能有交叉,最后經過檢索專家和技術專家的討論和嘗試,確定以電能生產消費的過程(發電、輸電、變電、配電、用電)為基本框架,同時突出電能生產消費各環節中研究人員通常關注的重點技術內容。發電包括核電、水電、火力發電、風力發電、太陽能發電等各種發電方式及其并網,還包括了氫能和儲能,輸電、變電、配電、用電方面,則按照熱點研究方向進行梳理,選取了柔性直流輸電、柔性交流輸電、超高壓輸電技術及電網設備狀態檢測等方向,最后加上“電力通信”和“電力信息物理系統”,共設定了27 個技術分支作為導航主分類(二級技術分支),并設定了次級技術分支以細化分類導航,全部技術分解已經完成。在具體建庫方面,目前已經完成了第一期共15 個二級技術的建庫工作,專利導航界面見圖2。

圖2 能源電力行業專利專題庫專利導航界面
3.2.2 確定檢索式
15 個技術分支下又有細分的技術分支,所以確定每個技術分支的檢索策略和檢索式,涉及若干個中英文關鍵詞和分類號,需要聯合不同領域的技術專家配合檢索分析師進行工作,反復檢索協商,工程浩大。數據清洗需要人工參與,也是非常耗時耗力的工作。
以制氫技術為例,首先用“制氫or 制造氫or制備氫or 產氫or 產生氫”進行試檢,篩選出相關IPC 分類號并進行去噪,確定IPC=(C01B or B01J or C25B or H01M or H02J or B01 or C12P or C02F or C07C or C12R or C12M or C10J or C12N or C10G)NOT MIPC=A,然后對中文檢索詞進行擴充,在題目或摘要中使用“制氫or 產氫or 制造氫氣or 氫氣制造or 氫氣生產or 生產氫氣or 氫制造or 氫生產or制備氫or 氫制備or 氫氣制備or 產生氫or 制高純氫or 氫能生產or 氫能制造or(氫氣1 W 提純)”結合IPC 分類號的限制進行檢索,然后按照相關性大小排列,結合人工判定,進行去噪,將題目或摘要中含有“加氫or 控制氫or 制氫化物or 制氫電極or 產生氫氧or 富氫杯or 輪胎or 膜筒or 沼氣or 制氫氧or 抑制氫or 產氫氟or 化氫制備or 化氫生產or 化氫制造or 制氫氟酸or 產氫菌or 制備氫氧or 產生氫化or 產生氫遷移or 脫氫生產or 脫氫制備or 制備氫過氧化物or 制備氫氟or 制備氫氯氟”的數據去掉。這樣,就構成了完整的中文檢索式。用類似的方法構建英文檢索式,中英文檢索式結合后,再次進行人工去噪數據清洗,就可得到關于制氫技術專利的完整的檢索式。
3.2.3 系統功能
系統功能包括專利導航、專利檢索、專利分析、系統管理四大模塊。
專利導航是系統的核心功能,35 萬條數據按照15 個二級技術分支分類放置,一目了然,數據每2 周更新一次,用戶可以直接點擊查看感興趣的技術方向,極大地方便了師生的科研工作。
專利檢索功能方面,提供智能檢索、高級檢索、分類檢索、批量檢索、法律狀態檢索、二次檢索等方式。充分考慮到各種檢索需求,檢索的靈活度也很高。
專利分析方面,可以進行申請趨勢分析、申請人分析、發明人分析、地域分析、技術分析等。專利分析的結果以多維度可視化圖表的方式展示,展示圖表包括柱狀圖、折線圖、餅圖、氣泡圖、矩陣圖、極坐標圖、路徑圖等。圖3 為“柔性直流輸電”共8 303 件專利的專利分析功能的申請人分析示例,華北電力大學的申請量接近600 件,各申請人之間的對比也非常直觀。

圖3 柔性直流輸電專利申請人分析
另外,系統還設計有“專利預警”功能,輸入界面見圖4,可以設置所關注技術的檢索式,如果有相關專利出現,系統會自動進行提醒。

圖4 專利預警界面
專利專題數據庫是高校知識產權信息服務的重要內容,對大學的發展有重要作用。
專利專題庫建設的關鍵是技術分解和檢索策略的確定,需要檢索專家和技術專家反復協商檢索確定以全國首個能源電力行業專利專題庫為例,說明了針對大學學科發展需要進行專利專題庫建設的具體方法。
實例分析表明,基本框架和重點技術相結合的新的分解思路不僅能有效解決超大型行業數據庫的技術分解難題,還能為科研人員提供更有參考性的分類目錄,檢索策略的確定則需要反復迭代去噪,才能在保證查全率的前提下盡量提高查準率。集專利導航、檢索、分析為一體的專題數據庫能滿足科研用戶的各種需求。