劉銳

摘要:知識產權服務中專利申請及相關的法律服務關系到我國自主知識產權法律效力的發展趨向,同時也是保障基礎知識產權服務有效性的根本措施,只有這樣,才能夠讓更多的創新技術人才在相應的專業領域內構建切實有效的發展規劃,進而滿足對專利申請、檢索和法律訴訟等服務的高效化需求。隨著大數據的快速發展以及云盾技術的廣泛普及,信息增長是爆炸式的,專利信息作為規劃經濟發展和科技創新的重要依據,不僅是政府事業單位有效專利布局的措施,也是地方企事業單位的重要信息資源。構建地方專利大數據庫、專利信息檢索分析等多功能系統是擴大專利信息利用率,促進地方政策分析、技術預測和科技創新的發展重要舉措。該文主要基于大數據和云盾技術,對涼山州地方專利信息檢索系統進行簡要分析。
關鍵詞:專利信息;專利情報;信息服務;信息平臺
中圖分類號:TP311? ? ? ? 文獻標識碼:A? ? ? ? 文章編號:1009-3044(2019)02-0001-02
在專利信息檢索系統的構建中,需要考慮較多因素,如信息資源、信息分析工具、服務機構等,本文運用已開發適用于早期階段的“專利統計分析軟件”(專利統計和分析軟件,簡稱PSAS)及其在線分析工具(PIOL),基于大數據以及云盾技術,研究構建涼山州地方專利信息檢索系統。在實際的專利系統研發和開發的過程中,由于整體的專利資源的限制,對整個的信息資源的有效性產生較大影響,且由于實際的專利利用的思維及主要的檢索方式的不同,使得整體的專利信息服務系統因為地方資源有效性的差異而不同,因此在實際的專利系統結構及主要的思維進行構建的過程中,要對實際操作和應用進行相應分析,以實現對整個專利檢索系統的有效性分析,從而體現專利檢索系統中的知識產權結構及多樣性利用及研發,使得專利檢索系統的結構及相應的軟件內容具有高效的分析性,且能夠有效的促進區域專利信息檢索高效化發展,且有助于保障專利布局、專利申請及相關數據的準確性及高效性。
1 地方專利信息檢索系統建設思路
《四川省“十三五”知識產權保護和運用規劃》(川府發〔2017〕13號)文,在知識產權綜合服務工程中明確指出:“建設知識產權大數據庫、知識產權信息檢索、分析等多功能的知識產權公共服務平臺”;在第四條重點領域中也提出:“推進專利檢索數據庫等專利基礎數據資源開放平臺建設”。由此可見,建設知識產權大數據庫、知識產權信息檢索、分析功能系統,已成為知識產權公共服務平臺建設中不可或缺的重要組成部分。
涼山州地方專利服務平臺,是基于大數據和云盾技術研發的專利信息檢索分析及統計對比系統平臺,幫助當地企業制定正確的市場發展戰略,指導和推動企業科技研發,避免重復研發,專利侵權的有效監控和預警。系統平臺具有地方特色,體現專利信息特點,能夠滿足廣大網絡用戶對專利信息的需求,具有操作高效,操作方便,長期運行等特點。該系統包括專利信息檢索,統計管理,對比分析等,實現數據網絡化管理,以及與著錄項目、權利要求書、全文PDF圖像,可視化數據圖表,有效日期,法律狀態,機構屬性、申請號等相關信息的統一管理。該系統可以根據用戶的需要進行專利信息檢索分析,也可以通過輸入專利發明人,申請人和地區之間進行專利統計和專利數據比對。該系統的設計是專利信息利用的專屬系統,其特點是建立本地專利大數據庫,應用網絡數據挖掘技術進行知識產權文檔的自動分類、自動文摘的形成、檢索結果的聚類和相關度排序等,利用智能代理技術加強用戶的個性化檢索,實現聯合查詢,多場組合檢索,任意組合專利信息屬性字段檢索,以及從一個檢索入口同時檢索多個不同區域的資源庫,由被動檢索變成主動檢索,達到精準檢索、分析、統計、對比等多功能平臺。同時在檢索的過程中可以根據實際需求將檢索的相關內容進行分析以及數據比對,并將專利所需要專利數據生產PDF文檔進行下載導出打印,提高專利信息的利用率。
2 基于大數據和云盾技術的地方專利信息檢索系統研究
2.1 系統架構
系統采用PHP+MYSQL+Nginx技術框架和基于云服務器的分布式部署實現負載均衡,并采用云盾安全保護技術,實現系統的安全穩定運行,基于PIOL后臺系統,整個系統架構包括三個部分,即信息資源層,數據處理層和信息發布層,如圖:信息資源層以原始專利數據的采集和存儲為核心,數據處理層以信息組織,處理和分析為核心,利用PIOL等信息工具實現,信息檢索結果是客戶端的顯示界面,是運用檢索網頁的前端設計和移動應用程序的開發來完成實現的,而且,基于大數據和云盾保護的首頁功能板布局更為安全也易操作。
隨著大數據的發展,從技術上講,信息平臺及其功能的實現已不再是問題,但為了設計一個簡單高效的信息檢索系統,技術選擇和應用是一個必不可少的過程。基于系統實現技術的穩定性,考慮系統功能的擴展和集成,本文認為BOOTSTRAP前端開發工具的采用符合本地專利信息檢索系統的技術要求,BOOTSTRAP由Twitter的設計師Mark Otto和Jacob Thornton聯合開發,它是一個簡單靈活的前端框架和基于HTML,CSS和JAVASCRIPT的交互式組件集,廣泛應用于國內外各種信息系統的設計和開發[2],BOOTSTRAP能夠更快,更靈活,更有效地設計前端框架和頁面,并與后臺進行交互,BOOTSTRAP一般具有以下技術特點:第一,應用方法易于理解,熟悉面向對象編程的程序員可以快速了解其技術結構、技術要素和其他技術要點,能夠提高設計和開發效率;其次,源代碼是開放的,在降低開發成本的同時,還可以通過與設計人員的交流和互動來分享開發經驗;第三,它是跨平臺的,不僅支持各種瀏覽器,還提供對智能手機和平板電腦的同步支持。
2.2 功能模塊
用戶管理主要支持平臺用戶登錄和權限管理功能,實現不同類型用戶登錄,并根據級別分配權限,該模塊集成了PIOL系統登錄功能,并在平臺主頁中設置登錄窗口,為管理員輸入后臺進行數據處理,發布和高級檢索,并為普通用戶登錄進行簡單檢索和需求發布,并根據非登錄用戶,普通用戶和管理員的用戶身份,對平臺各模塊應用程序和操作進行權限分配。
信息檢索是基于PIOL系統的背景,主要實現專利信息檢索功能,考慮到數據傳輸的效率和服務器的承載能力,在平臺頁面的指定位置設置一個特殊的檢索頁面, 它用于平臺限制用戶按時間段,區域,專利類型,數據類型等手段檢索本地專利信息,并以圖形或報表的形式顯示。大數據檢索每個服務器,并在每個節點上的存儲服務器中分析和排序數據信息,以獲得在服務器前面排名的“相關性”。 而這些存儲服務器用于并行分布式檢索。檢索結果在Index Repository的索引中,搜索引擎中的頁面,用戶請求的檢索過程實際上是在索引存儲庫中搜索,將網頁的內容與網頁的反向排序索引中的索引同義詞庫組合在一起,頁面標題和鏈接數據存儲在用于廣度優先搜索的一個索引中,并且web內容存儲在用于低頻長尾,個性化,深度優先搜索的另一索引中。
2.3 專利信息檢索系統的檢索過程
當用戶提出檢索請求并將關鍵詞提交給檢索代理時,檢索代理將關鍵字發送給索引存儲器,并在根據相關性再次對檢索結果進行排序后,將搜索結果發送給檢索代理,并呈現給用戶檢索的界面,檢索能力和速度得到了很大提高。
搜索用戶在搜索引擎輸入搜索的關鍵詞,提交請求,找到顯示的匹配頁面,搜索引擎會對搜索請求進行詳細的分析,而搜索請求的詳細分析主要是進行分詞,分詞主要是使用以下3種方法:
1) 基于字符串有三種匹配方式,前向最大匹配方法將索引問題從左到右劃分為一些單詞,反向最大匹配方法將索引問題從右到左劃分為一些單詞,最少細分是每個短語的細化,即使它是逐字出現的。對于整個信息工程的建設而言,對專利系統檢索軟件的系統分析及相應的分析內容進行分析,分析實際的專利信息內容。
2) 搜索引擎模擬人腦理解句子,進行分詞,單詞和表達進行整合便于理解,它的基本原理是在分詞的同時通過語法和語義分析來解決分歧,分詞通常是由分詞子系統,語法子系統和語義子系統組成,并在主控制系統的配合下,語義子系統獲得單詞、句子等語義信息,可以模擬人類理解句子的方式。整體技術分析是對于各方面的信息內容進行分析,以實際操作和應用為基礎,結合現有的信息內容進行有效的規劃,實現對專利信息檢索內容的有效性分析。
3) 相鄰的單詞出現的次數越多,中文分詞就越可能作為一個單詞彼此相鄰。 在鍵入關鍵字時搜索用戶,或多或少會出現很多結束詞,例如“等”“的”,在分詞中,通常會被刪除。以實際的專利檢索內容作為分析對象,實際操作和應用為基礎,構建有效的專利信息內容,實現專利信息檢索內容進行有效分析。
當搜索引擎收到搜索請求的詳細分析時,它會匹配URL(重點是標題和摘要段),并且有數千個匹配的URL,如何以有序的方式展示?這要求搜索引擎根據URL的匹配程度進行排序。檢索系統把網頁的PageRank值與分詞后的信息和鏈接網頁的描述信息結合,計算檢索結果排序的權重值,網頁進行客觀地排名,可以保證搜索結果在很大程度上與用戶的查詢一致[3]。PageRank的基本原理是:如果數據被其他頁面多次指向,則表明該數據更重要或質量更高,除了考慮頁面鏈接的數量之外,還會考慮鏈接頁面本身的級別以及其他頁面的前向鏈接數量。
3 結語
基于大數據和云盾技術的專利信息檢索系統在實際生活中仍面臨著巨大的挑戰,在整個系統設計及研發的過程,以實際操作和應用為基礎,構建切實有效的信息檢索系統,有效規劃整個專利信息檢索過程,實現對于整個專利系統設計及研究的高效性分析,隨著智能技術的運用,搜索引擎的使用將得到更好的改進,結合地方專利信息檢索系統及相關核心技術的研發,通過不斷的實踐和研究,將搜索引擎與智能檢索技術更好地結合起來, 實現具有新型檢索模式的地方知識產權搜索引擎。
參考文獻:
[1]王根. 基于地方知識產權戰略的專利情報分析軟件研究:以東莞市為例[J]. 情報科學,2011(9):1435-1440.
[2]焦玉英,索傳軍.基于“推”模式的網絡信息服務及其相關技術研究[J].情報學報,2001(2):194-199.
[3]劉友華, 劉琳.論我國專利信息服務平臺的構建[J].湖南科技大學學報:社會科學版,2012,15(5):103-106.