999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

未確知聚類在專利質量評價中的應用

2020-08-03 07:58:33張妮妮孫勝娟張永健
現代電子技術 2020年8期

張妮妮 孫勝娟 張永健

摘? 要: 隨著人們對知識產權的重視,作為其重要表征的專利的數量呈現爆發式增長,然而專利的質量卻沒有隨之增長。大量的低質量專利不但作用有限,反而會造成社會資源浪費和遏制創新。對于專利質量的評價,目前還沒有統一的標準。文中首先對國內外的專利質量指標進行分析,選取出對專利質量影響較大的指標,構建專利質量評價指標模型。同時,以鋼鐵行業相關專利為目標數據集,分別采用未確知聚類和模糊均值聚類算法對目標專利質量進行分析評價。最終,將目標專利數據聚類出不同的級別,得出高質量專利。在聚類過程中,發現未確知聚類算法在效率和準確率上都有良好的表現。

關鍵詞: 專利質量評價; 未確知聚類; 專利數據分析; 評價模型構建; 數據集聚類; 對比實驗

中圖分類號: TN911?34; TP311.52? ? ? ? ? ? ? ? 文獻標識碼: A? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)08?0143?04

Application of unascertained clustering in patent quality evaluation

ZHANG Nini, SUN Shengjuan, ZHANG Yongjian

(School of Information and Electrical Engineering, Hebei University of Engineering, Handan 056001, China)

Abstract: With people′s attention to intellectual property, the quantity of patents, as an important symbol of intellectual property, has increased explosively, but the quality of patents has not increased with it. A large number of low?quality patents not only play a limited role, but also lead to the waste of social resources and inhibit innovation. Nowadays, there is no unified standard for the evaluation of patent quality. The domestic and foreign patent quality indicators are analyzed, from which the indicators that have a greater impact on the quality of patents are selected to build the patent quality evaluation index model. With the related patents in steel industry as the target data set, the analysis and evaluation of the target patent quality are performed by means of the unascertained clustering algorithm and fuzzy mean clustering algorithm, respectively. The target patent data is clustered into different levels to obtain high?quality patents. During the clustering process, it is found that the unascertained clustering algorithm has good performance in efficiency and accuracy.

Keywords: patent quality evaluation; unascertained clustering; patent data analysis; evaluation model building; dataset clustering; contrast experiment

0? 引? 言

隨著科學技術的進步與發展,人們對知識產權的重視程度越來越高[1]。根據2018年12月3日世界知識產權組織發布的《2018年世界知識產權指標》顯示,我國在全球專利、商標和工業品外觀設計等專利申請量上均位居第一。專利總數越多,質量就會參差不齊,大量的低質量專利反而會為社會帶來許多弊端。

國內目前對專利質量評價的研究中,有學者研究顯示專利引證指標和專利權利范圍指標所占權重最高,其次是專利地域范圍指標、技術應用范圍和科學關聯度指標[2]。在對具體領域的專利質量進行分析的時候,包英群等學者遵循普適性、簡潔性和可行性的原則選擇出針對液晶顯示產業的質量評價指標為專利引證指標和同族專利數指標[3]。

本文通過對專利的各個指標分別進行討論分析,從理論上評選出與專利質量相關性較大的指標,建立專利質量評價指標體系。選取Derwent數據庫的鋼鐵行業相關專利為目標數據集,用未確知聚類算法對目標專利進行評價,得出核心專利。

1? 專利質量評價指標

對于專利質量的評價,國內外目前還沒有一套相對科學合理的專利質量指標評價體系[4]。

1.1? 專利引證指標

專利引證信息是專利發展的“脈絡”,從中能看出被引用專利和引用專利,國外論文通常稱前引(Forward Citation)和后引(Backward Citation),以當前專利為標準點,當前專利被其他專利引用稱為前引,當前專利引用其他專利稱為后引。國內外把專利引文分析當作專利價值和技術地位的重要指標,對專利引文的研究層出不窮[5]。其中包括對專利引文地圖的研究和引文次數的探討[6?7]。所以,本文選取前引用專利指數和后引用專利指數作為專利質量評價的兩個指標。它們與專利質量正相關,即前引用指數或后引用指數越大,說明專利質量越高。

1.2? 專利權利范圍指標

專利的權利范圍指標通常是指權利要求的數量。學者在對專利價值和質量的研究中用到了專利權利要求數這一指標,喬永忠等選取部分專利文獻信息并構建回歸模型進行分析,證明專利權利要求數量對專利價值有正向影響,與專利的價值正相關[8]。所以,專利權利要求數量與專利質量正相關,即越重要的專利其權利要求數量越多。

1.3? 專利地域范圍指標

專利地域范圍指標是指專利族的大小,同一個專利在不同國家申請的專利保護稱為一個專利族。在企業全球化和地球村的影響下,專利擁有人或企業為了提升自己的競爭力,會將核心專利技術在多國申請專利法的保護。基于經濟價值角度來看,只有在專利的價值和質量相對較高的時候,申請人才會考慮在不同的國家申請該專利的法律保護,這樣成本和價值才匹配。可見,專利族的大小同時反映了專利的質量和價值的高低[9]。

所以,結合科學性、可行性和可比性的原則,評選出有效的專利價值評價指標為:專利引文數、同族的專利數和專利的權利要求數。

2? 專利質量評價算法

在對專利質量指標權重的確定中,通常是以統計方法去計算每個指標對專利質量的影響程度或采取專家打分的方法。這兩種方法為專利質量評價做出了很大的貢獻,可也有其局限的地方。前者的權重可能與所選取的樣本專利直接相關,后者的結果會與專家的主觀意識相關,得到的權值數據也會有差距。在核心專利之間,應該存在著某些共同特征。由于數據量的巨大,沒辦法用人工的方式來對專利等級進行區分,所以采用聚類來研究。

在聚類算法中,選擇了對數據離群點有較好處理能力并不需要人為干預的未確知聚類算法,同時,用經典的模糊均值聚類算法與其進行分析對比實驗。未確知聚類是一種無監督的聚類算法,該算法基于未確知理論而提出[10]。

3? 對比實驗

實驗的計算機環境為:處理器Intel 酷睿(TM)i7 2.6 GHz,運行內存為 16 GB,硬盤為160 GB,操作系統為 Windows 10,編程語言為 Python 3.6,數據庫為MySQL 5.0。

3.1? 數據集

本文實驗數據來源于Derwent數據庫中的鋼鐵行業相關專利共45 146條,專利時間從1967年到2013年,檢索出與本文相關的字段。

3.2? 實驗步驟

該實驗步驟如下:

1) 首先,輸入目標專利數據集,隨機打亂該數據集的順序;

2) 分別用UMC算法和FCM算法對該數據集進行聚類,通過對數據中的被引用次數、引用次數、同族專利數和權利要求數4個指標判斷目標專利屬于哪一個等級,將所有數據分為5類;

3) 輸出聚類結果;

4) 計算并輸出程序運行時間。

未確知聚類的計算過程如下:

1) 數據標準化。將專利數據的4個質量指標用以下公式取值界定在0與1之間,具體如下:

式中:[xij]為專利i的第j個特征指標的原始值;運算結果[yij]為專利i的第j個特征指標的標準化值。

2) 給出專利數據的一種初始分類并計算出類中心。

式中:

sum(i)為專利i的所有特征指標的標準值之和。

計算出和J+1距離最近的正數k,且將專利[yi]分配到第k類,最終,將N個專利樣本分為C類,即給出一種初始分類方式,并根據該初始分類方式計算出各類的類中心[m(0)k(1≤k≤C)]。

3) 根據這C個專利數據初始類的類中心[m(0)1,m(0)2,…,m(0)C],計算得到專利數據集初始分類的均值類。在該步驟中,根據已經給定的初始分類方式,計算出j專利特征屬性對專利分類所做的分類貢獻度:

由式(3)得到的專利分類貢獻度計算每個專利屬性的分類權重:

通過得到的專利屬性的分類權重,根據式(5)計算出每個專利屬性特征的加權距離:

由式(5)計算得到各個專利屬性的加權距離大小后,需要計算出其相應的基本隸屬度:

式中,取[ε=0.01]。

4) 根據計算的N個專利樣本的未確知隸屬度之后,可以算出這N個專利樣本對應每個特征指標所度量的確定分類。將[u(0)Γk(yi)]作為樣本點[yi]關于[Γk]類的點質量賦予點[yi],最終,N個質點構成的質點組[{(y1,uΓk(y1)),(y2,uΓk(y2)),…,(yN,uΓk(yN))}]的質心可按物理方法確定,即每個質點對應的隸屬度向量為:

根據這一步驟得到第一次迭代后的類中心[m(1)1,m(1)2,…,m(1)C]。以[m(1)k(1≤k≤C)]替代[m(0)k],再次返回步驟2),繼續迭代。

當計算得到[maxm(t)k-m(t-1)k<δ]的情況下,停止上述的迭代,共迭代t次,輸出結果為C個類的類中心[m(t)1,m(t)2,…,m(t)C,m(t)k]是[Γk]的類中心。至此,對N個專利的d維特征指標空間中的樣本點,在沒有其他分類信息條件下,完成了聚類,得出了C個類中心的中心向量。

3.3? 實驗結果

使用UMC和FCM兩種聚類算法對目標專利數據集進行聚類的結果如表1所示。

在表1中列出了兩種聚類算法的聚類類別編號及該編號下聚類的專利數量。其中UMC算法的平均執行時間為:4.5 s,FCM算法的平均執行時間為:570.9 s。可以看出,UMC算法執行時間比FCM算法執行時間快了超過100倍,其主要原因是采用UMC算法收斂速度快,相應其迭代次數就少,所以運行速度比FCM算法快了兩個數量級。同時,根據聚類輸出的結果,用3D圖的方式展示如圖1、圖2所示。

圖中,分別選取Cited(被引用次數)、Cite(引用次數)和同族專利數為z,x,y軸,圖中球體的顏色代表不同的類別。根據兩種聚類算法的結果對比可以看出,由于被引用次數在目標專利的指標中的數字相對于其他三個指標(引用次數、同族專利數和權利要求數)較大,所以兩種算法中被引用次數對分類所做的貢獻都比較大,所占權值也較高。同時,除了被引用數在聚類中所占權值最大外,其次是專利引用數、同族專利數和各個專利的權利要求數。根據聚類結果的顯示結果,編號為“1 000”的共11個專利為UMC算法聚類出來的核心專利,核心專利組的前引用數平均達到262.82次,專利的時間從1995—2009年都有分布,符合預期的質量指數標準。

4? 結? 論

本文通過對專利各指標的分析討論及結合科學性、可行性和可比性的原則,建立專利綜合評價指標模型。在對專利的綜合評價中,通過對數據的分析得出結果,去除了人為的干擾,能較為客觀地反應專利質量信息。在對核心專利進行評價的過程中,未確知聚類算法在運行效率和聚類結果方面都有良好的表現,是基于未確知理論應用的新探索,在專利分析與評價方面取得了有意義的創新成果。該課題研究所存在的問題是由于要符合計算機大量計算的前提,在評價指標方面對比人工處理有一定的局限性。

注:本文通訊作者為張永健。

參考文獻

[1] 田立新,文尚勝.中國OLED應用專利態勢分析與研究[J].現代電子技術,2014,37(19):153?156.

[2] 呂曉蓉.專利價值評估指標體系與專利技術質量評價實證研究[J].科技進步與對策,2014(20):113?116.

[3] 包英群,魯若愚,熊麟.全球液晶顯示產業專利質量評價[J].技術經濟,2015,34(4):3?8.

[4] 谷麗,郝濤,任立強,等.專利質量評價指標相關研究綜述[J].科研管理,2017(z1):35?41.

[5] 吳紅,冀方燕.基于專利申請及審查制度的專利引文評價效能實證研究[J].圖書情報工作,2017(19):89?95.

[6] NARIN F, CARPENTER M P, WOOLF P. Technological performance assessments based on patents and patent citations [J]. IEEE transactions on engineering management, 2017(4): 172?183.

[7] YOO S H, KIM B, JEONG M K. Modeling of technology lifetime based on patent citation data and segmentation [J]. Journal of the operational research society, 2015, 66(3): 450?462.

[8] 喬永忠,肖冰.基于權利要求數的專利維持時間影響因素研究[J].科學學研究,2016,34(5):678?683.

[9] 邱洪華,陸潘冰.基于專利價值影響因素評價的企業專利技術管理策略研究[J].圖書情報工作,2016(6):77?83.

[10] 龐彥軍,劉立民,劉開第.未確知均值聚類[J].河北工程大學學報,2010,27(4):98?100.

[11] 靳顏寧,李夕兵,劉彭金,等基于改進的未確知聚類模型的巖爆傾向性預測[J].安全與環境學報,2017(1):12?16.

[12] 茍尤釗,呂琳媛,陳永偉.專利質量分析的研究進展與述評[J].電子知識產權,2019(2):59?65.

主站蜘蛛池模板: 国产亚洲精品97在线观看| 亚洲精品无码在线播放网站| 亚洲天堂区| 国产在线视频自拍| 亚洲国产精品不卡在线 | 在线播放国产一区| 亚洲人在线| 成人免费视频一区二区三区| 性喷潮久久久久久久久| 在线观看91精品国产剧情免费| 一本视频精品中文字幕| 亚洲精品天堂自在久久77| 在线观看免费黄色网址| 久久精品中文字幕免费| 一区二区三区四区日韩| 国产成人调教在线视频| 亚洲精品福利视频| 毛片免费在线视频| 亚洲欧美日韩中文字幕一区二区三区| 91口爆吞精国产对白第三集| 国产精品人莉莉成在线播放| 亚洲国产系列| 久久超级碰| 亚洲美女视频一区| 久久频这里精品99香蕉久网址| 亚洲手机在线| 一级毛片网| yjizz视频最新网站在线| 亚洲欧美在线综合一区二区三区| a天堂视频| 国产一级毛片yw| 天天爽免费视频| 国产高潮视频在线观看| 欧美日韩免费| 亚洲欧美另类视频| 午夜国产精品视频黄| 国产成人精品一区二区不卡| 欧美成a人片在线观看| 久久中文字幕2021精品| 无码网站免费观看| 久久精品国产免费观看频道 | 91麻豆国产精品91久久久| 爽爽影院十八禁在线观看| 欧美国产精品不卡在线观看 | 人妻无码中文字幕一区二区三区| 亚洲一道AV无码午夜福利| 亚洲综合精品第一页| 强奷白丝美女在线观看| 亚洲欧美日本国产专区一区| 国产福利影院在线观看| 国产H片无码不卡在线视频| 国产精品不卡永久免费| 国产鲁鲁视频在线观看| 亚洲第七页| 久久99国产综合精品1| 精品久久久久久中文字幕女| 午夜精品一区二区蜜桃| 又大又硬又爽免费视频| 在线色综合| 又大又硬又爽免费视频| 亚洲av片在线免费观看| 国产区精品高清在线观看| 亚洲免费人成影院| 亚洲三级网站| 久久久久亚洲精品成人网| 日本黄网在线观看| 在线不卡免费视频| 国产屁屁影院| 欧美黄网在线| 免费A∨中文乱码专区| 免费一级α片在线观看| 国产黄网站在线观看| 国产香蕉一区二区在线网站| 国产精品刺激对白在线| 日本欧美在线观看| 亚洲中文字幕在线一区播放| 原味小视频在线www国产| 精品三级在线| 呦女亚洲一区精品| 国产国拍精品视频免费看 | 午夜丁香婷婷| 久久综合一个色综合网|