


中圖分類號:G306 文獻標識碼:A DOI:10.3969/j.issn.1003-8256.2025.04.004
黨的二十大報告提出,加快實施創新驅動發展戰略,加快實現高水平科技自立自強。2024年6月,習近平總書記在全國科技大會上的講話也指出:我們要建成的科技強國,應當具有居于世界前列的科技實力和創新能力,支撐經濟實力、國防實力、綜合國力整體躍升,增進人類福祉,推動全球發展。現如今,科技創新水平已成為衡量一個國家綜合競爭力的重要指標。專利作為科技創新水平最直觀的體現,已受到世界各國的普遍重視。據國家知識產權局統計,截至2023年底,我國發明專利有效量為499.1萬件,我國成為世界上首個國內有效發明專利數量突破400萬件的國家1,并且將持續新增巨大數量的有效專利。因此,面對海量的專利,如何對其各自的實際價值進行評估和判斷,如何從中準確識別出高價值專利,已成為一個重要的現實難題。
專利作為一種無形資產,雖可使用傳統無形資產評估中的成本法、市場法、收益法等進行評估,但該類方法存在的信息不確定、操作困難、結果不可靠等劣勢同樣在專利價值評估中顯現出來[2]。此外,面對海量的專利價值評估需求,傳統評估方法對人力物力的巨大消耗,也促使學者們探索其他的專利評估方法。1984年,美國CHI-Resarch公司使用專利被引用數、當前影響指數等7項特征指標構建了全球首個專利評估指標體系[3];隨后國內外學者開始研究通過評估指標體系構建的方式對專利價值進行評估。該方法主要基于專利的自身特征和文獻信息,提取專利價值的特征指標,構建評估指標體系。使用評估指標體系評估專利價值完成了由專利評估中主觀因素多、變化大、評估結果不可信到全面分析、給出直觀半定量標準化統一度量指標的重大跨越[2],是解決海量專利價值評估問題的有效手段。近些年,隨著知識產權的重要性越發受到重視,我國圖書情報領域和科學學領域的學者也積極探索專利價值評估指標體系的構建(圖1,具體來源見2.1)。
在已有專利價值評估指標體系構建的研究中,主要涉及專利價值影響因素分析和指標體系實證研究兩個方面。Suzuki[4]、Chen等[5]、Li等[6]、蒙大斌等[7]和楊武等[8]從理論層面對專利價值評估指標體系構建中涉及到的專利技術、市場、利潤、風險、學術等相關因素進行了研究探討,對于構建專利價值評估指標的論證較為充分,分析較為透徹,但卻未能深入研究其指標在專利價值評估實踐中的量化與應用問題;而Bass等[9]、Chang等[10]宋凱等[11]、趙雪峰等[12]、方曦等[13]和夏蕓等[14]則通過機器學習、神經網絡、社會網絡分析等方法對其各自所構建的專利價值評估指標體系進行了實證分析,主要從相關視角或研究方法進行創新,但對評估指標體系的構建問題不夠重視,存在體系構建中指標選取過于主觀,部分指標體系過于復雜、難以實操等問題。
圖1關于專利價值評估的論文數量增長趨勢和主要期刊分布

綜上,當前學界在專利價值評估指標體系的構建方面思想尚未統一,指標選用眾說紛紜,不同指標的影響機理仍不明確,所構建評估指標體系的可用性與易用性效果也較差,面對海量專利價值評估的實際需求仍無法得以有效滿足。因此,本文基于已有專利價值評估體系,克服過往研究中人工選用評估指標存在的主觀性和不確定性等問題,使用改進關聯規則算法識別出同專利價值相關性較高的可量化評估指標集,并構建出具有較好可用性與易用性的評估指標體系,以解決專利價值評估體系構建過于主觀混亂的現實痛點,實現海量專利價值的有效評估。
1改進關聯規則方法
關聯規則(associationrules)是數據挖掘的一個重要技術,可以從大量數據集中有效發現有意義的規則[15],主要用于反映一個事物與其他事物之間的相互依存性和關聯性。作為一種有效分析方法,在具體分析中主要使用Apriori算法找出項集中的頻繁項集,并由頻繁項集產生關聯規則。目前,已廣泛應用于AltmetricTop榜文獻特征分析[15]、web應用統計[16]、專家推理規則研究[17]和數據挖掘分析[18]等領域。Apriori算法中主要涉及以下六個概念。
(1)項集(itemset):為一些項的集合,項集中的項數稱為項集的長度,包含 k 個項的項集稱為k-項集;
(2)支持數 (φ) :對于 X?I,φ 為 D 中包含 X 的事務個數;
(3)支持度(support):對于 X?I 若 D 中包含 X 的事務個數為 Φs,D 中事務總數為 n ,則 support(X)=s/n
(4)置信度(confidence):為事務集中包含 X1 和 X2的項數與所有包含 X1 的項數之比,即confidence (χ1X2)=support(X1,X2)/support(X1)
(5)閾值:為最小支持度;
(6)頻繁項集:項集的出現頻率大于等于最小支持度,頻繁k-項集的集合通常記作Lk,頻繁2-項集記作L2。
為解決在評估專利價值過程中,構建評估指標體系所存在的過于低效、不夠客觀、難以量化等問題,本文將關聯規則算法原理應用到專利價值評估指標體系構建中,在考慮事務項集發生時間及項集強度的基礎上,使用關聯規則將具有相關關系的專利價值評估指標事務項集在滿足支持度的基礎上識別出來。具體而言,一項專利價值評估指標的有效性,或因為學術進展的突破,或因專利制度的改變,有可能隨時間的變化而產生差異,因此相較于多年前刊發在文章中的專利評估指標的實用性而言,近些年在論文中使用的專利評估指標更具有科學性[19]。同時,基于科學計量的研究視角分析,一篇專利價值評估研究論文的年均被引量越高,該論文越具有影響力,其中所使用的專利價值評估指標也越具有有效性。
綜上,考慮到關聯規則Apriori算法忽略數據發生時間以及數據自身強弱的缺陷,本研究引人論文發表的時間和被引頻次兩個維度對關聯規則算法進行改進,即選用“文章發表時間”和“文章被引量\"兩個指標對關聯規則算法的事務數據集做加權處理,采用logistic算法對每篇論文的權重 ω 進行計算[20]。

其中,logistic函數是單調遞增函數,加權值 ω 隨著系數 n 的增加而增加,并始終保持在 (0,1) 的范圍內。時間常數 χt 值取最長發表時長與該篇文章發表時長的差值; n 值隨文章年均被引量與發表時間常數 χt 的乘積變化。
2基于改進關聯規則的專利價值評估體系構建
基于已有的專利價值評估指標體系相關研究,結合改進后的關聯規則算法,從中識別出與專利價值具有較高關聯性質的評估指標集,并構建出綜合全面且易于操
作的評估指標體系。具體流程如圖2所示。
2.1“體系-指標\"矩陣構建與精煉
基于CSSCI數據庫,通過題名及主題檢索,共獲得近20年間103篇有關“專利價值評估\"或“高價值專利識別\"的期刊論文,經人工判讀,篩選出48篇使用可量化專利特征來評估或計算專利價值的論文,共涉及50個評估指標體系(存在單篇論文設計多個體系的情況),單個指標體系中最高涉及33項評估指標,最低涉及2項指標,共包括“發明人”“專利權人”“時間”“引用\"等多個維度的69項評估指標,具體出現頻次如表1所示。
此時,事務項目集 I={i1,i2,i3,…,i50} ,每一個事務i為一個評估指標體系,而 ik={x1,x2,x3,…,xk} ,即每一個體系 i 中含有 k 個評估指標,稱 ik 為包含 k 個指標的項集,記為 k- 項集。由每一個指標體系的事務 χin"與指標xk"共同組成“體系-指標共現矩陣M”,見式3。

表1專利價值評估指標體系中69項指標使用頻次統計


鑒于矩陣過于松散,且部分指標屬性存在重疊,因此對評估指標進行精煉,具體規則包括:將涉及第一專利發明人的職務、職稱、合作機構、合作論文次數等5項指標合并為“首位發明人特征”,已有“專利IPC數量”指標,故剔除“專利涉及的非主分類號的IPC數”,剔除“專利交易平臺”相關指標,將專利權人相關的平均合作量、平均維持時間等共10個指標合并為“專利權人相關特征”,將表征專利質量的“PCT國際申請”和“三方專利”進行合并。精煉后得到一個 50×52 的矩陣指標共現矩陣 M′ ,具體如公式(4)所示,作為關聯規則算法的預處
理事務數據集。

2.2加權體系指標矩陣構建
依據公式(1)和(2),統計論文的發表時間和被引數量,計算每個項集的權值 ω ,計算結果如表2所示。依據每個體系的加權系數重新構造共現矩陣 M′(ω) ,具體示例見表3。
2.3 最優關聯規則識別
將新構建的加權矩陣 M′(ω) 作為最終項目事務集導入到Apriori算法,且在每個項集中加入第0項事件“專利價值”。在最優關聯規則計算中,將“專利價值”設定為前件,其余指標設定為后件,支持度和置信度均為0.05。導出滿足支持度和置信度下的所有關聯規則 Lk 的頻繁項集,此時 k 值最大為8項,具體結果見表4。
表2加權系數計算結果

表3專利價值評估體系-指標共現矩陣 M′(ω )示例

表4滿足計算要求的所有關聯規則

2.4專利價值評估指標體系確定
由表4可知,置信度值最高的關聯規則3為最優關聯規則,使用該指標集構建評估指標體系。依據中國技術交易所編寫的《專利價值分析與評估體系規范研究》,并結合已有研究和應用基礎,對評價指標進行梳理。其中:
(1)專利壽命 (PL) ,或稱為專利剩余保護期,通常是指授權有效專利自評估日起剩余的專利權保護期限,剩余有效期越大,說明專利的潛在壟斷時間越長,其潛在專利價值越高。該指標歸屬于專利法律價值維度;
(2)專利權利要求數量 (PCl) ,指專利文件中給出的專利說明或技術方案的數量,通常一項專利所具有的權利要求數量越詳細,其技術保護越明晰,權利范圍越穩定,反映專利的權利穩定性和技術保護范圍。該指標歸屬于專利法律價值維度;
(3)專利被引證次數 (PR) ,或稱被引用次數,主要是指專利被其他專利引用的數量,其可以反映專利的技術重要程度,一項重要專利技術出現以后,會被相關技術改進專利大量重復引用,居于較為基礎的技術地位,具有較高的技術價值。該指標歸屬于專利技術價值維度;
(4)專利引用次數 (PC) ,或稱專利引證次數,能夠反映待評估專利的技術基礎和技術發展延伸關系。如果專利申請引用的專利或審查員引用對比的文獻較多,則該專利通常為改進型技術,居于較為次要的技術地位。該指標歸屬于專利技術價值維度;
(5)專利的非專利引文量(NPC),主要是指待評專利引用的非專利文獻的數量,通常用來反映專利的技術理論描述深度。該指標歸屬于專利技術價值維度;
(6)專利發明人數量 (PI) ,主要指一項專利所涉及到的發明人數量,通常反映出該專利技術投入與創新的程度,對技術研發的人力資源投人越多,耗費的成本也越大,其越具有重要經濟價值。該指標歸屬于專利經濟價值維度;
(7)專利分類號數量(PCN),主要是指專利文件中給出的分類號涉及的技術類別IPC的數量,通常一項專利所具有分類號越多,其涉及的領域越多,該專利適用范圍越廣,越具有較高的市場應用價值。該指標歸屬于專利經濟價值維度;
(8)專利同族數量 (PF) ,指專利基于同一優先權文件,在多個國家或地區申請的內容相同或基本相同的專利數量,通常一項專利的同族數量規模越大,地域覆蓋范圍越廣,則其市場占有力越強,專利價值相應也就越大。該指標歸屬于專利經濟價值維度。
綜上,基于改進關聯規則所構建的專利價值評估指標體系如表5所示。
3實證研究:固體氧化物燃料電池領域的專利價值評估
選用固體氧化物燃料電池(SOFC)技術領域進行實證研究,使用Incopat專利數據庫獲取數據。以“Solidoxideelectrolysiscell$”\"SOEC$\"\"solidoxide\"等字段為“標題摘要\"內容進行檢索,共獲得29272項SOFC技術領域專利。
對獲取到的專利數據進行清洗和處理,依照“專利當前法律狀態”作專利有效和失效類型劃分,并基于“專利申請日、專利失效日\"字段進行專利壽命的計算,并將“專利壽命\"\"專利分類號數量”\"發明人數量\"\"權利要求數量”四項題錄的缺失值以“平均值\"填充,“引用次數”“被引證次數\"\"非專利引文量\"的缺失值以\"0\"值填充。
隨后,將處理好的數據標準化后,導人機器學習算法中進行實證分析。研究中,主要使用支持向量機(SVM)、邏輯回歸(logistic)、K近鄰(KNN)、隨機森林(RandomForest)和XGBoost五類機器學習算法,使用Incopat數據庫中的“合享價值度”指標作為有監督學習,將“合享價值度 =10′ 的專利視為高價值專利[21],其余專利視為“低價值專利”。鑒于部分指標值存在統計時滯性,因此將數據集中“專利申請年=2010、2012、2014、2018和2020\"共5年的7628項專利作為預測集,將其余年份的21644項專利作為訓練和測試集數據,以試驗所構建評估指標體系的效度。
為將訓練和測試數據優化處理,從專利價值度較低的數據中隨機抽取7358項數據,與7358項高價值專利構建成1:1的訓練和測試數據集,并隨即從中抽取 80% 作為訓練數據,余下 20% 作為測試數據。
表5基于改進關聯規則的專利價值評估指標體系

過程中對kernel ?n _estimators ?n _neighbors等參數進行調優,完成各模型的訓練和測試。其主要測試結果如表6所示。
表6五類機器學習算法測試結果

由表6可知,本研究基于改進關聯規則算法構建出的專利價值評價指標體系在5種機器學習算法效力測度中,4種評估值的有效率均在 70% 以上,效度最高的隨機森林算法4項測度指標均在 85% 以上,充分證明了本研究所構建指標體系的有效性。
下面僅以效度最優的隨機森林算法,使用預測集中的專利做進一步效度檢驗。檢驗時,從低價值專利中隨機抽取2148項與2148項高價值專利構成1:1的預測數據集4296項,對相關參數調優,并將預測結果值導出,且保留1位小數。將預測結果與Incopat數據庫中的原值做比較分析,具體如圖3所示。
圖3 目標值與預測值間的差值統計

由圖3可知,預測集4296項專利中,共有3027項(約 70.46% )專利價值的目標值與預測值之間差距在2之間,有631項(約 14.69% 的專利價值評估值較實際值低3~5個值,另有311項( 7.24% 的專利價值評估較原值高3~5個測度值。由此,研究中構建的專利價值評估指標體系具有較好的可用性與易用性,整體專利評估有效性也較高,滿足海量專利價值評估的需要。
4結語
2024年6月,習近平總書記在全國科技大會上的講話指出:聚焦現代化產業體系建設的重點領域和薄弱環節,增加高質量科技供給,培育發展新興產業和未來產業,積極運用新技術改造提升傳統產業。專利價值評估指標體系的合理構建,作為實現專利價值有效評估的關鍵前提,是實現高質量科技供給的重要手段之一,對于著重發揮技術創新在科技強國建設中的關鍵作用,推動市場經濟發展,助力發展新質生產力具有重要意義。本文對專利價值評估指標體系開展研究,主要研究結論有以下三點:
(1)基于已有的專利價值評價指標體系,運用改進后的關聯規則算法進行專利價值評估指標體系的構建,探索出一種構建評估指標體系以實現專利價值評估的有效方法。
(2)研究中考慮關聯規則算法來源數據的強弱關系,使用文獻被引量和發文時間兩個指標對關聯算法進行改進,提升了最優關聯規則識別的準確性,實現了關聯規則算法的有效改進。
(3)研究中使用固體氧化物燃料電池技術領域專利對指標體系進行實證分析,計算結果具有較高的信度和效度,證明了本文所提出專利價值評估指標體系構建方法的有效性,能夠實現專利價值的準確評估。
本文存在的不足之處有:為了滿足評估指標體系的可驗證性和易操作性,僅選用了易獲取、可量化的專利評估指標構建共現矩陣,整體指標體系對專利價值的考察范圍有待進一步驗證。同時,僅選用固體氧化物燃料電池單個領域專利進行實證,未來可嘗試將指標體系擴展到其他領域進行研究和分析。
參考文獻:
[1]國務院新聞辦網站.國務院新聞辦發布會介紹2023年知識產權工作進展情況[EB/OL].(2024-01-16)https://www.gov.cn/lianbo/fabu/202401/content_6926362.htm.
[2] 中國技術交易所組織.專利價值分析與評估體系規范研究[M].北京:知識產權出版社,2015.
[3] NARINF.Patentsasindicators fortheevaluationofindustrialresearch output[J].Scientometrics,1995,34(3):489-496.
[4] SUZUKI J.Structural modelingofthevalue of patent[J].ResearchPolicy,2011,40(7):986-1000.
[5] CHENJ,YUANZM.Thestudyoninformation technologypatentvalueevaluation index based on real option theory[J].SpringerBerlinHeidelberg,2012(160):309-315.
[6] LIYM,ZHAOJ,LEIWT.Research onevaluationindex systemofpatentvalue fortechnological innovationenterprises[J].International Conference on Social Scienceand Development,2015(1):1-8.
[7] 蒙大斌,李欣怡.基于因子分析的人工智能產業專利價值評價[J/OL].科學與管理,1-10[2024-08-23].http://kns.cnki.net/kcms/detail/37.1020.G3.20240524.1435.002.html.
[8] 楊武,孫世強,陳培.技術鎖定視角下的專利價值影響因素分析[J].科學學研究,2022,40(6):1024-1033.
[9] BASSSD,KURGANL A.Discovery of factors influencingpatentvaluebased on machine learning in patents in the field ofnanotechnology[J].Scientometrics,2010,82(2):217-241.
[10]CHANG K C,CHEN C,KIANG YJ,et al.A study of influencingfactorsofpatentvaluebasedonsocialnetworkanalysis[J].PortlandInternational Conference on Management of Engineeringamp;Technology,2016(1):1470-1477.
[11]宋凱,冉從敬.基于指標計算與內容分析的高校專利價值評估方法研究[J].情報理論與實踐,2023,46(2):136-144.
[12]趙雪峰,胡瑾瑾,吳德林,等.一種基于特征拼接、標簽遷移及深度學習組合的專利價值評估方法[J]情報學報,2023,42(6):663-680.
[13]方曦,李清瑞.高校專利申請前價值評估體系構建及實證研究[J].科技管理研究,2024,44(8):48-56.
[14]夏蕓,魏田苡薇,洪楷宣,等.專利形成全周期視角下的高價值專利識別體系研究[J].科學與管理,2024,44(4):1-9,103.
[15]INTAN R.A proposal of fuzzy multidimensional association rules[J].JurnalInformatika,2006,7(2):306-310.
[16]王玉奇,高建華.一種基于關聯規則的 Web 應用統計測試方法[J].計算機工程,2020,46(3):206-213.
[17]RAUCH J.Expert deduction rules in data mining with associationrules:acase study[J].Knowledgeamp; Information Systems,2018,59(1):167-195.
[18]WARDANI D W.Measuring positive and negative association ofapriorialgorithm with cosine correlation analysis[J].BaghdadScienceJournal,2021,18(3):554-564.
[19]王康,陳悅,蘇成,等.多維視角下科學主題演化分析框架[J].情報學報,2021,40(3):297-307.
[20]鄒凌君,陳崎,李娟.時間加權的混合推薦算法[J].計算機科學,2016,43(增刊2):451-454.
[21]欒春娟,梁樂言,竺申.中美產/學/研專利價值度比較及啟示[J].科學與管理,2020,40(3):7-13.
Construction Method Research of Patent Value Evaluation Index System Based on Improved Association Rules
HANMeng1,CHENYue1,WANGYuqi1,CUILinwei2 (1.TheInstituteofScienceofSienceandSamp;TManagementamp;WISELab,DalianUniversityofTechnology,Dalian116O24,hina; 2.College of Information Resource Management,Liaoning University,Shenyang 110136,China)
Abstract:Effectively evaluating thevalueof patentsand increasingthesupplyof high-quality technology isof great practicalsignificance for implementing theconstructionof astrong intellctual propertycountry.This paper explores the useof improved association rulesalgorithmtoconstruct the patent value evaluation index system,overcomes theresearch defects of toocomplex dimensionsandstrong subjectivityintheselectionof indicators inprevious studies,optimizes the construction methodof patent value evaluation index system,and enriches theresearch methods of patentvalue evaluation. Firstly,this paper constructs the System Index co-occurrence matrix basedon the previous patent value evaluation research papers.Then,this paper introduces the document publishing timeand cited quantityto weighttheitemset,and thencalculates theoptimalassociationrule index set.Finall,this paperconstructs the patent value evaluationindex system acording to the optimal association rules and index atributes.This paper uses SOFC technology patents and five machinelearningalgorithmstoempiricall testthevalidityoftheconstructionresults,verifiestheavailabilityand practicabilityof the index system,and alsoconfirms theefectivenessofthe proposed index system construction method.
Keywords:patent value;evaluation index system;association rules;machine learning algorithm