冉從敬,宋 凱
在經濟全球化時代,企業競爭愈加激烈,隨著新興技術復雜度的提高,單一企業完成技術創新的難度愈發增加。因此,通過專利權利轉移獲取外部技術支持,成為企業提升技術創造力的重要形式。高校在技術研發、人才資源、實驗條件方面具有天然優勢,截止到2018年12月,國內大專院校發明專利有效量為537,953件[1]。面對海量的高校專利資源,部分企業通過專利權利轉移方式,實現了高校專利成果的技術價值轉化為產業價值。但是,《2019年中國專利調查報告》顯示,我國高校專利權人科技成果轉化率在10%以下的占到80.1%,高校有效專利產業化率僅僅只有3.7%[2],這說明我國高校大量專利成果束之高閣,高校專利應用比例偏低,導致大量科技成果嚴重閑置。企業是技術創新的主體,高校是科學研究的殿堂,高校應該更多從事技術轉移工作,將科技成果申請專利后,以專利權利轉移方式與企業合作,由企業去進行工程化試驗和量產,最終實現成果轉化[3]。因此,探索提升高校專利權利轉移效率的實踐路徑,對實現高校專利技術價值,推動區域和國家科技創新水平,實現校企聯動發展具有重要意義。通過對高校專利進行有效評估,一方面可以發掘高價值度專利,通過規范化的專利運營模式,以權利轉移方式,實現專利技術的產業化應用;另一方面,可以剔除低價值度專利,通過斷繳年費、聲明放棄等形式宣告專利失效,以節省科研成本,加大對前沿技術的投入。因此,如何構建一套具有較強科學性和可操作性的專利價值評估方法,成為高校科技成果管理效率提升以及企業尋求高校核心技術所應重點關注的問題。
對專利價值評估的研究,學者從多方面展開探索。首先,通過構建評價指標體系,采取定量分析進行專利評估。Hiller等將綜合市場數據與BLP模型結合,提出實踐性較強的專利價值評估方法[4]。Cerqueti等將實物期權方法應用到專利評估中,通過指標體系構建對已有專利評估方法進行有效改進[5]。Kabore等將國家市場規模賦權到專利族數量上預測專利價值,評估效果優于基于專利引文的評估方法[6]。謝萍等利用德溫特世界專利索引,從企業專利權人實力和專利技術兩個角度構建企業專利價值評價體系[7]。資智洪等比較國內外專利價值評估的關鍵指標和專利價值的影響因素,構建用于評估專利價值的二元分類方法[8]。楊思思等參考《專利價值分析指標體系》操作手冊的經濟價值度評估方法,選取7個指標,總結了一套專利經濟價值度的通用評估方法[9]。相關學者也借助機器學習算法進行專利價值度評估。Ercan等提出將支持向量機算法應用于專利申請,依據評估結果對專利是否授權或駁回進行判斷[10]。Trappey等收集特定技術領域的專利數據,采用BP神經網絡對專利潛在價值進行評估[11]。王子焉等構建包含網絡平臺特性的專利價值評估指標體系,提出基于灰色關聯分析—隨機森林回歸的專利價值評估模型[12]。周成等根據專利的價值指標,設計基于自組織映射—支持向量機的專利價值評估及分類模型[13]。邱一卉等提出基于分類回歸樹模型的屬性選擇方法,用于構建專利價值評估的指標體系[14]。
已有研究集中探討構建專利評價指標體系,通過定量分析對專利價值進行評估,以及采取機器學習算法進行二元分類,以獲取高價值度專利列表。通過構建專利評價指標體系的方式,一方面需要對專利進行逐件評估,效率較低;而采取機器學習算法進行專利價值評估,往往是粗粒度的標記標簽,不能從更加細粒度的層面計算專利實現權利轉移以及存在失效風險的概率。因此,本研究在借鑒與吸收已有研究成果的基礎上,從科學性、適應性和可操作性角度出發,提出一種高校專利價值評估模型,以新一代信息技術產業領域——“云計算”為例,搜集專利基本指標構建數據庫,利用評估模型對技術領域內的高校專利進行預測,篩選具備權利轉移潛力的專利,以及具有失效風險的專利,旨在為高校科技成果管理人員在進行專利運營時提供實踐路徑,也為企業在尋求高校高價值度專利時提供決策參考。
依據國家知識產權局《專利價值分析指標體系操作手冊》,結合已有研究應用的評價指標,本研究選取11個指標對專利權利轉移概率進行預測,見表1。在選取過程中,一方面關注指標數據是否易于尋找和統計;另一方面考量所選取的指標是否能綜合體現專利價值。例如,發明人數量反映了技術研發過程中的合作關系以及核心研究團隊規模,權利要求字符數反映了專利技術的保護全面程度,被引用次數反映了專利的技術價值。

表1 專利指標匯總表
為驗證指標選取的有效性,提升模型的評估性能,在構建識別模型前,首先利用主成分分析法對指標進行分析。主成分分析法是一種分析、簡化數據集的技術,經常用于減少數據集的維數,同時保留數據集對方差貢獻最大的特征,能夠展現數據最重要的方面[15]。在分析過程中,使用KMO和Bartlett檢驗評估變量是否能夠使用主成分分析法來進行研究,KMO 值的范圍為0-1,其值越接近1,且Bartlett球形度檢驗的顯著性概率均為0,代表各個變量間相關性顯著,表示適合作主成分分析。
本研究在識別模型構建過程中,采用機器學習中的二元分類算法實現。常用的分類算法有邏輯回歸、K近鄰、支持向量機、人工神經網絡、決策樹、隨機森林、Adaboost等。為選取適用于識別模型的分類算法,本研究采取K折交叉驗證,選取最優算法,進而通過參數調優訓練識別模型,并繪制ROC曲線。ROC曲線所覆蓋的區域面積為AUC值,AUC值越大,表明分類器效果越好,通常AUC的值大于0.7時,表明模型具備預測價值。為從更細粒度的層面區分高校具備權利轉移價值的專利和存在失效風險的專利,避免簡單地對專利進行二元分類,在對專利進行評估時,獲取專利能夠實現權利轉移的概率值,借鑒標準十分的分級方式,設置從AAA→D共十級得分,根據專利的權利轉移概率值進行劃分,最終實現識別權利轉移專利和存在失效風險專利的目標。
通過選取專利評估指標,在多元統計以及機器學習的支持下,構建高校專利價值評估模型(見圖1),幫助高校科技成果管理人員快速定位具有權利轉移價值的專利以及存在失效風險的專利,為制定專利運營策略提供決策支持。同時,為企業在尋求高校核心技術時,通過模型評估,篩選存在權利轉移價值的專利,為選擇合適高校進行知識產權合作提供決策參考。

圖1 高校專利價值評估模型圖
由圖1 可見,模型共分為3 大部分,涵蓋“數據采集與存儲→指標選取及算法評估→模型構建及專利識別”的全過程。
(1)數據采集與存儲。構建的模型要具備較好的識別性,必須依賴大規模專利數據的訓練。在評估指標選取階段,選取的指標都是易于統計且能綜合反映專利價值度,因此,需要通過專業化的專利數據庫進行專利指標數據的采集。在采集數據過程中,從3個方面出發:一是獲取國內發明授權專利中發生權利轉移且法律狀態有效的專利指標數據;二是獲取國內發明授權專利中未發生權利轉移但法律狀態已失效的專利指標數據;三是獲取國內高校發明授權專利中未發生權利轉移且法律狀態有效的專利指標數據。最終形成專利指標數據庫,用于評估模型的構建。
(2)指標選取及算法評估。為提高模型訓練性能,借助于主成分分析對評估指標進行分析。在分析過程中,以KMO和Bartlett檢驗評估指標之間的相關性,保留重要評估指標。其中,以“權利轉移次數”作為評判專利是否實現權利轉移的標準,構建模型訓練集、驗證集和預測集。訓練集和驗證集均包含國內授權專利中已發生權利轉移且法律狀態有效的專利指標數據以及國內授權專利中未發生權利轉移且法律狀態已失效的專利指標數據。為得到適用于識別模型的分類算法,采用十折交叉驗證對7 種分類算法進行初步評估,通過性能比較獲取最優算法。
(3)模型構建及專利識別。獲取最優分類算法后,使用訓練集對算法進行參數調優,構建評估模型,并使用驗證集對模型性能進行檢驗,繪制ROC 曲線,以AUC 值評估當前模型的有效性,當AUC值高于0.7以上,表明評估模型具有預測價值。最后,使用評估模型對預測集中高校未發生權利轉移且法律狀態有效的專利進行預測,借鑒標準十分的評估標準,依據概率值不同進行十級劃分,最終識別出具有權利轉移價值的專利以及存在失效風險的專利。
本文數據從Patsnap專利數據庫進行采集,技術領域限定為“云計算”,檢索式為:“云計算”or“云平臺”or“云存儲”or“云數據中心”or“數據云”or“醫療云”or“云計算中心”or“云計算系統”or“大數據云”or“云計算技術”;時間不限。首先以“中國發明授權專利&法律狀態→有權&法律事件→權利轉移”,檢索到1,971件專利;以“中國發明授權專利&法律狀態→無權&法律事件→未繳年費|放棄權利”,檢索到1,663件專利;以“中國發明授權專利&專利權人→大學&法律狀態→有權&法律事件→未發生權利轉移”,檢索到1,948 件專利,依據選取的專利評估指標,獲取每件專利的基本數據,構建專利指標數據庫。
在專利指標數據庫構建完成后,劃分訓練集、驗證集和預測集。其中將“有權&權利轉移”中的1,500條數據與“無權&(未繳年費|放棄權利)”中的1,500條數據合并成訓練集;將“有權&權利轉移”中的471條數據與“無權&(未繳年費|放棄權利)”中的163 條數據合并成驗證集;將“大學&有權&未發生權利轉移”中的1,948條數據作為預測集,分別用于之后的模型訓練和專利識別。
在進行算法評估前,首先將訓練集和驗證集合并進行主成分分析,確定評估指標之間的相關性,以確定評估指標選取的有效性。利用SPSS進行主成分分析,通過多輪指標數據迭代,結合相關矩陣數值和KMO數值,確定保留11個評估指標,以獲取較好的主成分分析結果。對結果進行分析,發現相關矩陣表中,大部分非對角線元素都大于0.3,小于0.85,且對應的Sig值較小,說明變量之間具有相關性,能夠進行主成分分析。KMO度量值為0.698,Bartlett球形度檢驗顯著,進一步體現各個變量間相關性顯著,適合作主成分分析。依據主成分解釋的總方差表和碎石圖,當保留5個主成分時,累計方差貢獻率為71.4%,說明這5個主成分能夠解釋絕大部分的原始變量信息。結合成分載荷矩陣中各個影響因素相對應的載荷量與主成分之間的緊密關系進行劃分,對主成分進行重新命名,見表2。

表2 專利評估指標重要成分表
由表2可以發現,根據各個成分下的影響因素進行歸納,11個指標涵蓋專利的經濟特征、技術特征、法律特征、應用特征和戰略特征,能夠較為全面地反映專利的價值度,所以以這11個指標進行專利價值評估是合理的。利用包含11個指標的訓練數據集,分別對“0→邏輯回歸”“1→K近鄰”“2→人工神經網絡”“3→支持向量機”“4→決 策 樹”“5→隨 機 森 林”“6→Adaboost”等7種算法進行性能評估,采取十折交叉驗證計算分類準確度平均值,并繪制折線圖,見圖2。從圖2可發現,在沒有進行參數調優的情況下,人工神經網絡的分類性能最優,因此,在識別模型的構建過程中采用人工神經網絡算法實現。

圖2 分類算法性能評估圖
通過算法評估選取人工神經網絡構建模型,首先利用包含3,000條數據的訓練集對模型進行訓練,采用十折交叉驗證對模型進行調優,當激活函數使用relu、優化算法采用Adam、包含3層隱含層、每層20個神經元,最大迭代次數設置為1,000 時,分類準確度約0.76,損失度約0.26。使用包含634條數據的驗證集,測試模型對未知數據的分類性能,繪制ROC曲線,見圖3。由圖3可見AUC的值約為0.77,表明模型具備較高的預測價值,能夠應用到高校權利轉移專利及存在失效風險專利的識別。

圖3 驗證集ROC曲線圖
在驗證模型有效性的基礎上,利用模型對預測集中的高校專利進行識別,獲取每件專利能夠實現權利轉移的概率及存在失效風險的概率,借鑒標準十分評估方法,設置專利實現權利轉移概率的十級閾值,形成評估表3。從表3 發現,在“云計算”領域,處于AAA 級的專利比重為10.68%,而CCC 級→D級的專利比重約22.64%,反映出高校具備權利轉移價值的專利比例較少,近四分之一專利存在失效風險。

表3 高校專利權利轉移概率統計表
在十級評分的基礎上,依據每件專利的權利轉移概率繪制柱狀圖,并添加趨勢線,見圖4。分析圖4發現,高校專利權利轉移概率呈二次多項式分布,R2=0.99,方程擬合程度較好,體現了高校在“云計算”領域中,少部分專利具備高價值度,大部分專利價值度較低。這種狀況產生的原因,一方面是部分高校專利的申請是由研究課題驅動產生的,與已發生權利轉移的專利相比,在技術深入度、經濟產業化、法律完備性方面存在差距;另一方面,為了保護核心技術,高校在專利申請時往往會進行專利布局,產生了大量不具備權利轉移價值的專利。因此,結合以上情況,在“云計算”領域,通過專利識別模型確定出10.68%具有權利轉移價值的專利,并不是處于一個較低水平,這部分專利應該得到高校科技成果管理部門的重視,圍繞高價值度專利,構建專利技術包,并制定專利運營策略,尋求技術轉移。同時,對其他存在失效風險的專利,應展開遴選,放棄專利權,節約高校科研成本,將其投入到研究團隊的研發中,進一步提高發明專利的核心競爭力,提升產業應用價值。

圖4 高校專利權利轉移概率分布趨勢圖
通過構建專利價值評估模型對高校“云計算”領域存在權利轉移價值和失效風險的專利進行識別,并依據權利轉移概率,借鑒標準十分評估法對專利進行打分,其中AAA級的權利轉移概率最高,D級存在失效風險的概率最高,對這兩個級別下的專利指標數據進行重點分析,首先基于熵權法計算已發生權利轉移專利中各個指標的權重,探析哪些指標是影響專利權利轉移的重要因素,進而對AAA級和D級中的高校專利進行指標平均值計算,統計結果見表4。

表4 高校專利權利轉移概率(AAA、D)基本指標平均值統計表
分析表4發現,采用熵權法計算的11個指標權重,其中引用專利數量的權重最高,引用專利數量體現的是專利技術吸收復雜度,引用專利數量越多,表明專利基于的前沿技術越多元,技術基礎越扎實,是專利技術價值的重要體現。3年內被引用次數和5年內被引用次數的權重大小也位居前列,這兩項指標體現了領域內研發人員對該專利技術的認可,被引用次數越多,表明該專利對領域內其他專利的技術創新具有重要的指引作用,是專利經濟價值和應用價值的重要體現。權利要求字數這一指標也具備較高權重;權利要求限定了專利的保護范圍,是判定侵權的主要依據,直接影響了專利的技術創新能力,是專利法律價值的重要體現。以上四個指標對高校專利權利轉移概率具有較大的影響作用,在高校進行專利申請和專利運營時應該得到重視。
進一步對表4中AAA級和D級的專利指標平均值進行對比分析,發現除“X1→IPC分類號數量”和“X10→摘要字數”兩個指標之外,在其他9個指標中,AAA級專利的指標平均值明顯高于D級。結合上述對占據重要權重指標的分析,對高校和科研團隊進行技術研發和專利申請提出了更高要求,應該重視高權重指標對高校專利權利轉移的影響作用。因此,在高校層面,高校知識產權信息服務中心要為科研團隊的專利創造、管理和運營提供全方位支持,對科研團隊提出的研究內容進行廣泛深入的科技查新,保證研究內容的前沿性和尖端性;在技術交底書的撰寫過程中,專利引證數量、權利要求數量、權利要求字數等方面要做到全面扎實,保證專利的質量和保護范圍;針對核心技術,要做好專利布局工作,通過申請同族專利,形成技術競爭優勢,這也為提高專利的被引證次數奠定基礎。在科研團隊層面,專利技術的提出要建立在對前沿技術進行全面整合的基礎上,保證技術的復雜度和創新性;在科研團隊組建方面,要保證足夠數量的技術人員實現專利技術的產業化應用。綜合以上分析,本文所提的專利價值評估模型不僅能夠識別高校中某一技術領域存在權利轉移價值和失效風險的專利,推動高校專利技術向產業界轉移,還能在此基礎上對識別結果進行深入剖析,發掘核心專利指標對專利權利轉移的影響,對于強化高校專利質量,提升高校科技成果管理部門、高校知識產權信息服務中心的專利管理和專利服務效率具有重要的參考價值。
本文從科學性和易操作性角度出發,選取高校專利價值評估指標,將主成分分析法與分類算法結合,為高校科技成果管理人員提供了行之有效的方式,快速識別已有的授權專利中,具備權利轉移價值和失效風險的專利,為高校制定專利運營策略以及企業快速定位高校核心技術提供參考支持。本文存在的不足之處有:所構建的評估模型僅使用“云計算”領域的專利數據,數據樣本較少;另外在指標選取過程中,為了指標的易獲取性,僅選取11個指標形成評估體系,科學性有待進一步驗證。因此,在后續研究中,將探索構建全領域的專利數據樣本,擴充專利評估指標體系,實現對高校不同技術領域中具備權利轉移價值專利的識別。