尉心淵
(山西大學,太原 030006)
專利是科技進步的產物,是科技水平的體現。其所蘊含的信息對于科技型企業的發展和競爭有非常重要的參考價值,是制定正確的專利戰略、衡量科技進步的重要指標。誰能最先掌握核心專利,誰就能在市場中占據主導地位。當前,在轉化收益普遍不公開的情況下,被引次數無疑是預測核心專利的最為重要的指標。提前準確地預測出某一領域的核心專利,也就可以挖掘出企業的經濟價值,可以為企業制定專利戰略、盡早布局技術研發或轉讓等提供參考。
技術創新和進步促進了專利申請量的大幅增加,而核心專利的識別與評估也成為專利計量學的一個熱門領域。現有的對于核心專利識別方法的研究有很多,大都是基于專利質量評價指標來進行。在所有指標中,專利被引次數指標使用最廣泛。一般而言,被引頻次較高的專利在產業鏈中所處位置較為關鍵,在一定程度上反映了專利在某領域研發中的基礎性、引導性作用。一些專家認為,專利的被引頻次是衡量一個專利價值的重要指標,通過分析專利的被引頻次能夠識別出核心專利。因此,專利的被引頻次可以用做確認企業重要專利及核心技術的指標[1]。有研究表明,專利發布后幾年的被引頻次服從的偏態分布與專利質量的分布非常相符,被引頻次高的專利就是高質量的專利[2]。這說明,研究專利的被引頻次對于核心專利的發現以及專利價值的預測有很重要的意義。通過預測某一專利的被引頻次,衡量該專利的價值程度,可以非常準確的預測該專利是否會成為核心專利。現在專利質量評價指標的研究較為成熟,常用的指標大致可以歸為以下四個方面:(1)被引。主要是考察現有專利被后續專利的引用情況,一般認為某專利被引次數越多,它對后續專利的影響越大,越有可能成為核心專利。(2)引用。主要是考量該專利引用已有相關論文以及與現存科學知識的關聯度,主要指標包括科學關聯度、科學強度等。這方面的指標數值越大,表明該專利跟技術的聯系相對緊密。(3)技術保護范圍。這類指標是發明人對該專利技術保護程度的體現,主要有權利要求數量、技術覆蓋范圍等指標。專利權人對該專利越是重視,申請保護的權利范圍越廣,說明該專利對技術發展越重要。從本質上講,這類指標最能反映專利質量。(4)區域保護范圍。該類指標主要是考量專利權人對其專利申請了法律保護的國別數。專利族大小指標是這個角度的代表,該數值與專利質量為正相關關系,說明該指標對于專利質量衡量有很重要的參考意義。
通過國內外研究的分析可以看出,核心專利的識別有一定的研究成果,但是對于專利被引頻次的預測不夠具體,對于核心專利的研究也有待深入。為了解決這些問題,本文構建了一種專利被引頻次的預測模型,通過分析專利信息以及被引頻次與核心專利之間的關系,選擇正確的指標體系,以確保模型的科學性和適用性,使用支持向量機回歸的方法實現核心專利的預測,為企業尋找未來的發展目標、實現在技術上的突破提供參考。
回歸分析的關鍵是變量的選擇,通過具體分析核心專利的影響因素,確定影響被引頻次的因素,正確選擇預測模型中的變量,綜合分析現有專利質量評價指標的研究,選擇3個指標:科學關聯度、權利要求數、專利族大小,進行模型中指標體系的構建。本文選擇的3個指標是專利指標三個方面的代表。雖然其他指標對于模型的構建也有作用,但相關性較低,所以選擇了這3個指標進行指標體系的構建。
支持向量機是一種小樣本數據的機器學習方法,憑借其極強的泛化能力,可以解決傳統預測方法面臨的“維數災難”和“過學習”等困難[3]。該方法在專利領域有很廣泛的應用,徐晟為了對我國專利申請量進行預測,使用支持向量機進行回歸分析,發現該預測方法有很高的預測精度[4]。Fall和Benzineb等以IPC分類號為研究對象,分別對樸素貝葉斯算法、支持向量機、K近鄰算法進行分類運算,比較后發現支持向量機的分類效果最好[5]。
綜合比較各個核函數的作用,并結合專利數據的性質,我們發現使用Gauss徑向基核函數對于該模型的構建更加合理,模型的預測結果比較精確。另外,懲罰系數和核函數的參數使用交叉驗證法和網格搜索來進一步確定,這兩種方法因其科學性和準確性在現有研究中使用較為廣泛。通過使用專利數據對模型進行驗證,我們發現該模型的預測準確率都比較高,可以說明支持向量機在專利被引頻次預測以及核心專利發掘方面有很強的適用性。
通過模型預測出的核心專利可以實現產品質量的改進和服務水平的提升,加快產品的更新換代速度,以獲取更多的經濟利潤。另外,通過核心專利可以精準監控競爭對手的實力水平,掌控產業發展的方向,通過正確布局外圍專利,圍繞核心技術進一步開發新的外圍技術和產品,有可能實現產業壟斷。
參考文獻:
[1]Harhoff D.,Narin F.,Scherer F M.,etal.Citation Frequency and the value of patented inventions[J].The Review of Economics and Statistics,1999,(8):511-515.
[2]萬小麗.專利質量指標中“被引頻次”的深度剖析[J].情報科學,2014,(1).
[3]Vapnik V.N.An overview of statistical learning theory[J].Neural Networks,IEEE Transactions,1999,(5):988-999.
[4]徐晟,趙惠芳,郭雪松.我國專利申請量的支持向量機預測模型研究[J].運籌與管理,2007,(5).
[5]Fall C.J.,TorcsvariA,Benzineb K.,etal.Automated categorization in the international patent classification[C]//ACM SIGIR Forum,2003.