999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

采用機器學習算法的技術機會挖掘模型及應用

2020-08-03 03:45:56包清臨柴華奇趙嵩正王吉林
上海交通大學學報 2020年7期
關鍵詞:價值模型

包清臨, 柴華奇, 趙嵩正, 王吉林

(西北工業大學 管理學院, 西安 710129)

技術機會是開展技術創新活動的前提和條件[1-2].挖掘并搶占技術機會,為創新活動的展開贏得先機[3-5].近年來,以專利驅動挖掘技術機會受到學術界的廣泛關注.專利記載了核心技術信息,包含了前沿技術創意,充分利用專利,可以大大縮短技術機會挖掘時間,節省40%的研發費用[6-7].

根據技術機會相關研究中專利樣本量的大小,可以把現有專利輔助挖掘技術機會的研究分為兩類.一類研究是以少量的專利樣本為出發點,結合技術的應用前景挖掘技術機會.江屏等[8]在確立研發目標后,以封隔器領域的673件專利為樣本,根據TRIZ理論為技術機會構建待規避專利技術的原理解模型,使其規避可能存在的專利風險.Wang等[9]認為科學論文和專利記錄了科學發現和技術發展中核心的知識,通過二者可以發現并挖掘潛在的技術機會,因此采用文本挖掘和聚類算法對微藻類生物燃料領域的技術機會進行了探索.Jia等[10]選擇目標類專利,采用類比設計方法,對技術機會進行發掘,尋找創新設計理念.此類研究能較好地實現特定目標,但由于專利樣本量較小,計算結果與設計目標容易背離,技術機會挖掘結果應用性低.另一類研究以海量專利樣本為出發點,通過數據挖掘技術,結合統計方法對專利文本的結構化信息進行處理.Cheng[11]以大量專利為樣本,采用文本挖掘技術,構建專利技術功效矩陣(PTFM),通過對PTFM中技術呈現出的密集區及真空區的分析,得到技術機會挖掘結果.Jin等[12]從專利信息出發,通過市場和產品兩個維度,搭建PTFM并繪制專利技術功效圖,以識別太陽能照明領域的創新技術.Joung等[13]通過專利文本挖掘,提取了技術關鍵詞和功效關鍵詞,從而構建PTFM,對生物傳感器中電子轉移領域的新興技術進行了識別.相較于前一類研究,非目標類研究對專利的人工分類干涉較少,通過更廣的專利覆蓋,確定出更加前沿的技術方向,但是該類研究較少涉及了創新目標,得出的技術機會的應用性較低.

由此可以看出,少量專利樣本或缺乏創新目標下的研究,缺乏對技術前景的評估,由此形成的技術機會必然對其應用性產生影響,從而降低技術機會挖掘結果的可行性.因此,本文以提升結果的應用性為目標,在技術機會挖掘過程中加入對技術應用前景的評估,采用機器學習算法,以海量專利數據為樣本,結合文本挖掘、MapReduce計算框架和熵權-TOPSIS法,使用Python編程語言,構建三維的專利預測模型.并在鈦領域內應用該模型,為其挖掘潛在的技術機會.

1 相關研究綜述

1.1 文本挖掘與機器學習算法

文本挖掘亦稱文本數據挖掘,指使用數據挖掘、機器學習、自然語言處理等技術,結合分類、聚類、偏差檢測、關系分析等方法,解決文本集合或語料庫信息過載的問題,以發現其中隱含的信息或模式的過程,一般來說,文本挖掘包括信息檢索、信息抽取、信息挖掘以及信息解釋4個步驟,其中信息挖掘最為關鍵,主要包括文本預處理、文本聚類或文本關聯、特征提取以及結果可視化[14].

最開始研究抽取關鍵詞的模型是空間向量模型(VSM),但由于該模型方式不能對語意實現完全描述[15],便逐步涌現出了通過給定潛在變量,經過建模主題實現關鍵詞共現的主題模型.在主題模型中,概率潛在語義分析 (PLSA)算法較為主流.PLSA算法是在1999年由Hofmam提出的,能夠解決潛在語義分析(LSA)算法在文本挖掘過程中對大樣本處理不足的問題,同時,相較于奇異值矩陣分解(SVD)降維方法,PLSA算法能更清晰地推斷文檔與詞語間的關系模型.現有研究顯示,相較于LSA算法,PLSA算法能顯著提升關鍵詞抽取的效率和精確度,減少人工抽取的誤差,適于在大樣本環境中運行.它通過建立文檔、主題與詞語三者之間的映射關系,基于雙模態和共現準確抽取關鍵詞[16-17].

PLSA算法通過計算 “文檔-主題”和“詞語-主題”的概率矩陣,對共現概率進行排序,表現基于共同的觀察數據的隱藏變量關系,經過相似度計算和聚類分析,達到篩選關鍵詞的目的.因此可以說PLSA算法是構建概率主題模型的最佳選擇.PLSA算法主要基于以下假設[18]:①在同一潛在主題集合T={t1,t2,…,ts}下,文檔集合D={d1,d2,…,dn}和詞語集合W={w1,w2,…,wm}之間是獨立的;②詞語wi(i=1,2,…,m)和潛在主題tk(k=1,2,…,s)之間也是獨立的.

由此,選定任一文檔dj(j=1,2,…,n)的概率為P(dj),在PLSA算法中,該文檔所屬任一潛在主題tk的概率服從多項分布,表示為P(tk|dj);進一步在該潛在主題下,任一文檔dj生成詞語wi的概率也服從多項分布,表示為

(1)

式中:tk為潛在主題集合T中的任一潛在主題;dj為文檔集合D中任一文檔;wi為詞語集合W中任一詞語;P(dj)為選中文檔dj的概率;P(wi|tk)為在確定潛在主題tk下選中詞語wi的條件概率;P(tk|dj)為在確定文檔dj后選中潛在主題tk的條件概率;P(tk)為選中同一潛在主題tk的概率;P(dj|tk)為在確定潛在主題tk下選中詞語wi的條件概率.由于P(tk|dj)和P(wi|tk)符合多項分布,所以可以通過最大期望(EM)算法優化目標函數,通過循環迭代得到式(1)的最大似然解,有效解決數據過擬合問題.EM算法下的計算分為E步和M步.E步為期望步驟;M步為最大化步驟.根據E步和M步的計算規則,所得如下.

E步:計算給定觀測對(dj,wi)時選中潛在主題tk的概率.

P(tk|dj,wi)=

(2)

M步:在確定P(tk|dj,wi)的條件下計算P(wi|tk)和P(tk|dj)的概率.

(3)

(4)

式中:P(ts)為潛在主題取得最大值ts時的概率;P(dj|ts)為在概率主題取得最大值ts時選中文檔dj的條件概率;P(wi|ts)為在概率主題取得最大值ts時選中詞語wi的條件概率;P(tk)為任選某一潛在主題tk的概率;P(dj|tk)為任選某一潛在主題tk時選中文檔dj的條件概率;P(wi|tk)為任選某一潛在主題tk時選中詞語wi的條件概率;m(dj,wi)為詞語wi與文檔dj的共現概率;P(tk|dj,wi)為在給定觀測對(dj,wi)時選中任一潛在主題tk的條件概率;P(ts|dj,wi)為在給定觀測對(dj,wi)時選中潛在主題最大取值ts時的條件概率;m(dn,wm)為文檔取得最大值dn與詞語取得最大值wm共現概率;P(tk|dn,wm)為在文檔取得最大值dn和詞語取得最大值wm后選中任一潛在主題tk的條件概率;m(dn,wi)為文檔取得最大值dn與任一詞語wi的共現概率;P(tk|dn,wi)為文檔取得最大值dn并任選詞語wi后選中任一潛在主題tk的條件概率.用隨機數初始化之后,交替執行E步和M步進行迭代計算.PLSA算法以專利文本挖掘來實現對技術機會的挖掘,首先基于自然語言處理(NLP)對專利摘要文本進行預處理,包括對專利文本的詞性標注;然后根據詞性的不同,抽取專利摘要中的技術關鍵詞和功效關鍵詞;最后通過“專利摘要文本-詞語”概率矩陣對技術關鍵詞和功效關鍵詞的詞頻進行統計.

1.2 Hadoop平臺下的MapReduce計算框架

PLSA算法的實現,需要把“文檔-主題”和“詞語-主題”二維矩陣映射到分布式處理框架中.Hadoop是較為常見的大數據分布式處理平臺,它包括分布式文件系統(HDFS)和MapReduce計算框架.MapReduce計算框架通過主節點的Job Tracker來調度和分發所有任務,無需人工干預,能較好地實現計算目的.

MapReduce計算框架主要包含Map階段和Reduce階段.Map階段主要負責對數據的分析處理,最終轉化為〈key,value〉數據對;Reduce階段主要獲取〈key*,value*〉數據對,通過對其進行統計處理,得到相應結果.

1.3 專利技術功效矩陣

在傳統技術機會挖掘的模型中,PTFM較為普遍.PTFM以技術維為x軸,功效維為y軸,形成二維平面坐標[19].技術維與功效維的交點為專利單元項,它的大小與對應具有相應技術關鍵詞和功效關鍵詞的專利數量一致.在PTFM中,單元項越大,表示專利組合數量越多,該區域專利布局越密集;單元項越小,表示專利組合數量越少,該區域的專利布局越空白[20-21].不少學者以PTFM為依據,對技術機會進行挖掘與決策[22-24].

然而,僅運用PTFM作為分析工具,是不能實現對技術機會的完全預測.這是因為技術關鍵詞和功效關鍵詞僅是對技術特征及功能特征的描述,并不能對技術的運用前景和價值進行預測.因此,需要對PTFM進行改進,使其更加適應創新主體對前沿技術識別的需要.

1.4 專利價值與技術的應用前景

最早提出專利價值的是Pakes等[25],他們指出專利價值是用于衡量專利技術存續期的重要指標.Reitzig[26]認為專利價值與受專利保護的技術產品的市場指數呈正比.Bakker[27]指出專利價值與創新主體的技術計劃有關,是技術戰略的反映.Bessen等[28]提到專利價值是專利帶給專利權人的市場收益.Hiller等[29]認為專利價值是企業專利投資、轉讓、許可使用、質押等資產運營行為的重要價值參考.由此可知,本文認為專利價值體現為專利帶給專利權人的收益,該收益與技術機會的應用前景直接相關.因此可以采用專利價值指標,對技術的應用前景進行評估.

綜合以上分析,在算法選擇上,本文認為PLSA算法能更加突出地解決大樣本下專利文本的詞性標注和關鍵詞抽取問題,相較于其他方法更加高效,同時通過文檔-詞語間的概率轉換關系,能最大程度確保關鍵詞抽取的精確度;在框架選擇上,本文選擇MapReduce計算框架完成關鍵詞抽取,因此能不受人工干預完成實驗內容;在模型選擇上,本文將改進PTFM,構建以技術應用前景為指引的技術機會挖掘模型.

2 專利預測模型的提出及構建

2.1 專利預測模型的內涵

在PTFM的基礎上,創新性的添加第三維——價值維.即價值維與技術維和功效維一起共同構成三維的專利預測模型.專利預測模型是基于專利的、以價值為導向的、提供技術機會前景預測的技術應用模型.專利預測模型的構建流程如圖1所示.

圖1 專利預測模型構建流程Fig.1 Construction process of patent prediction model

實驗環境由3臺計算機搭建,在Java 8.1環境中使用Python語言,采用PLSA算法,基于MapReduce計算框架對專利文本進行挖掘.

2.2 技術維和功效維的構建

專利預測模型的x軸是技術維,其坐標上為技術關鍵詞,技術關鍵詞是領域內高頻技術方案和技術特征的展示,代表確定領域密集技術方向,為未來技術發展提供預見依據.專利預測模型的y軸是功效維,其坐標上功效關鍵詞,功效關鍵詞是領域內專利技術解決方案的展示,代表確定領域的技術功能,為未來技術應用功能的創新提供預見依據.技術維和功效維的構建步驟如下:

步驟1專利源數據獲取.德溫特專利索引數據庫(DII)中的專利已是二次加工的數據,具有格式規范、噪音小的特點[30].因此選擇DII中的專利摘要文本為源數據.

步驟2基于自然語言處理工具(NLTK)的文本預處理.專利摘要文本為自然語言,在計算機直接處理前,需通過預處理,對文檔進行分詞,除去停用詞,標注詞性,并確定線索詞.① 詞性標注.技術關鍵詞和功效關鍵詞一般為獨立名詞或名詞與名詞的組合,因此可以通過詞性標注來提高關鍵詞抽取的有效性.本文選擇對專利摘要文本中“USE”和“ADVANTAGE”兩部分的文本進行詞性標注,技術關鍵詞為名詞, 功效關鍵詞為形容詞.② 確定功效關鍵詞的線索詞.本文使用同義詞典中的特定動詞對功效關鍵詞定位, 這些特定動詞就是確定功效關鍵詞的線索詞,使用線索詞,可以顯著提高專利功效關鍵詞挖掘的速度和正確率.功效關鍵詞的線索詞如表1所示.

表1 確定功效關鍵詞的線索詞Tab.1 Clue words for determination of function keywords

步驟3在MapReduce計算框架之中,基于 PLSA 算法,抽取并計算技術關鍵詞的詞頻,同時將結果輸出;抽取并統計功效關鍵詞的詞頻,同時將結果輸出.

2.3 價值維的構建

本文采用專利價值來表示對技術應用前景的評估.在評估專利價值方法選擇上,熵權-TOPSIS法具有樣本容量大、不受參考序列選擇的干擾,信息失真小、運算靈活及應用領域廣等優點[31],因此選擇該方法對專利價值進行評估.

2.3.1基于DMC的應用主題域確定 德溫特手工代碼(DMC)是DII數據庫中的專業人員按照嚴格標引準則分配給每例專利的分類代碼,本文使用DMC作為應用主題域.由于專利被引次數和引用關系的相關研究是目前預測技術前景趨勢的重要指標[32-34],本文選擇確定領域內前1000例高被引專利,統計其DMC,并篩選出頻率最高的25個DMC,把DMC轉化為所屬應用主題域.

2.3.2專利價值評價指標體系構建 基于前人研究,本文從專利技術價值、專利市場價值和專利權利價值三個方面來構建專利價值評價指標體系[35-36].該指標體系共有3個一級指標、9個二級指標,具體指標項、指標含義及作用方向如表2所示.

表2 專利價值評價指標體系Tab.2 Evaluation index system of patent value

2.3.3指標打分及數據采集 聘請熟悉某領域的學者、管理人員和專利知識產權法律工作者進行打分,采用10分制對每個二級指標進行打分,其中10分為最高,1分為最低.

2.3.4熵權法下權重的計算 熵權法是一種有效確定各評價指標權重的方法.設有m個應用主題域,n個評價指標,則對應的評價指標決策矩陣可表示為

(5)

(6)

對Dij進行歸一化處理,即

(7)

計算第j個指標的熵值可表示為

(8)

因此第j個指標的權重系數可表示為

(9)

2.3.5基于TOPSIS法的專利價值評估 TOPSIS法是由Hwang等[37]于1981年首次提出的,該方法的核心是逼近理想解的排序,基本思路是衡量被評價指標現實狀態與理想狀態的歐氏距離,從而對其實現評估.TOPSIS法已被廣泛應用于對有限方案進行多目標評價決策領域[38-40].

以式(9)為基礎構建標準化權重矩陣:

(10)

(11)

(12)

計算每個應用主題域的各指標值與正理想解間的歐式距離為

(13)

計算每個應用主題域的各指標值與負理想解間的歐式距離為

(14)

則各應用主題域與正負理想解的相對接近程度為

(15)

2.3.6專利價值等級的劃分標準 按相對接近度的大小將專利價值進行10分制轉換,把最高的相對接近度定為10,對專利價值得分tj依次折算并取整:

(16)

在確定應用主題域得分后,將該得分按照專利價值劃分標準進行劃分,可以得到專利價值所屬區域.專利價值的劃分標準、等級評定及所屬區域如表3所示.

表3 專利價值等級劃分Tab.3 Delimitation of patent value grades

2.4 單元項的填充

專利預測模型中的單元項指處于相應技術關鍵詞、功效關鍵詞和DMC交叉點上的專利組合.單元項填充,就是對具有相應技術關鍵詞、功效關鍵詞和DMC坐標點上的專利組合數量進行的聚類統計.PTFM中單元項填充一般由技術關鍵詞和功效關鍵詞的共現矩陣確定,因此本文在沿用共現矩陣進行專利聚類的基礎上,通過先遴選共現矩陣再以DMC篩選的方式,填充專利預測模型中的單元項.基于MapReduce計算框架的單元項填充流程如圖2所示.

圖2 基于MapReduce計算框架的單元項填充流程Fig.2 Element item filling process based on MapReduce computing framework

2.5 專利預測模型的可視化

綜合以上分析,得到專利預測模型的技術維、功效維和價值維,分別按照x軸、y軸和z軸的順序置于三維坐標系中,同時結合專利預測模型的單元項,通過Origin 2019b軟件,可視化為三維的專利預測模型.

2.6 基于專利預測模型的技術機會挖掘步驟和標準

步驟1繪制專利預測地圖.專利組合是具有同一技術關鍵詞和同一功效關鍵詞的專利所組成的集合,某區域內專利組合越多,說明專利組合越密集.以專利組合的密集程度為專利預測地圖的x軸,以專利價值程度為專利預測地圖的y軸,繪制專利預測地圖.

步驟2挖掘優先級的技術機會.價值原則下的優先級技術機會挖掘標準為:在同一專利價值等級區域內比較各專利價值得分下的專利組合總數,專利組合總數最少的專利組合所代表的技術方向即為優先級技術機會.在一級、二級、三級專利價值區域中,分別選擇專利組合總數最少的專利組合所代表的方向為優先級的技術機會.

步驟3挖掘次級的技術機會.在價值原則下的次級挖掘標準如下:比較不同的專利價值等級區域中專利組合的總數,專利價值比較高的專利組合即為次級的技術機會.也就是說,對一級和二級專利價值區域、二級和三級專利價值區域內的專利組合分別進行兩兩比較,選擇專利組合總數相近但是專利價值更高的專利組合所代表的方向為次級技術機會.

步驟4對已挖掘出的技術機會排序并描述.遵循價值原則的技術機會研發順序,即根據專利價值的高低,首先對優先級的技術機會進行研發創新,再對次級的技術機會進行研發創新,最后對所有的技術機會進行描述.

3 專利預測模型的應用:以鈦領域為例

3.1 鈦領域的概況

鈦及鈦合金因其優良的超導性、形狀記憶性和生物相容性而被廣泛地應用于航空、航天、航海、兵器、石油、化工、冶金、電力、醫療、制藥、建筑、海洋工程、體育休閑等領域.它既是航空航天、艦船兵器、海洋工程等軍工高技術領域不可或缺的關鍵性結構材料,也是現代醫療、制藥、建筑、體育休閑等民用領域至關重要的拓展性新興材料.目前,鈦的應用量和鈦工業的發展水平已經成為衡量國家實力的重要標志之一.

3.2 鈦領域專利預測模型的技術維和功效維構建

3.2.1專利源數據獲取 專利有效期為20年,為更加全面展示鈦領域的專利技術創新點和發展方向,本文在DII數據庫按以下檢索策略進行檢索,如表4所示.

表4 構建技術維和功效維的專利檢索策略

3.2.2使用NLTK的源數據預處理 使用NLTK對專利摘要文本進行源數據預處理,并進行清洗.為使技術關鍵詞和功效關鍵詞抽取的更加準確,本文使用NLTK對鈦領域專利摘要文本進行分隔以及詞性標注.

3.2.3基于MapReduce的技術關鍵詞和功效關鍵詞抽取及詞頻統計 基于MapReduce計算框架對鈦領域專利預測模型的技術關鍵詞及詞頻進行抽取和計算.把技術關鍵詞抽取結果以 .xlsx 格式輸出,得到鈦領域專利技術關鍵詞.為集中體現鈦領域專利布局,也為使專利預測模型更直觀可見,本文統計出現頻率前25高的技術關鍵詞,如表5所示.

表5 技術關鍵詞的抽取及詞頻統計Tab.5 Extraction and word frequency statistics of technology keywords

同樣基于MapReduce計算框架對鈦領域專利的功效關鍵詞及詞頻進行抽取和統計.把抽取結果按 .xlsx 格式輸出,得到基于MapReduce計算框架的鈦領域功效關鍵詞的詞頻計算結果,本文統計前25個功效關鍵詞,如表6所示.

表6 功效關鍵詞的抽取及詞頻統計

3.3 鈦領域專利預測模型的價值維

3.3.1專利源數據獲取 為最大范圍地評價專利價值,本文進行源數據獲取時選定檢索期限為20年,使用的專利檢索策略與表4相同,在數據下載時,按“被引頻次”降序排列,下載 1 000 項最高被引專利.

3.3.2基于DMC的應用主題域確定 提取檢索結果,統計前25個高頻DMC,并將DMC轉化為應用主題域[41],如表7所示.

表7 前25個高頻DMC對應的應用主題域Tab.7 Subject areas from top 25 high frequency DMC

3.3.3指標打分及數據采集 清華大學機械工程學院、西安交通大學材料科學與工程學院、西北工業大學管理學院、西北工業大學材料學院、西安理工大學材料科學與工程學院的專家學者,寶雞工業技術創新有限公司、寶鈦集團、西北有色金屬研究院中層以上技術經理、產品經理、市場經理以及涉鈦知識產權律師為二級指標打分.針對鈦領域應用主題域專利價值情況,采用線下與線上相結合的發放問卷的方式,一共發放600份調查問卷,回收491份,有效問卷473份,問卷回收有效率達78.83%.

3.3.4二級指標權重的計算 根據2.3.2節中構建出的專利價值指標體系,以及式(8)和(9),計算可得各二級指標的熵值和權重,計算結果如表8所示.

表8 二級指標的熵值和權重Tab.8 Entropy and weights of secondary targets

3.3.5專利價值評估 根據式(15)計算各應用主題域的相對接近度Ei,同時對相對接近度進行10分制轉換并取整,得到各應用主題域專利價值的得分ti,并對其排序,如表9所示.

表9 應用主題域的相對接近度和專利價值得分

3.3.6專利價值等級確定 根據表3可以得到鈦領域應用主題域的專利價值等級,劃分結果如表10所示.

表10 鈦領域應用主題域的專利價值等級劃分

3.4 鈦領域專利預測模型的單元項填充

3.4.1專利源數據獲取 鈦領域的專利預測模型中單元項填充的專利檢索策略與表4相同.

3.4.2基于MapReduce計算框架的單元項填充 根據單元項填充流程,本文以技術關鍵詞和功效關鍵詞生成技術功效共現矩陣,采用MapReduce計算框架對技術功效共現矩陣進行降維處理,輸出包含相應技術特征詞和功效特征詞的專利文檔,并統計專利文檔的個數.此后,采用MapReduce計算框架,以25個DMC為基準對已篩選出的專利文檔再次篩選,得到的專利文檔即為目標文檔,其個數即為專利預測模型的單元項.

3.5 鈦領域專利預測模型的可視化

根據已確定出鈦領域的技術維、功效維、價值維以及單元項填充結果,以技術維為x軸,功效維為y軸,價值維為z軸,結合單元項填充結果建立空間直角坐標系搭建專利預測模型,并通過Origin 2019b軟件實現可視化.由于在x軸和y軸上使用全文字標注會導致三維專利預測模型不夠清晰,所以本文使用代號表示相應坐標文字,代號與坐標文字的一一對應關系如表5和6所示.鈦領域的專利預測模型如圖3所示.

圖3 鈦領域的專利預測模型Fig.3 Patent prediction model for titanium field

4 基于專利預測模型挖掘鈦領域的技術機會

根據技術機會的挖掘步驟,結合圖3,可對鈦領域的技術機會進行挖掘.

4.1 鈦領域的專利預測地圖

根據圖3,繪制鈦領域內的專利預測地圖,如圖4所示.

圖4 鈦領域的專利預測地圖Fig.4 Patent prediction map for titanium field

4.2 鈦領域的技術機會挖掘

4.2.1優先級的技術機會挖掘

(1) 一級專利價值等級區域中的技術機會.該區域中專利組合有896個,專利價值為10分的專利組合有433個,專利價值為8分的專利組合有164個,專利價值為7分的專利組合有299個.因此,在一級專利價值等級區域中,按照基于專利預測模型的技術機會挖掘步驟2,標準①進行挖掘,選擇專利價值得分8分中的專利組合為技術機會.

(2) 二級專利價值等級區域中的技術機會.該區域中專利組合有 2 451 個,專利價值為6分的專利組合有194個,專利價值為5分的專利組合有892個,專利價值為4分的專利組合有 1 365 個.因此,在二級專利價值等級區域中,按照基于專利預測模型的技術機會挖掘步驟2,選擇專利價值得分為6分的專利組合為技術機會.

(3) 三級專利價值等級區域中的技術機會.該區域中專利組合有 1 057 個,專利價值為3分的專利組合有157個,專利價值為2分的專利組合有370個,專利價值為1分的專利組合有530個.因此,在三級專利價值等級區域中,按照基于專利預測模型的技術機會挖掘步驟2,選擇專利價值得分為3分的專利組合為技術機會.

綜上,優先級的技術機會為得分是8分、6分以及3分的專利組合.

4.2.2次級的技術機會挖掘 比較不同專利價值得分區域,專利價值數量相近的專利組合為7分和2分的組合,以及10分和1分的組合.按照基于專利預測模型的技術機會挖掘步驟3,認為次級的技術機會為得分是7分和10分的專利組合.

4.2.3技術機會排序并描述 按照優先級和次級的技術機會的順序,對鈦領域內的技術機會進行描述,如表11所示.

由表11可知,根據專利預測模型,在鈦領域中共有5個技術機會,根據其優先級別給予研發順序的建議.其中①、②、③為優先級的技術機會,④和⑤為次級的技術機會.

表11 專利預測模型下鈦領域的技術機會Tab.11 Technology opportunities in titanium field under patent prediction model

事實上,把技術機會按照優先級和次級的順序進行了排列,可以更好地為資源有限型創新主體提供導航式的研發建議.這主要是因為創新主體大多受制于資金、人員等資源,對領域內的技術機會進行全覆蓋式的研發顯然不現實.因此幫助創新主體在力所能及的范圍內選擇適合的技術機會,展開導航式的技術研發,有助于提升其技術創新效率,提高技術創新成功率.同時由于技術機會是基于已有專利展開的,所以還能有效降低專利侵權的風險,保障創新型鈦領域自主知識產權主體的基本權益.

5 結語

本文以采用PLSA算法,基于MapReduce計算框架,以海量專利為樣本,構建三維的專利預測模型以實現對技術機會的挖掘,并以鈦領域為例進行了應用.該模型不僅能通過專利發現技術研發的熱點和空白點,同時突出了專利價值對技術前景的引導功能,使研發主體能更加清晰地掌握具有應用前景的技術,明確技術研發的目標,更迅速地定位技術研發過程中的重點和難點,幫助其提高技術研發的效率,有效節約了資源成本和時間成本,深化技術機會的內涵,輔助決策者制定更加明確的技術研發戰略.

本文也存在一定的局限性.在樣本選取上,未來還可以考慮其他形式的專利,如國防專利,以滿足國防技術創新需要.此外,在對專利預測模型的應用上,未來還可以考慮雙專利預測模型,即通過比較分析方法,比較先進主體和落后主體在同一領域內的專利預測模型,通過尋找二者的差異,為落后主體挖掘潛在的技術機會.

猜你喜歡
價值模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
踐行初心使命的價值取向
當代陜西(2019年18期)2019-10-17 01:48:58
價值3.6億元的隱私
華人時刊(2019年23期)2019-05-21 03:31:36
一粒米的價值
“給”的價值
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
一個相似模型的應用
主站蜘蛛池模板: 国产欧美日韩18| 国外欧美一区另类中文字幕| 国产熟睡乱子伦视频网站| 在线中文字幕网| 最新亚洲人成无码网站欣赏网 | 婷婷亚洲视频| 成人午夜网址| 一本大道香蕉高清久久| 国产成人av一区二区三区| 久久大香香蕉国产免费网站| 日韩区欧美区| 就去吻亚洲精品国产欧美| 欲色天天综合网| 911亚洲精品| 国产欧美视频在线| 国产精品hd在线播放| 免费无码网站| 欧美日本在线播放| 成年看免费观看视频拍拍| 777国产精品永久免费观看| 91 九色视频丝袜| 色悠久久综合| 精品视频免费在线| 在线精品欧美日韩| 在线精品亚洲国产| 国产午夜在线观看视频| 欧美亚洲国产精品久久蜜芽| 福利在线不卡| 免费人成在线观看成人片 | 亚洲综合在线网| 欧美一级黄色影院| 91福利片| 丁香六月激情婷婷| 最新日韩AV网址在线观看| 亚洲高清无码久久久| 2020国产在线视精品在| 欧美日韩专区| 亚洲精品国产首次亮相| 99精品热视频这里只有精品7| 伊人色天堂| 91在线激情在线观看| 国产国模一区二区三区四区| 欧美19综合中文字幕| 国产精品视频白浆免费视频| 亚洲欧美综合在线观看| 无码内射中文字幕岛国片| 中文字幕伦视频| 中国一级毛片免费观看| 在线观看无码a∨| 老司国产精品视频91| 欧美另类精品一区二区三区| 99re视频在线| 免费一级无码在线网站| 亚洲精品无码日韩国产不卡| 丰满人妻中出白浆| 欧美一区二区精品久久久| 在线国产三级| 久久精品国产999大香线焦| 91精品国产自产在线观看| 欧美日韩北条麻妃一区二区| 欧美国产日韩一区二区三区精品影视| 无码aⅴ精品一区二区三区| 在线免费看黄的网站| 欧美精品成人| 亚洲性网站| 成人在线综合| 不卡网亚洲无码| 精品夜恋影院亚洲欧洲| 98精品全国免费观看视频| 欧美中出一区二区| 日韩免费毛片视频| 为你提供最新久久精品久久综合| 中国一级特黄大片在线观看| 40岁成熟女人牲交片免费| 日韩天堂在线观看| 国产一级二级在线观看| 97久久超碰极品视觉盛宴| 婷婷六月综合网| 欧美怡红院视频一区二区三区| 爱色欧美亚洲综合图区| 夜色爽爽影院18禁妓女影院| 亚洲精品动漫|