張雪晨
(廣州產(chǎn)權(quán)交易所有限公司,廣東廣州 510010)
科技服務(wù)業(yè)是現(xiàn)代服務(wù)業(yè)的重要組成部分,2020 年科技部重點(diǎn)加大先進(jìn)計(jì)算、新型健康業(yè)、科技服務(wù)業(yè)等領(lǐng)域的支持[1],加大技術(shù)信息管理與研究對(duì)科技服務(wù)業(yè)具有前瞻意義。技術(shù)信息的重要載體是專利,衡量創(chuàng)新能力的重要指標(biāo)看專利。《2020中國區(qū)域創(chuàng)新能力評(píng)價(jià)報(bào)告》表明,北京、廣東、上海、江蘇的基礎(chǔ)研究經(jīng)費(fèi)占全國基礎(chǔ)研究投入的比例超過50%[2]。廣東專利申請(qǐng)量、授權(quán)量穩(wěn)居全國第一,2013 年至2019 年廣東專利申請(qǐng)量及授權(quán)量高速增長,專利申請(qǐng)量由26.4 萬件攀升至80.8 萬件,專利授權(quán)量則由17 萬件增長至52.7 萬件。兩項(xiàng)占比保持在17%~20%,顯著高于其他?。▍^(qū)、市)[3]。2019 年05 月,中國科學(xué)院深圳先進(jìn)技術(shù)研究院(以下簡稱“先研院”)為面向應(yīng)用的知識(shí)產(chǎn)權(quán)代理及綜合服務(wù)采購項(xiàng)目進(jìn)行公開招標(biāo),為提高委托主體科技成果轉(zhuǎn)化能力和知識(shí)產(chǎn)權(quán)運(yùn)營水平。本研究基于廣州產(chǎn)權(quán)交易所對(duì)先研院2007—2019 年的國內(nèi)公開發(fā)明專利,運(yùn)用維度方法提取客觀數(shù)據(jù)進(jìn)行篩選。
在國外,20 世紀(jì)80 年代美國CHI Research 公司已開始文獻(xiàn)計(jì)量學(xué)方法的研究[4],謝萍等[5]根據(jù)有限個(gè)評(píng)價(jià)對(duì)象與理想化目標(biāo)的接近程度提出TOPSIS 排序方法,Reitzig[6]提出從專利文獻(xiàn)的全文中采用概率回歸法分析了獨(dú)立權(quán)利請(qǐng)求數(shù)、現(xiàn)有技術(shù)描述字?jǐn)?shù)。Park 等[7]假設(shè)專利被引數(shù)量與專利的價(jià)值成正比并進(jìn)行了驗(yàn)證。Chiu 等[8]運(yùn)用層次分析法(AHP)計(jì)算各指標(biāo)的權(quán)重,并實(shí)際測(cè)量了具體專利的價(jià)值??梢姡瑖廨^早地將獨(dú)立權(quán)利請(qǐng)求數(shù)作為對(duì)象考察,并借助層次分析法測(cè)度專利價(jià)值。國內(nèi)學(xué)術(shù)界主要在指標(biāo)選取和相關(guān)體系構(gòu)建上形成一系列觀點(diǎn),楊武[9]以專利指標(biāo)作為研究主題,用專利申請(qǐng)量和專利授權(quán)量評(píng)價(jià)國內(nèi)高校專利情況,該類量化指標(biāo)從上世紀(jì)末至今仍在沿用。邵勇[10]提出投入指標(biāo)、產(chǎn)出指標(biāo)、運(yùn)營指標(biāo)、保護(hù)指標(biāo)和效益指標(biāo),并強(qiáng)調(diào)審查員引文重要性和指標(biāo)搭建上的科學(xué)性,但在細(xì)分指標(biāo)上人為判定因素居多,國家知識(shí)產(chǎn)權(quán)局知識(shí)產(chǎn)權(quán)發(fā)展研究中心和國家知識(shí)產(chǎn)權(quán)局專利局黃慶等[11]在專利數(shù)量、質(zhì)量、價(jià)值三個(gè)方面構(gòu)建了專利評(píng)價(jià)指標(biāo)體系,運(yùn)用加權(quán)評(píng)分方法得到綜合評(píng)價(jià)值,但其價(jià)值維度客觀統(tǒng)計(jì)值偏少,在專利評(píng)判上很難具有普適性。萬小麗等[12]建立了以技術(shù)、市場和權(quán)利三維度為主的專利價(jià)值評(píng)估指標(biāo)體系,并用層次分析法計(jì)算指標(biāo)的權(quán)重,李振亞等[13]援引Harhoff 等[14]于2003 年提出的技術(shù)創(chuàng)新度與獨(dú)立專利權(quán)要求數(shù)量相關(guān),但獨(dú)權(quán)作用并沒有引起國內(nèi)研究者的重視。王興旺[15]分析了專利審查員引文與專利發(fā)明人引文之間的差別及其對(duì)專利引文分析結(jié)果的影響,但是對(duì)發(fā)明人自引的分析并沒有涉及。原國家知識(shí)產(chǎn)權(quán)局專利管理司和中國技術(shù)交易所共同編寫了以法律、技術(shù)、經(jīng)濟(jì)價(jià)值度為核心維度的專利價(jià)值分析指標(biāo)體系[16],在業(yè)內(nèi)具有廣泛影響。肖冬梅[17]挖掘了申請(qǐng)人引文和審查員引文的區(qū)別特征,列舉了審查文件的類型,強(qiáng)調(diào)了審查引文的重要性,但在審查文件類型對(duì)專利價(jià)值方面沒有給出判定的優(yōu)先級(jí),田瑞強(qiáng)等[18]提供了一種基于專利數(shù)據(jù)的科技人才識(shí)別方法,從被引頻次、專利家族、保護(hù)范圍,先識(shí)別核心專利再定位發(fā)明人,其思路值得借鑒。張黎等[19]基于直覺模糊層次分析法的專利質(zhì)量模糊綜合評(píng)價(jià),相較于傳統(tǒng)層次分析,新方法更加客觀與精確,邱洪華等[20]基于權(quán)利要求數(shù)量、專利存活期及被引次數(shù)等分析,建立中美VOCs 治理技術(shù)專利質(zhì)量比較,同時(shí)用到了Innography 專利分析指標(biāo)的專利強(qiáng)度。以上研究結(jié)果涉及的客觀指標(biāo)多數(shù)采用被引次數(shù)、權(quán)利要求數(shù)量和發(fā)明人數(shù)量以及專利壽命等,在指標(biāo)選取上人為判定因素較多,部分體系的釋義中涉及含糊不清的描述詞,比如比較難于判定、較難規(guī)避,以及在技術(shù)價(jià)值度指標(biāo)含義中的比較依賴其他技術(shù)、非常先進(jìn)等[16],諸如此類難以量化的用詞來打分,一定程度上造成了評(píng)估結(jié)果的不確定性。
綜上所述,國外學(xué)者提出的被引數(shù)、PCT 專利數(shù)與專利族大小、權(quán)利要求數(shù)、IPC 分類數(shù)及專利壽命等基礎(chǔ)指標(biāo)長期影響著國內(nèi)學(xué)者的分析判斷。作為綜合性評(píng)價(jià)體系中的組成要素,基于專利壽命和權(quán)利要求數(shù)等指標(biāo)形成的分析結(jié)果與實(shí)際情況并不十分吻合,原有基礎(chǔ)數(shù)據(jù)形成的指標(biāo)體系已很難滿足現(xiàn)實(shí)需要,專利文本及對(duì)比文件的信息挖掘還很欠缺,測(cè)度指標(biāo)體系未見有更富邏輯、更深入和更全面的研究。主要問題表現(xiàn)在機(jī)構(gòu)間要素不統(tǒng)一、代表性數(shù)據(jù)不多、指標(biāo)成分長期變化、主觀判定因素較多,客觀的文本分析指標(biāo)提取較難等,這些情況導(dǎo)致體系架構(gòu)、分析方法再具科學(xué)性,其經(jīng)驗(yàn)、結(jié)論和數(shù)據(jù)均在后續(xù)研究中較難繼承和發(fā)展;另一方面,具有明確表征意義的指標(biāo)沒有被足夠重視,比如:專利自引數(shù)、獨(dú)立權(quán)利要求數(shù)量、專利文本的特征度及專利審查數(shù)據(jù)中影響新穎性判定的文件類別等;同時(shí),需要重視引入第三方工具實(shí)現(xiàn)專利分級(jí)與分類的判定,彌補(bǔ)客觀導(dǎo)出數(shù)據(jù)短缺的弊端。因此,在理順邏輯的前提下,需要重視知識(shí)產(chǎn)權(quán)在創(chuàng)造、運(yùn)用、保護(hù)和管理維度的客觀指標(biāo)挖掘,才能為服務(wù)維度提供可靠的數(shù)據(jù)資源。
本篇研究對(duì)客觀數(shù)據(jù)邏輯內(nèi)涵以及量化數(shù)據(jù)采集、分析和提取做出相關(guān)解釋,基于層次分析法并確定各項(xiàng)指標(biāo)的權(quán)重,建立分階評(píng)價(jià)指標(biāo)體系。
構(gòu)建專利分階評(píng)價(jià)初選體系是以發(fā)明專利文獻(xiàn)為主要依據(jù),目的是挖掘?qū)@麛?shù)據(jù)背后應(yīng)用研究領(lǐng)軍人才。首要工作是明確構(gòu)建基礎(chǔ)和概念,本研究通過客觀數(shù)據(jù)的提煉和科技管理相關(guān)分析方法的運(yùn)用,利用數(shù)據(jù)的采集、清洗、標(biāo)識(shí)、整理,通過分級(jí)篩選和聚類分析對(duì)數(shù)據(jù)進(jìn)行挖掘,遴選相關(guān)領(lǐng)域應(yīng)用研究的領(lǐng)軍人才。
2020 年9 月,廣東省政府出臺(tái)《關(guān)于培育發(fā)展戰(zhàn)略性支柱產(chǎn)業(yè)集群和戰(zhàn)略性新興產(chǎn)業(yè)集群的意見》,并逐一制定了20 個(gè)戰(zhàn)略性產(chǎn)業(yè)集群行動(dòng)計(jì)劃(2021—2025 年)[21]。本研究通過對(duì)專利權(quán)人、研究組織、競爭對(duì)手和專利保護(hù)四個(gè)維度的分級(jí)篩選,再通過技術(shù)應(yīng)用維度分類梳理,實(shí)現(xiàn)對(duì)應(yīng)用研究領(lǐng)域人才的挖掘,依據(jù)科研漸進(jìn)性和成果階段性特點(diǎn),通過人才集聚筑牢產(chǎn)業(yè)集群的根基。
1978 年,錢學(xué)森[22]在全國力學(xué)規(guī)劃會(huì)議上談到,以宇觀、宏觀、細(xì)觀、微觀來區(qū)分客觀世界的數(shù)量級(jí)水平。本研究通過專利大數(shù)據(jù)下客觀數(shù)據(jù)的提煉,總結(jié)構(gòu)建了分階初選體系的總計(jì)包含四個(gè)分級(jí)維度和一個(gè)分類維度,具體包括:專利權(quán)人創(chuàng)新階段、研究組織開發(fā)階段、市場競爭階段、專利保護(hù)階段以及技術(shù)應(yīng)用分類,其中分類維度可以參照國民經(jīng)濟(jì)分類、新興產(chǎn)業(yè)分類、DWPI 用途分類和IPC 等分類指標(biāo)(如圖1 所示)。

圖1 專利分階評(píng)價(jià)初選體系和應(yīng)用研究人才挖掘的構(gòu)建流程
1.2.1 體系指標(biāo)層級(jí)
把所要解決問題的不同側(cè)面進(jìn)行分類,將每個(gè)類別建立不同維度,維度再用指標(biāo)進(jìn)行解釋和測(cè)度。具體內(nèi)容見表1。

表1 專利分階評(píng)價(jià)初選體系構(gòu)建指標(biāo)體系
1.2.2 體系層級(jí)解釋
(1)自主創(chuàng)新階段。自主創(chuàng)新是實(shí)現(xiàn)我國創(chuàng)新驅(qū)動(dòng)發(fā)展的重要舉措,創(chuàng)新的根本在人才。自主創(chuàng)新其實(shí)質(zhì)就是自主技術(shù)創(chuàng)新。張?jiān)疲?3]對(duì)自主技術(shù)創(chuàng)新能力的重要因素及其相互間的作用程度進(jìn)行了分析,為提升戰(zhàn)略新興產(chǎn)業(yè)自主創(chuàng)新能力提供了對(duì)策和建議。隨著我國科技成果轉(zhuǎn)化法律法規(guī)的修訂和相關(guān)配套改革措施的出臺(tái),并通過條例和措施充分賦予單位管理科技成果自主權(quán)、建立盡職免責(zé)機(jī)制。自引可大致分為學(xué)科自引、機(jī)構(gòu)自引、期刊自引和作者自引等多種形式,本研究針對(duì)專利的自引,視其作為技術(shù)應(yīng)用創(chuàng)新的內(nèi)在重要體現(xiàn),自引數(shù)量的統(tǒng)計(jì)即將自身產(chǎn)出的前期知識(shí)資源在后續(xù)加以自我引用的客觀考察。對(duì)自身產(chǎn)出的前期專利的補(bǔ)充說明、延伸擴(kuò)展、修正引錯(cuò)[24];同時(shí),發(fā)明人主觀是否自愿做出同族布局的保護(hù)申請(qǐng),是作為自主創(chuàng)新廣度的明顯表現(xiàn)。
(2)研究開發(fā)階段??蒲薪M織是國家創(chuàng)新體系的重要組成部分,也是創(chuàng)新成果產(chǎn)出的重要源頭。研究開發(fā)離不開研究組織間的觀點(diǎn)借鑒和相互引用;這需要充分發(fā)揮知識(shí)產(chǎn)權(quán)激勵(lì)科技創(chuàng)新、保障成果權(quán)益、支撐治理體系的制度性作用,推動(dòng)科研組織高質(zhì)量發(fā)展。通過創(chuàng)新引領(lǐng)帶動(dòng)研究組織能力的提升促進(jìn)市場創(chuàng)新需求。該階段是研究組織的科研能力向現(xiàn)實(shí)生產(chǎn)力過渡中最為關(guān)鍵的一環(huán)。
(3)市場競爭階段。市場競爭力是以企業(yè)為主體的指標(biāo)。與企業(yè)相比高校與科研機(jī)構(gòu)的專利產(chǎn)出相對(duì)較少,參與市場競爭的專利作用較小。與市場追求盈利的環(huán)境相比,高??蒲袡C(jī)構(gòu)的原始創(chuàng)新不夠,解決重大問題能力不足[25];如果專利權(quán)人提交材料本身缺乏新穎性和創(chuàng)造性,那么專利代理師只能靠檢索借鑒、嗅探對(duì)比、挖掘擴(kuò)充獲得新的特征點(diǎn)來撰寫申請(qǐng)文件,而這些專利在審查環(huán)節(jié)雖然被通過,但是,由于缺乏原始創(chuàng)新,即便獲得授權(quán)也很難在真正意義上實(shí)現(xiàn)市場競爭的權(quán)利保護(hù);而有原始創(chuàng)新的專利雖然被審查員提出異議甚至駁回,但是通過答辯或者復(fù)審,專利也可能獲得授權(quán)。因此,經(jīng)過審查員引用、對(duì)比或復(fù)審、維權(quán)等獲得授權(quán)專利文件更值得關(guān)注,在專利審查對(duì)比過程中所標(biāo)注的影響文件新穎性、創(chuàng)造性的類別也應(yīng)該引起重視,可以考慮作為判定專利價(jià)值、市場競爭力和權(quán)利保護(hù)強(qiáng)度中的重要參考。
(4)專利保護(hù)階段。保護(hù)知識(shí)產(chǎn)權(quán)就是保護(hù)創(chuàng)新。人民法院確定專利權(quán)的保護(hù)范圍時(shí),獨(dú)立權(quán)利要求的前序部分、特征部分以及從屬權(quán)利要求的引用部分、限定部分記載的技術(shù)特征均有限定作用[26]。專利的信息也是專利權(quán)利的信息。其撰寫質(zhì)量決定科研團(tuán)隊(duì)成果保護(hù)的強(qiáng)弱,影響權(quán)利要求保護(hù)的穩(wěn)定,關(guān)系到市場競爭中訴求利益的多寡。對(duì)專利保護(hù)范圍的文本信息進(jìn)行深度挖掘與分析,通過聚類不僅可以得到相關(guān)技術(shù)領(lǐng)域內(nèi)關(guān)鍵術(shù)語的變化情況,還能發(fā)現(xiàn)相關(guān)技術(shù)領(lǐng)域的研究熱點(diǎn),提供技術(shù)競爭情報(bào)資源的同時(shí),又能提高科技成果轉(zhuǎn)化的效率、增強(qiáng)科技資源管理服務(wù)的效能。
(5)應(yīng)用研究階段。應(yīng)用研究的集聚就是人才的集聚。為響應(yīng)廣東省“10+10”產(chǎn)業(yè)集群發(fā)展[21],從專利的數(shù)據(jù)信息分維度、分層次、分階段梳理應(yīng)用研究領(lǐng)域人才團(tuán)隊(duì)的狀況,就要搭建起專利信息、人才數(shù)據(jù)與應(yīng)用研究之間的映射關(guān)系,推斷出應(yīng)用研究人才培養(yǎng)、引進(jìn)與儲(chǔ)備情況。做好專利、人才和研究的有效映射是技術(shù)轉(zhuǎn)移和情報(bào)分析工作中不可或缺的步驟。
專利信息既是關(guān)于專利保護(hù)客體的內(nèi)容信息,又是有關(guān)專利權(quán)利的信息,同時(shí)集技術(shù)信息、法律信息、經(jīng)濟(jì)信息、戰(zhàn)略信息、市場信息于一體,是一種數(shù)據(jù)量巨大、內(nèi)容廣博的重要信息資源。本研究運(yùn)用信息學(xué)、科研評(píng)價(jià)方法結(jié)合提取專利題錄數(shù)據(jù),形成四個(gè)分級(jí)維度和一個(gè)分類維度對(duì)應(yīng)用研究人才進(jìn)行挖掘。根據(jù)每個(gè)維度的所具備的客觀要素形成二級(jí)維度指標(biāo),設(shè)定二級(jí)維度的細(xì)分指標(biāo)共計(jì)7項(xiàng):指標(biāo)的選取側(cè)重專利權(quán)人的原始創(chuàng)新、保護(hù)意愿、自引用和被引用專利文獻(xiàn)數(shù)量、審查員的對(duì)比文件和獨(dú)立權(quán)利要求數(shù)量及其專利文本所獲取的特征數(shù),分類維度包括:國民經(jīng)濟(jì)分類、新興產(chǎn)業(yè)分類、DWPI 用途分類以及第三方數(shù)據(jù)庫的分類數(shù)據(jù)等。
2.1.1 客觀現(xiàn)實(shí)數(shù)據(jù)為基礎(chǔ)
專利登記信息具有一定的統(tǒng)一性和規(guī)范性,但處理原始專利文獻(xiàn)的數(shù)據(jù)量和信息量均比較龐大,必須用科學(xué)的方法進(jìn)行分級(jí)、分類、標(biāo)引、挖掘和整理,由此得到信息可以作為后續(xù)分析的有效依據(jù)。
2.1.2 行為動(dòng)機(jī)分析是依據(jù)
以專利發(fā)明人的行為動(dòng)機(jī)作為分析的起始步驟,能夠判定專利權(quán)人的主觀能動(dòng)性,專利的自引信息可以表現(xiàn)出成果的來源,同族數(shù)據(jù)則直接關(guān)系到專利成果的保護(hù)廣度,對(duì)相關(guān)領(lǐng)域的研究組織的分階數(shù)據(jù)進(jìn)行橫向?qū)Ρ?,在技術(shù)應(yīng)用維度形成具有參照性的數(shù)據(jù),為研究組織間協(xié)作提供依據(jù),為互補(bǔ)性研發(fā)提供參考。
2.2.1 專利權(quán)人
專利權(quán)人指標(biāo)主要包括2個(gè)二級(jí)客觀統(tǒng)計(jì)指標(biāo)。此指標(biāo)著重考察專利權(quán)人自引用的動(dòng)機(jī)和同族布局的意識(shí)。
(1)自引數(shù)。在20 世紀(jì)80 年代,學(xué)者王崇德就證實(shí)了自引是研究學(xué)科、期刊、科學(xué)論文作者、科學(xué)合作等問題的重要入口。從自引出發(fā),可以定量考察科學(xué)社會(huì)中的著述動(dòng)態(tài)和征兆,并以此來剖明一些科學(xué)社會(huì)的趨勢(shì)和規(guī)律[27];自引的行為機(jī)制中既包含知識(shí)基因片段的復(fù)制和重組,主要表現(xiàn)在發(fā)明人的自主技術(shù)創(chuàng)新和融合,也包含知識(shí)基因片段的舍棄和修改,主要來自專利審查過程中的判定或質(zhì)疑,它是知識(shí)個(gè)體引用自身產(chǎn)出的前期知識(shí)資源的行為。同時(shí),隨著對(duì)專利引文研究的不斷深入,自引與技術(shù)行為、技術(shù)特征之間的對(duì)應(yīng)關(guān)系逐漸明晰。因此,自引數(shù)據(jù)可以彰顯發(fā)明人對(duì)技術(shù)研究的深入度,對(duì)技術(shù)關(guān)注的持續(xù)度,以及技術(shù)研發(fā)路線的特征度。
(2)同族申請(qǐng)數(shù)。專利權(quán)人可以通過同族專利布局,拓展海外市場,規(guī)避出口貿(mào)易和技術(shù)侵權(quán)風(fēng)險(xiǎn)。同族專利(patent family)是指同一專利在多個(gè)不同的國家申請(qǐng)并獲準(zhǔn)的發(fā)明內(nèi)容基本相同的一組等同專利(equivalent patent)[28],依據(jù)巴黎公約中一項(xiàng)專利文獻(xiàn)與其優(yōu)先權(quán)的聯(lián)系,存在多種定義專利族的方式。由于專利申請(qǐng)可能會(huì)引用不同的優(yōu)先權(quán),因此,一項(xiàng)發(fā)明在不同國家申請(qǐng)會(huì)有不同,同時(shí)每個(gè)國家專利審查環(huán)節(jié)不同,導(dǎo)致專利權(quán)利要求及獲得的保護(hù)范圍也存在差異。即便如此,實(shí)證研究表明技術(shù)發(fā)展不同階段專利家族規(guī)模對(duì)專利價(jià)值的影響存在顯著差異[29]。通過對(duì)美、歐、中、日、韓、德等PCT 的人工改寫,本研究借助德文特?cái)?shù)據(jù)庫DWPI 分類字段,清理專利權(quán)人和發(fā)明人并添加文本信息;PatSnap 數(shù)據(jù)庫也將PCT 申請(qǐng)、分案以及接續(xù)案也作為同族歸集的基礎(chǔ),大多數(shù)專利數(shù)據(jù)庫都為采集同族申請(qǐng)數(shù)的題錄信息提供了下載的接口,這為該項(xiàng)數(shù)據(jù)的提取提供了便利。
2.2.2 研究組織
研究組織指標(biāo)主要從一個(gè)方面進(jìn)行客觀統(tǒng)計(jì),包括被引用數(shù)1 個(gè)二級(jí)指標(biāo)。該指標(biāo)可以理解為專利層面的知識(shí)繼承對(duì)象,并可有效串聯(lián)知識(shí)共享的群體。
專利引證存在兩個(gè)方向,即引用(citing)和被引用(cited)。如果一份專利多次被后繼專利引用,這就表明該專利技術(shù)在其領(lǐng)域的質(zhì)量比較高或者屬于比較基礎(chǔ)性的研究成果;同樣的,如果一份專利引用了這樣的專利,也可以說該專利是建立在比較高的基礎(chǔ)之上的[30]。知識(shí)的繼承很大程度依靠引用與借鑒,正確認(rèn)識(shí)創(chuàng)新和繼承的關(guān)系,有助于研究活動(dòng)的持續(xù)開展。專利引用關(guān)系就像技術(shù)與專利集合之間的紐帶。以目標(biāo)專利為起點(diǎn),一項(xiàng)專利技術(shù)如果被大量的專利技術(shù)引用,很大程度上說明該專利包含有重要的技術(shù)進(jìn)步或開創(chuàng)性。通過引文的相互關(guān)系能夠揭示科技研究過程中內(nèi)部的協(xié)作和外在的聯(lián)系,探索技術(shù)發(fā)展路線的規(guī)律,發(fā)現(xiàn)研究組織之間潛在的合作關(guān)系。專利引用量一定程度上反映某項(xiàng)技術(shù)的在相關(guān)領(lǐng)域的創(chuàng)新程度。因此,統(tǒng)計(jì)被引專利數(shù)量一直是領(lǐng)域內(nèi)數(shù)據(jù)分析的重要參考。
2.2.3 競爭對(duì)手
競爭對(duì)手指標(biāo)主要從專利的審查對(duì)比方面進(jìn)行客觀數(shù)據(jù)統(tǒng)計(jì),包括高相關(guān)度1 個(gè)二級(jí)指標(biāo)。本節(jié)提出的指標(biāo)要依靠專利審查員是否列舉過此類對(duì)比文件。同時(shí),又要輔以審查文件類別加以判定。
一篇專利文獻(xiàn)通常會(huì)引用其他文獻(xiàn)或現(xiàn)有技術(shù),可分為兩類,一類是申請(qǐng)人在說明書的背景技術(shù)部分提及的專利文獻(xiàn),另一類是專利審查員在評(píng)估專利是否具備專利性時(shí)使用的專利文獻(xiàn)[31]。專利的高相關(guān)文獻(xiàn)在審查過程主要由審查員主導(dǎo)收集形成。它屬于一種易于查看,不易批量導(dǎo)出和分析處理的結(jié)構(gòu)化信息。在此維度上所提取高相關(guān)數(shù)的過程,是在專利審查階段必須經(jīng)歷的關(guān)鍵步驟,決定著專利的權(quán)力要求數(shù)量和實(shí)際授權(quán)的保護(hù)范圍。審查員作為本領(lǐng)域的技術(shù)人員,在專利審查過程中需要從現(xiàn)有技術(shù)中盡可能檢索出與該專利申請(qǐng)相關(guān)的文件以及判斷新穎性的抵觸性文件,比較專利新穎性、創(chuàng)造性和實(shí)用性(以下簡稱“三性”),用作不授予專利權(quán)、限制專利保護(hù)范圍或者支持專利合法地位的根據(jù)。因此,審查員判定專利三性是形成專利的重要環(huán)節(jié)。也體現(xiàn)了高相關(guān)度這一指標(biāo)對(duì)專利分析挖掘的潛在價(jià)值,不同標(biāo)識(shí)的對(duì)比文件其相關(guān)性也各異,詳見表2 所示。

表2 不同技術(shù)相關(guān)性程度所對(duì)應(yīng)的參數(shù)符號(hào)與含義
2.2.4 專利保護(hù)
競爭對(duì)手指標(biāo)主要從兩個(gè)方面進(jìn)行客觀統(tǒng)計(jì),共包括特征度和獨(dú)權(quán)度2 個(gè)二級(jí)指標(biāo)。此指標(biāo)著重考察代理機(jī)構(gòu)對(duì)專利特征度上位提取的意識(shí)和獨(dú)立權(quán)利要求濃縮提煉的能力。
(1)特征度。正如我國《專利法》第二條第三款所述的技術(shù)方案,是指對(duì)要解決的技術(shù)問題所采取的利用了自然規(guī)律的技術(shù)手段的集合。技術(shù)手段通常是由技術(shù)特征來體現(xiàn)的[32]。特征在語義構(gòu)造和設(shè)計(jì)中是指屬不同詞類的詞的特殊點(diǎn),早在上世紀(jì)90 年代姚天順教授和張?jiān)陆芫驮岢鰸h語文本自動(dòng)分類模型,基于特征相關(guān)性的分類算法為核心。其自動(dòng)分類算法是以規(guī)范化特征向量的構(gòu)造、n重加權(quán)處理及相關(guān)性評(píng)價(jià)為基礎(chǔ),在實(shí)現(xiàn)過程中,可將輸入分類文本轉(zhuǎn)換為多維特征向量,進(jìn)行各項(xiàng)處理,為之后的相關(guān)性評(píng)價(jià)做準(zhǔn)備[33]。在已有的研究成果中,針對(duì)專利文本的特征提取方法有很多,如:基于特征頻度,文本頻度,特征熵,互信息,信息增益,Chi-square,相關(guān)系數(shù)等[34]。在專利分析工具層面,索意互動(dòng)提出了一種文獻(xiàn)價(jià)值獲取方法,通過檢索結(jié)果數(shù)據(jù)集利用引用邏輯或者被引用邏輯獲取目標(biāo)文獻(xiàn),利用在前和在后公開的文獻(xiàn)與目標(biāo)文獻(xiàn)之間的相關(guān)度能夠客觀地計(jì)算出目標(biāo)文獻(xiàn)的價(jià)值[35]。因此,如果專利的區(qū)別特征較多,那么專利保護(hù)范圍將相對(duì)較窄。專利代理師理應(yīng)提煉出相對(duì)較少的特征度,確保能夠撰寫出對(duì)發(fā)明點(diǎn)保護(hù)范圍最大的權(quán)利要求。獲得保護(hù)強(qiáng)度高和不可規(guī)避性強(qiáng)的權(quán)利保護(hù),提高專利的撰寫質(zhì)量[36]。由此可見,特征度的提煉體現(xiàn)了專利撰寫的現(xiàn)實(shí)要求。
(2)獨(dú)權(quán)度。獨(dú)立權(quán)利要求數(shù)量能夠體現(xiàn)專利代理師挖掘?qū)@卣鞯乃胶湍芰?。如果說明書是發(fā)明人定義其發(fā)明的技術(shù)詞典,是權(quán)利要求之母[37]。那么獨(dú)立權(quán)利要求就是權(quán)利要求之首。獨(dú)立權(quán)利要求是對(duì)說明書內(nèi)容的高度概括,也是對(duì)每個(gè)重要的從屬權(quán)利要求的關(guān)鍵核心點(diǎn)的提煉;同時(shí),說明書又是敘述發(fā)明技術(shù)方案實(shí)質(zhì)的載體。其與權(quán)利要求的關(guān)系又受復(fù)雜法律規(guī)則的制約。這些因素均決定了確定專利保護(hù)范圍的難度[38]。采用從技術(shù)問題出發(fā),挖掘必要技術(shù)特征的思維模式,能夠從說明書內(nèi)容中提取較多項(xiàng)的獨(dú)立權(quán)利要求的能力,能客觀地反映出專利代理師能力和水平,也同時(shí)決定著專利的保護(hù)強(qiáng)度。
2.2.5 應(yīng)用分類
應(yīng)用分類指標(biāo)主要從分類數(shù)方面進(jìn)行客觀數(shù)據(jù)統(tǒng)計(jì),此維度不同于以專利IPC 分類號(hào)為基礎(chǔ)的傳統(tǒng)的分析方式,本步驟需要結(jié)合前期的分級(jí)數(shù)據(jù)為條件,根據(jù)相關(guān)系數(shù),進(jìn)行統(tǒng)計(jì)和價(jià)制度測(cè)算,通過前面提到的四個(gè)分級(jí)維度,篩選得出專利相應(yīng)分類維度下具體特征和內(nèi)在聯(lián)系,從而挖掘出一批具有研發(fā)共性的專利組合以及背后的發(fā)明團(tuán)隊(duì)。
相比國外學(xué)者Lerner[39]認(rèn)為專利的IPC 號(hào)數(shù)量越多,說明專利的創(chuàng)新程度越高,則專利越有價(jià)值;胡成等[40]提出專利的IPC 號(hào)數(shù)量可以反映其技術(shù)領(lǐng)域覆蓋范圍,覆蓋范圍越廣,則該專利的市場應(yīng)用范圍越大;業(yè)內(nèi)的美國Dialog 公司于2009 年推出知識(shí)產(chǎn)權(quán)信息分析平臺(tái)Innography,該專利分析系統(tǒng)的文本聚類系統(tǒng)功能為專利的文本聚類可視化,而德溫特分類體系從應(yīng)用性角度編制,已采用了Innography 中為文本聚類提供支持所使用的相同技術(shù)。新技術(shù)允許更多的交互式功能,如旭日?qǐng)D和多個(gè)聚類分段的選擇。德溫特分類體系的這些做法將所有的技術(shù)領(lǐng)域分為3 個(gè)大類:化學(xué)(Chemical)、工程(Engineering)、電子電氣(electronic and electrical);大類之下又分為部(Section),共計(jì)33 個(gè)部,其中A-M歸屬于化學(xué)大類,P1-Q7 歸屬于工程大類,S-X 歸屬于電子電氣大類;部又進(jìn)一步分為小類(Classes),共計(jì)288 個(gè)小類[41]。整體結(jié)構(gòu)延續(xù)至今,當(dāng)今科研領(lǐng)域的交叉滲透性研究已經(jīng)成為科研取得重要進(jìn)展的必要條件。通過分類技術(shù)尋找應(yīng)用研究的特征度,將同類型的研發(fā)路線重組和歸并,形成領(lǐng)域共性的集聚,從而實(shí)現(xiàn)對(duì)相關(guān)技術(shù)領(lǐng)域內(nèi)企業(yè)的技術(shù)賦能。
完成專利分階評(píng)價(jià)初選體系模型的構(gòu)建后,需要對(duì)各級(jí)指標(biāo)確定指標(biāo)權(quán)重。其重要程度通過設(shè)置指標(biāo)權(quán)重的多少來反映。再對(duì)指標(biāo)模型附以指標(biāo)權(quán)重即構(gòu)成專利分階評(píng)價(jià)初選體系,該體系能夠直觀地反映出各個(gè)評(píng)價(jià)指標(biāo)的數(shù)據(jù)特征。
層次分析法(Analytic Hierarchy Process,AHP)是美國學(xué)者托馬斯·塞蒂于20 世紀(jì)70 年代提出的一種多目標(biāo)評(píng)價(jià)決策方法。而與其相近的網(wǎng)絡(luò)層次分析法(analytic hierarchy process,ANP)是塞蒂于20 世紀(jì)90 年代提出的一種適用于復(fù)雜結(jié)構(gòu)的決策方法。層次分析法構(gòu)建的是遞階式層次結(jié)構(gòu),而網(wǎng)絡(luò)分析法構(gòu)建的是既存在遞階式層次又存在內(nèi)部循環(huán)和相互支配的網(wǎng)絡(luò)結(jié)構(gòu)[42]。本文采用層次分析法(AHP)對(duì)指標(biāo)進(jìn)行權(quán)重的確定。其基本思想是首先把一個(gè)復(fù)雜問題分解為不同的組成因素,然后就不同維度的因素通過與最低層次進(jìn)行兩兩對(duì)比,從而得出各因素之間相對(duì)重要程度,相對(duì)于上層指標(biāo)來說,需要判斷其下層各元素對(duì)其直接的影響程度,最后通過矩陣運(yùn)算得到權(quán)重。
四維分階初選總值=a1×專利權(quán)人+a2×研發(fā)組織+a3×競爭對(duì)手+a4×專利保護(hù)其中,a1、a2、a3、a4為權(quán)重,且a1+a2+a3+a4=1。
指標(biāo)權(quán)重確定過程:
第一步:采用層次分析法確定上述權(quán)重a1、a2、a3、a4,通過6 個(gè)數(shù)值描述指標(biāo)間的相互重要程度,如表3 所示。

表3 指標(biāo)標(biāo)度
第二步:制定判斷矩陣,各指標(biāo)之間進(jìn)行兩兩對(duì)比,按照1-9 份評(píng)價(jià)指標(biāo)間的相對(duì)重要程度,如表4 所示。

表4 指標(biāo)判斷矩陣
第三步:按照層次分析法的規(guī)則,對(duì)角線的數(shù)值為1(自己與自己比較),以aij表示第i個(gè)指標(biāo)與第j個(gè)指標(biāo)的對(duì)比(i行、j列),那么aij×aji=1。
以方根法計(jì)算權(quán)重,如表3 所示。

表5 指標(biāo)權(quán)重測(cè)算
第四步:將指標(biāo)權(quán)重代入模型中,得到:專利分階評(píng)價(jià)初選總值=0.392 5×專利權(quán)人+0.149 1×研發(fā)組織+0.298 2×競爭對(duì)手+0.160 2×專利保護(hù),得出公開發(fā)明的分級(jí)數(shù)據(jù)。
第五步:因?yàn)槊考@赡軇潥w到不同產(chǎn)業(yè),按照產(chǎn)業(yè)分類的數(shù)據(jù)總量大于所分析的專利總量。根據(jù)新興產(chǎn)業(yè)分類和國民經(jīng)濟(jì)分類,得出2007 年至2019 年先研院排名前8 的相關(guān)產(chǎn)業(yè)統(tǒng)計(jì)如表6 和表7 所示。

表6 2007—2019 年先研院發(fā)明專利的新興產(chǎn)業(yè)分類統(tǒng)計(jì)

表6(續(xù))

表7 2007—2019 年先研院發(fā)明專利的國民經(jīng)濟(jì)分類統(tǒng)計(jì)

表7(續(xù))
通過前四步分階篩選數(shù)據(jù),依照第五步專利所屬產(chǎn)業(yè)進(jìn)行分類統(tǒng)計(jì),以生物醫(yī)藥、新材料和智能消費(fèi)設(shè)備制造領(lǐng)域進(jìn)行實(shí)證分析。
通過知網(wǎng)的文獻(xiàn)被引和下載量找出人才,可以通過被引專利的多少發(fā)現(xiàn)人才,在知網(wǎng)檢索先研院數(shù)據(jù)中,對(duì)高被引文獻(xiàn)進(jìn)行排序,可以得出人才及技術(shù)領(lǐng)域,結(jié)果如表8 所示,所有高被引的論文文獻(xiàn)中,全部基于人工智能領(lǐng)域的研究,可見,從單一的被引用維度查詢到的結(jié)果具有局限性。

表8 對(duì)論文進(jìn)行被引數(shù)統(tǒng)計(jì)得到的人才信息
運(yùn)用同樣的方法再對(duì)先研院2007—2019 年的國內(nèi)公開發(fā)明專利,同樣從單一的施引記錄數(shù)來統(tǒng)計(jì),結(jié)果如表9 所示,先研院入選前十名數(shù)據(jù)中高被引專利全部集中在人工智能技術(shù)領(lǐng)域。并且從原始分析數(shù)據(jù)中,均存在影響其新穎性的對(duì)比文件,盡管通過被引數(shù)維度可以獲得相關(guān)的專利排名,但是結(jié)果顯示該批專利同族布局較少、獨(dú)權(quán)度較低,特征度較高意味著專利保護(hù)范圍較小,其中自引數(shù)較低。

表9 對(duì)施引數(shù)進(jìn)行排序統(tǒng)計(jì)得到的人才信息
再從專利的第一發(fā)明人或者發(fā)明人等單一維度也可以識(shí)別相應(yīng)的人才,結(jié)果如表10 所示。從論文引用數(shù)據(jù)和專利引用數(shù)據(jù)以及簡單通過專利的數(shù)量進(jìn)行統(tǒng)計(jì),可以發(fā)現(xiàn)不同的學(xué)術(shù)帶頭人在不同列表中的出現(xiàn)幾率或出現(xiàn)的次序存在較大差異。技術(shù)領(lǐng)域不同人才的挖掘手段也不同,查詢到的結(jié)果也不盡一致。

表10 排名前十位的第一發(fā)明人及發(fā)明數(shù)量統(tǒng)計(jì)
本研究通過德溫特的DI 數(shù)據(jù)庫、PatSnap 數(shù)據(jù)庫、索意互動(dòng)(北京)信息技術(shù)有限公司開發(fā)的Patentics 系統(tǒng)和ISPatent 數(shù)據(jù)庫,借助Orbit 數(shù)據(jù)庫和律商聯(lián)訊數(shù)據(jù)庫中專利審查員的參考引文數(shù)據(jù)進(jìn)行對(duì)比,對(duì)影響專利新穎性判定的類別進(jìn)行標(biāo)引,比較專利被其他發(fā)明專利或者相關(guān)文獻(xiàn)引用數(shù)據(jù)。因此,本文整理2007 年至2019 年先研院近六千項(xiàng)已公開發(fā)明專利數(shù)據(jù),以專利審查員引文加發(fā)明人引文、被引文數(shù)據(jù)。通過德溫特DI 以及DDA 工具獲得DPCI 被引用數(shù)據(jù)進(jìn)行分析判斷。由索意互動(dòng)Patentic 工具對(duì)專利文本特征值和獨(dú)立權(quán)利要求數(shù)進(jìn)行提取,最后按照國民經(jīng)濟(jì)分類、新興產(chǎn)業(yè)分類以及德溫特分類代碼(DC)聚類對(duì)相關(guān)專利的用途進(jìn)行分類,得出先研院排名靠前的專利組合,最終獲得“雙十”戰(zhàn)略性產(chǎn)業(yè)集群中應(yīng)用研究相關(guān)部分專利組合。獲得先研院發(fā)明團(tuán)隊(duì)的相關(guān)研究方向,定位得出生物醫(yī)藥與健康應(yīng)用研究領(lǐng)域人才,如表11 所示。

表11 生物醫(yī)藥與健康應(yīng)用研究領(lǐng)軍人才專利信息
智能機(jī)器人應(yīng)用研究結(jié)果如表12 所示。

表12 智能機(jī)器人應(yīng)用研究領(lǐng)軍人才專利信息
前沿新材料應(yīng)用研究人才結(jié)果如表13 所示。

表13 前沿新材料應(yīng)用研究領(lǐng)軍人才專利信息
從上述數(shù)據(jù)總結(jié)得出,論文引文數(shù)據(jù)主要反應(yīng)撰寫人的學(xué)術(shù)影響力,專利總量主要體現(xiàn)發(fā)明人參與項(xiàng)目的多少,第一發(fā)明人的數(shù)據(jù)能夠揭示學(xué)術(shù)帶頭人對(duì)研究成果付出的程度,但是,發(fā)明專利量的多少并不能準(zhǔn)確反應(yīng)發(fā)明專利質(zhì)的高低,定量的統(tǒng)計(jì)要結(jié)合定性的分析作出總結(jié)和判斷。本研究帶來的管理啟示意義在于,能夠通過自引數(shù)據(jù)表征應(yīng)用研究者的專注程度,找出被引數(shù)據(jù)存在技術(shù)啟示專利,挖掘?qū)@澈筘暙I(xiàn)率較高的發(fā)明人,篩選出在撰寫和布局有保護(hù)意識(shí)的專利組合。經(jīng)與先研院溝通,分階初選的方法所得到的數(shù)據(jù)與院方開展的應(yīng)用研究實(shí)際情況相吻合,印證了數(shù)據(jù)的篩選與實(shí)際領(lǐng)軍人才發(fā)展情況相接近;同時(shí)也挖掘出前期對(duì)先研院作出較多付出的應(yīng)用研究人才(如:朱定局、黃惠等),反映出研發(fā)過程中的價(jià)值產(chǎn)出,由此也引起后續(xù)的人才流動(dòng)。由此,可以得出分階初選較好地解決了知識(shí)產(chǎn)權(quán)定性定量相結(jié)合的研究手段,以客觀信息為判定理由,向科技管理研究者提供參考,為知識(shí)產(chǎn)權(quán)量變到質(zhì)變提供數(shù)據(jù)服務(wù)和支撐。
2020 年科技部、國家知識(shí)產(chǎn)權(quán)局、教育部三部門多措并舉以專利為突破口,促進(jìn)科技成果轉(zhuǎn)化,強(qiáng)化人才隊(duì)伍建設(shè),建立知識(shí)產(chǎn)權(quán)全流程管理。科技部對(duì)科技活動(dòng)在選題、研發(fā)、評(píng)估等環(huán)節(jié)提出明確的知識(shí)產(chǎn)權(quán)要求,建立科研活動(dòng)知識(shí)產(chǎn)權(quán)清單制度,中國科學(xué)院也在探索實(shí)施專利集中管理運(yùn)營,圍繞重要行業(yè)需求培育高價(jià)值專利群,本文主要從知識(shí)產(chǎn)權(quán)創(chuàng)造、運(yùn)用、保護(hù)、管理和服務(wù)全鏈條上的相關(guān)特征指標(biāo)入手,建立了一種基于層次分析法的專利分階評(píng)價(jià)方法,以四個(gè)分級(jí)維度和一個(gè)分類維度,將分級(jí)指標(biāo)進(jìn)行分類量化,令人才資源在國民經(jīng)濟(jì)分類、新興產(chǎn)業(yè)分類及用途分類上進(jìn)行呈現(xiàn)。相較于此前的洛特卡、h 指數(shù)和技術(shù)前沿識(shí)別等[34],雖然也屬于先核心專利再找相應(yīng)人才做法,但其主要集中在引文數(shù)據(jù)的直觀判斷,以及通過IPC 分類號(hào)直接確認(rèn)核心技術(shù),從專利文獻(xiàn)著者角度確定核心專利發(fā)明人,從而認(rèn)為本領(lǐng)域的資深學(xué)者就是核心專利的考察對(duì)象。然而,本研究模型所涉及的人才識(shí)別方法不僅將分級(jí)與分類相結(jié)合,定性分析和定量分析相結(jié)合,使基于發(fā)明專利的分階評(píng)價(jià)指標(biāo)體系在量化篩選、分級(jí)呈現(xiàn)、分階評(píng)價(jià)上具有客觀性、邏輯性和普適性。此分階模型可以服務(wù)于專利體量較大的國內(nèi)外高校、研究所和企業(yè)。另外,不同數(shù)據(jù)庫對(duì)專利申請(qǐng)的年度統(tǒng)計(jì)信息不盡一致,在此情形下只能略去不確定的專利,這為篩選結(jié)果帶來一定影響。并且分階初選的指標(biāo)梳理與評(píng)價(jià)結(jié)論尚未做到廣泛研討,后續(xù)分階評(píng)估模型將提高其精準(zhǔn)性和實(shí)效性,進(jìn)行理論擴(kuò)充與合作應(yīng)用,在實(shí)踐中驗(yàn)證數(shù)據(jù)價(jià)值。同時(shí),為健全重大項(xiàng)目知識(shí)產(chǎn)權(quán)管理流程,加大高質(zhì)量專利轉(zhuǎn)化應(yīng)用績效的評(píng)價(jià)權(quán)重提供參考,將專利量化篩選、專利分級(jí)、分類分析和應(yīng)用領(lǐng)域人才挖掘串接成鏈,用數(shù)據(jù)形式匯聚應(yīng)用研究領(lǐng)域高端人才,促進(jìn)基于專利文獻(xiàn)的科技管理水平提高,服務(wù)相關(guān)戰(zhàn)略產(chǎn)業(yè)集群穩(wěn)步發(fā)展。