邱均平,徐恒梅,b (杭州電子科技大學.中國科教評價研究院,b.管理學院)
2018 年,邱均平教授主持的國家社科基金 “我國‘五計學’融合與圖書情報學方法創新研究” 立項,表明 “五計學” 得到了專家和學術界的認可與接受。[1]“五計學” 即文獻計量學(Bibliometrics)、科學計量學(Scientometrics)、信息計量學(Informetrics)、 網 絡 計 量 學(Webometrics)、 知 識 計 量 學(Knowmetrics) 五大學科體系,“五計學” 的方法論意義在于可以為人文社會科學的方法創新提供方法來源和借鑒。[2]知識產權是人文社會科學的一大學科,“五計學” 對其方法創新有著一定的影響。
知識經濟時代已經到來,知識產權對一個國家的經濟發展和企業競爭力具有重要影響,其方法論研究顯得尤為緊要。本文通過數據分析軟件對 “五計學” 和 “知識產權” 交集文獻進行文獻計量統計分析,對高頻關鍵詞分別進行分析,深入挖掘我國“五計學” 對知識產權方法的應用與借鑒情況,希望能為知識產權方法論的研究提供一定的參考。
為保證查全率與查準率,筆者在檢索前進行了兩項預處理工作。①知識產權包含工業產權(商標權、專利權等) 和版權(著作權),[3]因此,本文將與知識產權相關度高的其他學科的專業詞匯歸并為 “知識產權” 一詞進行檢索。② 由于直接使用 “五計學” 這一說法的相關文獻不多,本文以具體的五個學科來代表 “五計學” 進行檢索。
本文的數據來源于CNKI 數據庫,檢索時間為2020 年5 月10 日,①以 “主題=‘文獻計量學’and‘知識產權’or‘版權’or‘著作權’or‘專利權’or‘商標權’” 進行檢索,共獲得87 條數據記錄;②以“主題=‘科學計量學’and‘知識產權’or‘版權’or‘著作權’or‘專利權’or‘商標權’” 進行檢索,共獲得18 條數據記錄;③以 “主題=‘信息計量學’and‘知識產權’or‘版權’or‘著作權’or‘專利權’or‘商標權’” 進行檢索,共獲得4 條數據記錄;④ 以“主題=‘網絡計量學’and‘知識產權’or‘版權’or‘著作權’or‘專利權’or‘商標權’” 進行檢索,共獲得1 條數據記錄;⑤ 以 “主題=‘知識計量學’ and‘知識產權’or‘版權’or‘著作權’or‘專利權’ or‘商標權’” 進行檢索,共獲得3 條數據記錄。由于初步檢索的數據存在著相關性低以及重復的情況,需要進一步對數據進行篩選、去重,從而獲取有效數據(見表1)。

表1 有效數據結果統計
本文首先采用文獻計量學的趨勢分析法與共詞分析法對 “五計學”“知識產權” 交集文獻進行統計分析,得到交集文獻相關性低的高頻關鍵詞。其次,利用社會網絡分析對高頻關鍵詞進行可視化分析,得到高頻關鍵詞中與 “五計學”“知識產權” 聯結較多的高頻關鍵詞。最后,通過檢索這些聯結較多的高頻關鍵詞得到相關文獻,利用內容分析法進行具體分析,最終得出結論。
2.1.1 總體趨勢分析
本文利用CNKI 的可視化功能對76 篇有效數據進行可視化分析,得到其總體趨勢圖(見圖1)。

圖1 總體趨勢分析
由圖1 可知, 所選文獻的發表時間分布于2003-2020 年,參考文獻最早可追溯到1978 年,引證文獻從2011 年起呈快速上升趨勢,由此可見我國“五計學” 對知識產權方法的借鑒與應用不斷增長,說明該領域的研究的影響正在逐步擴大。所選文獻在2015 年達到峰值,此后每年都保持一定的數量,說明學者們對該領域研究呈穩定、理性的狀態。
2.1.2 共詞分析
關鍵詞在文章中能高度概括、凝練主題概念,體現文獻的核心與精髓,揭示研究的價值與方向。[4-5]76 篇有效數據樣本涉及到的關鍵詞共310 個。在統計高頻關鍵詞時,筆者發現由于本文樣本不多且是原始數據,導致關鍵詞頻率普遍較低,不利于開展后續研究。因此,筆者將關鍵詞進行分類、編號后共得到117 類,關鍵詞(部分) 歸并情況見表2。

表2 關鍵詞歸并情況(部分)
在區分高頻詞與低頻詞時,如果根據 Do-nohue的高頻詞與低頻詞界分公式[6]進行區分,那么在本文的數據樣本中可以統計的關鍵詞很少,無法進行后續研究。因此,筆者沒有局限于該公式,選擇將頻次≥3 的關鍵詞作為高頻關鍵詞,統計結果見表3。

表3 高頻關鍵詞(頻次≥3)
由表3 可知,最高頻次關鍵詞 “專利計量” 的頻次為29 次,可推斷 “專利計量” 是我國 “五計學” 對知識產權方法借鑒與應用的重點。頻次≥3 的高頻詞共出現了188 次,占全部關鍵詞的60.65%,基本能夠說明這些關鍵詞是我國 “五計學” 在知識產權借鑒與應用方面的熱點。但是,關鍵詞中有不少是無意義的,如 “研究進展”“重大項目”“發展對策”“影響因素”“原因”“技術”“高校”“指標” 等,因此需要將其刪除。作者將高頻關鍵詞整理后得到與本文主題相關的14 個高頻關鍵詞,生成了一個14×14 的高頻關鍵詞共詞矩陣(見表4)。

表4 高頻詞共詞矩陣(部分)
為了更好地體現高頻關鍵詞之間的內部聯系,揭示其關系的緊密性,筆者使用Ochiai 系數公式將表4的共詞矩陣轉化為一個14×14 的相似矩陣(見表5)。在相似矩陣中,對角線數值均為1,所有數值的取值范圍在0-1 之間,該數值反映的是高頻關鍵詞之間的緊密程度。數值越接近1,說明這兩個高頻關鍵詞之間的關系越緊密。由表5 可知,只有C026 (圖書情報學)與C019 (知識圖譜) 的交叉值大于0.5,說明其關系相對緊密,而其他關鍵詞之間的交叉值均低于0.5,說明它們之間的關系都不緊密,不能相互替代。

表5 高頻詞相似矩陣(部分)
為了更好地體現高頻關鍵詞之間的關系,筆者擬將相似矩陣轉化為相異矩陣,并利用SPSS 軟件對這些詞進行聚類分析。但由于本文高頻關鍵詞相似矩陣的數據較少,難以得出明顯結論,因而筆者未再進行聚類分析。
2.1.3 社會網絡分析
基于共詞分析,本文引入社會網絡分析方法,將表5 的相似矩陣導入Ucinet,利用NetDraw 對高頻關鍵詞共詞矩陣進行可視化處理,得到高頻關鍵詞網絡(見圖2)。

圖2 高頻關鍵詞網絡
由圖2 可見,C040 (專利計量)、C001 (文獻計量學)、C031 (社會網絡分析)、C019 (共詞分析)、C020 (引文分析)、C018 (合作分析) 等點與各點所產生的聯結較多,與之前的高頻關鍵詞統計結果基本吻合,說明我國 “五計學” 與知識產權的相關研究主要集中于以上幾個高頻關鍵詞。
由上文的統計分析結果可知,專利計量、文獻計量學、社會網絡分析、共詞分析、引文分析、合作分析等 “五計學” 的相關方法在知識產權領域是研究的重點和熱點。基于此,筆者將從這六個聯結較多的高頻關鍵詞出發,分析我國 “五計學” 對知識產權方法的借鑒與應用情況。由于本文樣本文獻不多,筆者將再次基于CNKI 數據庫,以 “主題=‘各高頻關鍵詞’ and‘知識產權’or‘版權’or‘著作權’or‘專利權’ or‘商標權’” 為檢索式,找出各高頻關鍵詞在知識產權領域應用的相關文獻進行分析。
2.2.1 借鑒與應用——專利計量
通過對我國 “五計學” 方法下知識產權相關文獻的計量分析,初步可以看出 “專利計量” 已成為其研究的重點。專利計量通過對專利文獻進行篩選、鑒定和整理,利用文獻計量學方法對其所含各種專利信息要素進行統計、排序、對比、分析等相關研究,深入挖掘專利文獻的動態特征,了解技術、經濟發展的歷史及現狀,從而對該領域進行技術評價和技術預測。[7]
作為知識產權領域的常用方法之一,專利計量主要應用于以下幾個方面。① 某些具體領域的技術創新、技術發展態勢,以期獲得該領域的技術熱點及發展趨勢。如,鞏玥等對德溫特專利數據庫中的庫存專利進行計量分析,研究全球汞污染治理技術的發展現狀及趨勢;[8]李維波等基于Innography 專利分析數據庫分析與頁巖氣技術相關的專利數據,為頁巖氣產業發展提供參考。[9]②與其他方法共同使用,全面分析該領域的現狀、熱點及趨勢。如,馮思穎等以德溫特專利數據庫為數據源,利用專利計量和社會網絡分析相結合的方法,對云計算領域專利進行詳細分析。[10]通過對相關文獻的統計、整理,筆者發現專利計量常與知識圖譜、社會網絡分析、共引分析、共詞分析、可視化等方法結合來研究某領域專利技術的熱點和趨勢。
同時,筆者發現與專利計量密切相關的一詞——專利地圖,專利地圖的一大優勢在于集中展示專利分析的量化成果,能夠為決策者提供決策依據。[11]需要補充的是,再次對 “專利計量學” 這一主題詞進行檢索時發現,網絡計量學對專利研究也有一定的借鑒與應用。[12]
2.2.2 借鑒與應用——文獻計量學
與科學計量學、信息計量學、網絡計量學及知識計量學相比,文獻計量學在知識產權領域的應用相對較多。文獻計量學由美國目錄學家普里查德于1969年首次提出,并將其定義為數學和統計學方法在圖書及其他傳播媒體上的應用。[13]在國內,以邱均平教授為代表的學者們將文獻計量學定義為:把文獻體系以及文獻計量特征作為研究對象,通過采用數學、統計學等方法來研究文獻情報的分布結構、數量關系、變化規律和定量管理,從而探討科學技術的結構、特征和規律的一門學科。[14]筆者認為,文獻計量學在知識產權領域應用較多的主要原因是:科學、信息、網絡、知識四大計量學都是在文獻計量學的基礎上發展而來,它們本身就有著緊密的聯系。同時,文獻計量學提出較早,其發展相對于其他四個計量學更完善,研究也更成熟。單從文獻數量上來看,文獻計量學與知識產權交集文獻就占了 “五計學” 與知識產權交集文獻的80.26%。
2.2.3 借鑒與應用——社會網絡分析
社會網絡分析在知識產權領域的應用主要是基于該方法重點關注關系及關系的模式,繪制網絡關系圖,以此來反映現象。對社會網絡分析在知識產權應用的相關文獻進行分析后,得到如下兩個結論。①在知識產權領域,該方法常與其他計量方法或統計方法共同使用,最常與其同時使用的方法是共詞分析。在共詞分析的基礎上,為了進一步研究關鍵詞之間的關系及其相關重要性或是以網絡圖譜結構的形式展現出來,則需要使用社會網絡分析。社會網絡分析在知識產權方面應用的優勢在于圖譜顯示可以更清晰地展現結果,同時對于關系的表達更直觀。②在知識產權領域,常用的社會網絡分析工具是Ucinet,Ucinet 具有很強的矩陣分析功能,能夠生成各種關系的知識圖譜。
2.2.4 借鑒與應用——共詞分析
共詞分析(Co-Word Analysis) 是文獻計量學中常用的一種方法,[15]它屬于內容分析,主要用于分析同一篇文獻中一對詞兩兩出現的次數,并對這些詞進行分層聚類,以揭示這些詞之間的親疏關系,進而分析它們所代表的學科和主題之間的結構變化。[16]共詞分析方法通過對高頻關鍵詞進行統計以及繪制詞篇、相似、相異矩陣等來反映某領域的研究熱點或趨勢。共詞分析常與聚類分析、戰略坐標分析、因子分析、多維尺度分析等方法一起使用,以此研究某一領域的研究熱點及趨勢。因子分析、聚類分析、多維尺度分析都是基于共詞矩陣進行的計量方法,而戰略坐標分析則是基于共詞矩陣和聚類的計量方法。
2.2.5 借鑒與應用——引文分析
引文作為借鑒、尊重和保護前人研究成果的一種方法,是一篇論文的重要組成部分。引文分析(Citation Analysis) 作為評價文獻質量的常用方法,[17]其能在一定程度上反映一個領域的發展動態、特點及趨勢。引文分析主要分為兩類:① 引文數量、類型等統計;② 引文年代、語種、國別等分析。引文分析在知識產權應用中主要和其他分析方法同時進行。如,利用 “五計學” 方法對知識產權研究領域的技術特點、熱點或趨勢進行分析時,常常從該領域文獻的發表年代、期刊分布、作者分布、主題分布、學科分布、引文等方面進行分析。可見,引文分析在 “五計學” 對知識產權的應用與借鑒中起輔助作用。
2.2.6 借鑒與應用——合作分析
通過具體分析 “合作分析” 的相關文獻可知,在知識產權領域,科研合作研究客觀存在,且主要存在于專利領域。專利合作網絡一詞在再次搜索的相關文獻中屬高頻關鍵詞,可見其為該領域的研究重點。專利合作網絡分析能夠更加直接地反映出技術領域的研究現狀,同時可揭示其模式及規律。另外,在專利合作網絡的構建方面,主要是綜合采用統計分析方法與工具,常用的方法有專利計量、社會網絡分析、可視化、數理統計、相關性、灰色關聯度等。
本文利用數據分析軟件,從文獻計量的總體趨勢分析、共詞分析、社會網絡分析三個方面對我國“五計學” 對知識產權方法的借鑒與應用進行初步分析后,從聯結較多的高頻關鍵詞出發,利用內容分析法對其進行具體分析,進而更深入地揭示我國“五計學” 在知識產權領域的借鑒與應用情況。研究結果表明:① 專利計量學作為 “三計學” 的衍生方法,已經成為知識產權領域中一個獨立的應用方法。而 “五計學” 相對 “三計學”,網絡計量學和知識計量學也與專利計量學存在聯系;② 我國 “五計學” 的方法如文獻計量學、社會網絡分析、共詞分析、引文分析、合作分析等在知識產權領域都有一定的應用,且這些方法常常不是單獨運用在知識產權領域,而是以兩兩結合或是與其他計量方法、統計方法相結合的方式共同出現的。