周亞新
(貴州財經(jīng)大學(xué) 信息學(xué)院,貴州 貴陽 550025)
可視化分析方法是研究者在電子儲存技術(shù)、數(shù)據(jù)傳輸和信息圖像處理技術(shù)的支持下,將各種數(shù)據(jù)或數(shù)據(jù)間的關(guān)系抽象后,運用軟件的圖像處理技術(shù)使數(shù)據(jù)間隱藏的信息和規(guī)律具體化,能夠更加有效、形象地展現(xiàn)出來,學(xué)者也能夠更加直觀地理解和過濾獲取所需要的有效信息,這種方法的直觀性強(qiáng)、傳達(dá)性強(qiáng),在部分學(xué)術(shù)研究中已得到普遍應(yīng)用,也有越來越多的學(xué)者通過對某領(lǐng)域的論文從載文量、作者、引文和熱點主題等方面進(jìn)行可視化分析。姜桐桐等[1]對《解放軍護(hù)理雜志》5年的載文信息進(jìn)行分析,為護(hù)理科研工作者提供了理論參考;張艷玲[2]運用文獻(xiàn)計量學(xué)統(tǒng)計分析了《圖書館理論與實踐》的作者群,體現(xiàn)了圖書館建設(shè)的優(yōu)秀作者隊伍和其學(xué)術(shù)影響力;武瑞和程金蓮[3]對2018~2019年護(hù)理核心期刊進(jìn)行引文分析,以推動我國護(hù)理管理事業(yè)發(fā)展;周凡力和廖靜[4]利用Citespace軟件文獻(xiàn)計量分析中國園林,發(fā)現(xiàn)其研究方向正在轉(zhuǎn)向“鄉(xiāng)村”“工業(yè)廢氣地”“綠色空間”“生態(tài)智慧”等熱點主題。這些對期刊數(shù)據(jù)進(jìn)行的可視化分析,不僅可以使各個編輯部能夠迅速有效地獲取近幾年的熱點信息,也能夠提供一些新鮮的辦刊思路,做到在提高期刊質(zhì)量方面有所突破,起到積極、有效的促進(jìn)作用。
《電子知識產(chǎn)權(quán)》是由中華人民共和國工業(yè)和信息化部主管、中國國家工業(yè)信息安全發(fā)展研究中心主辦的月刊,主要介紹知識產(chǎn)權(quán)法律信息、提供企業(yè)知識產(chǎn)權(quán)管理工作指導(dǎo),探討現(xiàn)實中新的知識產(chǎn)權(quán)問題,交流國內(nèi)外知識產(chǎn)權(quán)理論及司法實踐經(jīng)驗。多年來,不斷本著集理論性和實踐性為一體的理念,探討解決理論界和實務(wù)界中新的知識產(chǎn)權(quán)問題,也曾獲信息產(chǎn)業(yè)年度報道選題獎、中華人民共和國信息產(chǎn)業(yè)部年度學(xué)術(shù)技術(shù)水平優(yōu)秀獎。雖然《電子知識產(chǎn)權(quán)》已經(jīng)獲得了不錯的成績,但在國際上影響力較小,并且在全部統(tǒng)計源期刊中排名也較低。因此本研究將以中國知網(wǎng)上的數(shù)據(jù)為基礎(chǔ),對其載文量、核心作者、機(jī)構(gòu)及其地區(qū)分布和熱點研究等方面進(jìn)行分析,以期為《電子知識產(chǎn)權(quán)》欄目建設(shè)的改善和期刊質(zhì)量的提高提供幫助。
從中國知網(wǎng)(CNKI)上選擇本研究需要的數(shù)據(jù)來源,通過“高級檢索”的方式,同時設(shè)定檢索條件的期限為2003~2020年,數(shù)據(jù)來源設(shè)置為“期刊”,檢索內(nèi)容為“電子知識產(chǎn)權(quán)”,檢索日期是2021年1月8日,通過以上的檢索條件,共得到相關(guān)數(shù)據(jù)信息3904條,并導(dǎo)出參考文獻(xiàn)保存Reworks格式,用于分析數(shù)據(jù)的期刊載文量、作者、機(jī)構(gòu)來源及地區(qū)、關(guān)鍵詞特征。
主要采用可視化分析方法,與知識圖譜相結(jié)合定量分析某領(lǐng)域的學(xué)術(shù)產(chǎn)生與發(fā)展。研究工具主要有Bicomb2、gCLUTO和Ucinet可視化軟件。
載文量是用來評估期刊質(zhì)量的標(biāo)準(zhǔn)之一,它是從信息輸出角度評價期刊的質(zhì)量,載文量越多,在一定程度上表示該刊信息越豐富。通過Bicomb2軟件對3904篇文獻(xiàn)數(shù)據(jù)進(jìn)行統(tǒng)計分析得到期刊載文量統(tǒng)計信息[5],具體如圖1所示,《電子知識產(chǎn)權(quán)》刊載論文數(shù)量呈現(xiàn)較大波動趨勢,可以看出,2014年是統(tǒng)計數(shù)據(jù)期間發(fā)文量最多的年份,共計337篇;最少的年份是2019年和2020年,各自發(fā)表107篇論文。從2014年起《電子知識產(chǎn)權(quán)》的載文量就開始呈現(xiàn)下降趨勢。

圖1 《電子知識產(chǎn)權(quán)》刊載論文量趨勢
高影響力的學(xué)術(shù)群體,一定程度上是一個學(xué)科領(lǐng)域的代表和引導(dǎo)者,是該領(lǐng)域發(fā)展的趨勢體現(xiàn)。對作者群研究,可以探究該領(lǐng)域研究主題的廣度和深度,對于往后科研學(xué)術(shù)活動的規(guī)劃和引領(lǐng)具有積極作用。用可視化軟件對3904篇論文題錄信息做作者統(tǒng)計和分析,把數(shù)據(jù)導(dǎo)入軟件處理后,共得到3930個作者,表1中列出了發(fā)文量≥10次的作者,共計32位作者。

表1 發(fā)文量前32名的作者統(tǒng)計(≥10次)
由表1中可以看出,周春慧是發(fā)文量最多的作者,共占95篇;其次是盧寶峰和左玉茹,分別是53篇和53篇。接著是作者于凱旋(38篇)、巫曉倩(33篇)、杜聲宇(23篇)、趙天武(22篇)、鈕京暉(20篇)、劉曉春(16篇)等。圖2 是統(tǒng)計上述作者中有合作關(guān)系的作者,可以看出有合作關(guān)系的僅有夏蕓、楊曉麗、巫曉倩、李秀娟和趙天武,其余作者間均未出現(xiàn)合作,表明該電子知識產(chǎn)權(quán)期刊合作作者群極少。
對《電子知識產(chǎn)權(quán)》刊載論文的發(fā)文機(jī)構(gòu)進(jìn)行分析,共有機(jī)構(gòu)3074個,表2中統(tǒng)計出出現(xiàn)次數(shù)在15次及其以上的發(fā)文機(jī)構(gòu),共計22個。發(fā)文量最高的機(jī)構(gòu)是中南財經(jīng)政法大學(xué)知識產(chǎn)權(quán)研究中心,共發(fā)文80篇,占前22名的10.90%。

圖2 作者合作統(tǒng)計(表1中的高頻作者)

表2 發(fā)文機(jī)構(gòu)出現(xiàn)頻次≥15統(tǒng)計(共計22個)
對于表2中發(fā)文機(jī)構(gòu)的地域進(jìn)行分析,主要集中在北京、上海兩個地區(qū);對上述機(jī)構(gòu)所在地分析,基本集中在東南方和東北方;相較于西南方或西北方,《電子知識產(chǎn)權(quán)》所發(fā)期刊較少。但是近年來發(fā)文機(jī)構(gòu)呈現(xiàn)地區(qū)多樣化。
通過軟件對得到的關(guān)鍵詞數(shù)據(jù)進(jìn)行統(tǒng)計分析,用可視化方式直觀展示,并且可以顯示出隱含的關(guān)系和趨勢,產(chǎn)生一定的指導(dǎo)意義,可用于前沿?zé)狳c研究。
3.4.1 關(guān)鍵詞詞頻統(tǒng)計
關(guān)鍵詞詞頻是用于統(tǒng)計情報檢索與文本挖掘的常用技術(shù),其統(tǒng)計為某一領(lǐng)域的學(xué)術(shù)研究提供了不同的方法和視野。高頻關(guān)鍵詞則表示某一學(xué)術(shù)領(lǐng)域或?qū)W科的大密度知識聚集地,也就是核心關(guān)鍵詞是檢索重點所在。這里用可視化軟件對期刊論文信息做關(guān)鍵詞統(tǒng)計和聚類分析,把論文數(shù)據(jù)導(dǎo)入軟件處理后,共得到17192個關(guān)鍵詞。關(guān)鍵詞出現(xiàn)頻次分布如表3所示,列出了90個關(guān)鍵詞,均出現(xiàn)了20次及其以上。
從表3中可以看出,知識產(chǎn)權(quán)、專利權(quán)人、專利、著作權(quán)、反壟斷法、商標(biāo)侵權(quán)等出現(xiàn)次數(shù)排名靠前,但出現(xiàn)次數(shù)最多的是知識產(chǎn)權(quán),頻次為174次。
如圖3是對出現(xiàn)頻次≥30次的51個關(guān)鍵詞進(jìn)行的社會網(wǎng)絡(luò)分析。利用社會網(wǎng)絡(luò)分析軟件Uninet將構(gòu)建的共現(xiàn)矩陣數(shù)據(jù)轉(zhuǎn)換為一個網(wǎng)絡(luò)圖。專利技術(shù)、專利復(fù)審委員會、國家知識產(chǎn)權(quán)局、商標(biāo)局、中級人民法院、專利權(quán)人、專利法、不正當(dāng)競爭、最高人民法院、一審判決、版權(quán)法、知識產(chǎn)權(quán)制度、專利保護(hù)、專利態(tài)勢、國家版權(quán)局等關(guān)鍵詞處于網(wǎng)絡(luò)中心,且中心性最大,與其他主要關(guān)鍵詞共同出現(xiàn)在同一篇文獻(xiàn)中的頻次最多,是圖中最重要的節(jié)點,而處于圖邊緣的節(jié)點聯(lián)系相對較稀疏。

圖3 高頻關(guān)鍵詞網(wǎng)絡(luò)分析
3.4.2 高頻關(guān)鍵詞聚類分析
關(guān)鍵詞聚類分析是根據(jù)關(guān)鍵詞在文中的出現(xiàn)次數(shù),生成共現(xiàn)矩陣,將緊密的關(guān)鍵詞聚集在一起,形成聚類;規(guī)律是關(guān)鍵詞越是相似越容易聚成團(tuán),反之越分散。通過算法分類之后可以在視圖中揭示不同類團(tuán)的特點和他們之間的關(guān)系。在我國電子知識產(chǎn)權(quán)文獻(xiàn)研究領(lǐng)域有較少論文運用此方法。本研究對51個高頻關(guān)鍵詞構(gòu)建51×51的矩陣,通過gCLUTO軟件進(jìn)行聚類分析[6]。依據(jù)高頻關(guān)鍵詞形成共現(xiàn)矩陣進(jìn)行聚類分析,根據(jù)效果聚6類為佳,形成了如圖4中6個峰的山峰圖和圖5的6個主題的聚類圖,具體如下。
圖4是與圖5中的6個主題相呼應(yīng)的山峰統(tǒng)計圖。山峰圖從整體上體現(xiàn)各個聚類的特征,其高度、體積和顏色都與高頻關(guān)鍵詞具有一定的相關(guān)性,具體表示為:第一,山峰的高度與類內(nèi)相似性呈正比例關(guān)系;相似性越大,山峰則越陡峭,反之則越平緩。第二,山峰的體積越大,表示每個聚類山峰內(nèi)關(guān)鍵詞的數(shù)量越多,反之就越少;第三,山峰的顏色與聚類中關(guān)鍵詞之間的差異呈反向關(guān)系,顏色所表示的類內(nèi)相似度標(biāo)準(zhǔn)差由低到高的排列依次是:紅、黃、綠、淺藍(lán)和深藍(lán)(所有顏色均由軟件自動生成,下同),當(dāng)類內(nèi)的顏色數(shù)量越少,就表明其內(nèi)部關(guān)鍵詞元素相似性越大。

圖4 高頻關(guān)鍵詞的山峰圖
上述圖4表示的高頻關(guān)鍵詞的山峰圖,圖中有6個峰對應(yīng)的是6個不同的主題,從圖中可以看出,0號峰的高度在6個山峰中最突出,海拔最高且陡峭,其封頂呈現(xiàn)黃色,山峰整體顏色分布較多,表明0號峰類內(nèi)元素相似性較大,關(guān)鍵詞數(shù)量較少,類內(nèi)相似度標(biāo)準(zhǔn)差較低。其次是1號和2號山峰,海拔較低,呈現(xiàn)平緩狀態(tài),體積較大,峰頂顏色均為綠色,表明類內(nèi)相似度不高,但類內(nèi)關(guān)鍵詞數(shù)量相對較多。最后的3號、4號、5號山峰,海拔低且平緩,體積大,顏色單一均為淺藍(lán),表明這3個山峰類內(nèi)關(guān)鍵詞相似性都比較大,包含的關(guān)鍵詞數(shù)量也較多。

圖5 高頻關(guān)鍵詞的聚類分析
根據(jù)圖5并結(jié)合圖4分析如下,《電子知識產(chǎn)權(quán)》期刊的發(fā)文領(lǐng)域主要涉及6個主題(主題編號、順序均勻軟件自動生成,下同)。主題1中的商標(biāo)評審委員會、商標(biāo)局、中級人民法院、一審判決、商標(biāo)法、最高級人民法院都是對商標(biāo)權(quán)、馳名商標(biāo)、商標(biāo)侵權(quán)、注冊商標(biāo)專用權(quán)和不正當(dāng)競爭等的處理途徑。主題2中是對專利的研究,包括專利權(quán)人、專利法、專利侵權(quán)、專利訴訟、申請人、申請人、外觀設(shè)計、專利權(quán)和專利評審委員會。主題3中國家版權(quán)局、版權(quán)保護(hù)、著作權(quán)、合理使用和版權(quán)法是對版權(quán)的研究。主題4中專利態(tài)勢、發(fā)明專利申請、專利申請、專利布局、專利技術(shù)、專利保護(hù)是集中對專利前期的研究,其中也涉及了國家知識產(chǎn)權(quán)局和知識產(chǎn)權(quán)戰(zhàn)略的研究。主題5中元素研究相似性較低,關(guān)鍵詞聯(lián)系不緊密,例如知識產(chǎn)權(quán)法、知識權(quán)制度、專利、商業(yè)秘密、反不正當(dāng)競爭法、反壟斷法、反壟斷等。主題0中關(guān)鍵詞相似性較大,是電子知識產(chǎn)權(quán)期刊中的主要研究內(nèi)容,如知識產(chǎn)權(quán)保護(hù)、知識產(chǎn)權(quán)問題等。
本研究通過對《電子知識產(chǎn)權(quán)》期刊的年發(fā)文量、作者、機(jī)構(gòu)和熱點等情況的分析,得出該期刊載文量前期呈現(xiàn)上升趨勢,近幾年發(fā)文量有所下降,總體有下滑趨勢;核心作者數(shù)量較多,發(fā)文超過10次以上的有32個;發(fā)文機(jī)構(gòu)主要集中在北京和上海,這兩個地區(qū)對電子知識產(chǎn)權(quán)的重視高于其他地區(qū),其中中南財經(jīng)政法大學(xué)知識產(chǎn)權(quán)研究中心是發(fā)文最高的機(jī)構(gòu);期刊的主要研究方向是關(guān)注電子知識產(chǎn)權(quán)的保護(hù)問題。但不足的是熱點研究中所運用的軟件缺乏時間敏感性,不能從動態(tài)角度研究《電子知識產(chǎn)權(quán)》刊載論文的熱點演化。需要選擇更加合適的、科學(xué)的研究方法來進(jìn)一步探測該期刊的研究方向,可以繼續(xù)推動電子知識產(chǎn)權(quán)甚至知識產(chǎn)權(quán)領(lǐng)域的學(xué)術(shù)研究和發(fā)展,也可以為《電子知識產(chǎn)權(quán)》期刊走向更高的階梯提供參考。