摘 要:文章從文獻(xiàn)計(jì)量分析的角度,定量分析了計(jì)算機(jī)領(lǐng)域的2311995篇文獻(xiàn),對(duì)國(guó)內(nèi)計(jì)算機(jī)領(lǐng)域的主要研究機(jī)構(gòu)、主要研究學(xué)者及該領(lǐng)域的研究熱點(diǎn)行了統(tǒng)計(jì)與分析,構(gòu)建了國(guó)內(nèi)計(jì)算機(jī)領(lǐng)域研究熱點(diǎn)的知識(shí)圖譜,并對(duì)圖譜進(jìn)行了分析和解讀,以期獲取我國(guó)計(jì)算機(jī)領(lǐng)域的研究熱點(diǎn)有哪些,有哪些主要的研究機(jī)構(gòu),他們各自關(guān)心的研究主題又有哪些,等等。
關(guān)鍵詞:知識(shí)圖譜;計(jì)算機(jī);研究熱點(diǎn);數(shù)據(jù)分析
中圖分類(lèi)號(hào):TP39 文獻(xiàn)標(biāo)識(shí)碼:A
Abstract:This paper quantitatively analyses 2311995 articles in the fields of computer science,from the view of literature metrology,collecting and examining data about major research institutions,main computer research scholars and the hot domains in this field,mapping knowledge research focus in the field in China,and analyzing and interpreting the spectrum to obtain what are the research hot domains,which are the main research institutions,and what their respective topics of research are concerned with,etc.in the field of Computer Science in China.
Keywords:knowledge spectrum;computer;hot domains;data analysis
1 引言(Introduction)
當(dāng)今社會(huì),計(jì)算機(jī)的應(yīng)用已滲透到社會(huì)的各個(gè)領(lǐng)域,正在日益改變著傳統(tǒng)的工作、學(xué)習(xí)和生活的方式,推動(dòng)著社會(huì)的科學(xué)計(jì)算,成為國(guó)民經(jīng)濟(jì)基礎(chǔ)性、先導(dǎo)性、戰(zhàn)略性、支柱性產(chǎn)業(yè),是中國(guó)搶占國(guó)際經(jīng)濟(jì)制高點(diǎn)的重要引擎[1]。但是計(jì)算機(jī)領(lǐng)域的學(xué)科發(fā)展現(xiàn)狀如何,該領(lǐng)域的研究熱點(diǎn)有哪些目前還沒(méi)有系統(tǒng)全面的研究。
中國(guó)知網(wǎng)是全球最大的知識(shí)門(mén)戶(hù)網(wǎng)站,集期刊、報(bào)紙、博士碩士學(xué)位論文、會(huì)議論文、圖書(shū)、年鑒、多媒體教育教學(xué)素材為一體的知識(shí)服務(wù)網(wǎng)站。本文以中國(guó)最大中文期刊數(shù)據(jù)庫(kù)——中國(guó)知網(wǎng)的海量數(shù)據(jù)為基礎(chǔ),利用SPSS統(tǒng)計(jì)軟件,以及知識(shí)圖譜的方法和工具對(duì)計(jì)算機(jī)領(lǐng)域的主要學(xué)術(shù)機(jī)構(gòu)、學(xué)者、論文關(guān)鍵詞等數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)分析,以期獲取我國(guó)計(jì)算機(jī)領(lǐng)域的研究熱點(diǎn)有哪些,有哪些主要的研究機(jī)構(gòu),最主要的學(xué)者和他們的團(tuán)隊(duì)成員有哪些,他們各自關(guān)心的研究主題又有哪些等。
2 研究方法(Research method)
文獻(xiàn)計(jì)量學(xué)方法是對(duì)文獻(xiàn)和文獻(xiàn)工作進(jìn)行定量研究的方法[2],它采用數(shù)學(xué)語(yǔ)言進(jìn)行定量分析,以數(shù)學(xué)公式或圖形來(lái)表現(xiàn)規(guī)律,對(duì)問(wèn)題的陳述及計(jì)算都采用簡(jiǎn)明的數(shù)學(xué)符號(hào),從而簡(jiǎn)化和加速了思維過(guò)程[3],具有深刻的描述性能和高度的概括能力[4]。使用可視化的方式,即用科學(xué)知識(shí)圖譜的研究方法來(lái)定量,并且形象直觀地監(jiān)測(cè)與評(píng)價(jià)學(xué)科的發(fā)展,正是科學(xué)計(jì)量學(xué)、文獻(xiàn)計(jì)量學(xué)、信息計(jì)量學(xué)等近10多年來(lái)一直共同關(guān)注的一個(gè)問(wèn)題,而且也已經(jīng)取得了很大進(jìn)展[5]。
本文利用文獻(xiàn)計(jì)量學(xué)及知識(shí)圖譜的理念及技術(shù)對(duì)計(jì)算機(jī)領(lǐng)域的上百萬(wàn)篇文章進(jìn)行定量統(tǒng)計(jì)分析。
3 研究步驟(Research steps)
3.1 數(shù)據(jù)來(lái)源
本文所統(tǒng)計(jì)分析的原始數(shù)據(jù)源自于中國(guó)知網(wǎng)數(shù)據(jù)庫(kù),選擇對(duì)中國(guó)知網(wǎng)所收錄的計(jì)算機(jī)相關(guān)領(lǐng)域2311995篇核心期刊文獻(xiàn)進(jìn)行統(tǒng)計(jì)分析,這些數(shù)據(jù)具有較高的準(zhǔn)確性和權(quán)威性,是有價(jià)值的研究數(shù)據(jù)。
核心期刊是指某學(xué)科(或某領(lǐng)域)的核心期刊,是指那些發(fā)表該學(xué)科(或該領(lǐng)域)論文較多、使用率(含被引率、摘轉(zhuǎn)率和流通率)較高、學(xué)術(shù)影響較大的期刊[6]。由于核心期刊是期刊中學(xué)術(shù)水平較高的刊物,對(duì)核心期刊中收錄的計(jì)算機(jī)領(lǐng)域研究文獻(xiàn)進(jìn)行檢索分析,可以更準(zhǔn)確的獲得計(jì)算機(jī)領(lǐng)域的研究熱點(diǎn)[7]。
3.2 數(shù)據(jù)獲取及預(yù)處理
(1) 數(shù)據(jù)檢索
進(jìn)入中國(guó)知網(wǎng)(CNKI)期刊數(shù)據(jù)庫(kù),在學(xué)科專(zhuān)輯導(dǎo)航中選擇“計(jì)算機(jī)硬件技術(shù)”“計(jì)算機(jī)軟件及計(jì)算機(jī)應(yīng)用”“互聯(lián)網(wǎng)技術(shù)”“自動(dòng)化技術(shù)”“數(shù)據(jù)庫(kù)”等計(jì)算機(jī)學(xué)科,共檢索到2311995篇相關(guān)文獻(xiàn)。
(2) 數(shù)據(jù)預(yù)處理
通過(guò)數(shù)據(jù)檢索,檢索出計(jì)算機(jī)領(lǐng)域的核心期刊文獻(xiàn)之后,利用知網(wǎng)的文獻(xiàn)題錄導(dǎo)出功能,把文獻(xiàn)的題名、作者、單位、關(guān)鍵詞等題錄數(shù)據(jù)導(dǎo)出,把所有的題錄數(shù)據(jù)進(jìn)行匯總[8],共得到2311995條題錄數(shù)據(jù),對(duì)導(dǎo)出的原始數(shù)據(jù)進(jìn)行整合,便于之后對(duì)數(shù)據(jù)的分析。
3.3 數(shù)據(jù)統(tǒng)計(jì)與分析
3.3.1 單項(xiàng)關(guān)鍵詞統(tǒng)計(jì)
對(duì)數(shù)據(jù)預(yù)處理后,通過(guò)對(duì)獲取到的題錄數(shù)據(jù)中關(guān)鍵詞進(jìn)行分列處理,其次對(duì)分列后的關(guān)鍵詞進(jìn)行整合,進(jìn)而統(tǒng)計(jì)高頻關(guān)鍵詞[9]。選取前幾位的高頻關(guān)鍵詞包括“數(shù)據(jù)庫(kù)、單片機(jī)、計(jì)算機(jī)、神經(jīng)網(wǎng)絡(luò)、遺傳算法、數(shù)據(jù)挖掘、網(wǎng)絡(luò)安全、仿真、PLC、數(shù)據(jù)采集、無(wú)線(xiàn)傳感器網(wǎng)絡(luò)、教學(xué)改革、故障診斷、云計(jì)算、圖像處理、電子商務(wù)”等關(guān)鍵詞。通過(guò)這些高頻關(guān)鍵詞,可以看出計(jì)算機(jī)領(lǐng)域的關(guān)注點(diǎn)。高頻關(guān)鍵詞分布見(jiàn)圖1。
3.3.2 關(guān)鍵詞共現(xiàn)統(tǒng)計(jì)
共現(xiàn)分析是將各種信息載體中的共現(xiàn)信息定量化的分析方法[10],可深刻、精確地挖掘隱含的或潛在的有用的文本知識(shí),發(fā)現(xiàn)研究對(duì)象之間的親疏關(guān)系,揭示研究對(duì)象所代表的學(xué)科或主體的結(jié)構(gòu)與變化[11]。
選取計(jì)算機(jī)相關(guān)學(xué)科所收錄的2311995篇文獻(xiàn)的前四個(gè)關(guān)鍵詞進(jìn)行關(guān)鍵詞共現(xiàn)統(tǒng)計(jì),構(gòu)建關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)。通過(guò)關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò),可以發(fā)現(xiàn),計(jì)算機(jī)領(lǐng)域的研究主題包括:計(jì)算機(jī)網(wǎng)絡(luò)安全、計(jì)算機(jī)的應(yīng)用、利用神經(jīng)網(wǎng)絡(luò)進(jìn)行故障診斷、神經(jīng)網(wǎng)絡(luò)及遺傳算法在數(shù)據(jù)挖掘中的應(yīng)用、單片機(jī)與無(wú)線(xiàn)傳感器、單片機(jī)與數(shù)據(jù)采集、基于云計(jì)算的數(shù)據(jù)挖掘、數(shù)據(jù)庫(kù)與計(jì)算機(jī)網(wǎng)絡(luò)等。關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)詳見(jiàn)圖2。
3.3.3 作者單位統(tǒng)計(jì)
對(duì)檢索到的2311995條題錄數(shù)據(jù),利用Excel軟件對(duì)作者單位進(jìn)行分列匯總,按單位發(fā)表文獻(xiàn)數(shù)量排序,發(fā)文篇數(shù)最多的為清華大學(xué),其次為上海交通大學(xué),排第三位的是浙江大學(xué),發(fā)表文獻(xiàn)頻次從高到低前20位依次為:清華大學(xué)、上海交通大學(xué)、浙江大學(xué)、西北工業(yè)大學(xué)、華中科技大學(xué)、哈爾濱工業(yè)大學(xué)、國(guó)防科技大學(xué)、武漢大學(xué)、北京航空航天大學(xué)、東南大學(xué)、西安交通大學(xué)、華南理工大學(xué)、南京航空航天大學(xué)、同濟(jì)大學(xué)、天津大學(xué)、重慶大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)、華中理工大學(xué)、東北大學(xué)、西安電子科技大學(xué)。發(fā)文數(shù)量居前20位的機(jī)構(gòu)基本上為我國(guó)的重點(diǎn)本科院校。前二十名單位詳見(jiàn)圖3。
3.3.4 作者統(tǒng)計(jì)
統(tǒng)計(jì)文獻(xiàn)中作者出現(xiàn)頻次可以分析得出計(jì)算機(jī)領(lǐng)域的領(lǐng)軍人物[12]。使用獲得的2311995條題錄數(shù)據(jù),統(tǒng)計(jì)其中作者的出現(xiàn)頻次,統(tǒng)計(jì)得到排序前十五名的作者,依次為:王士同、楊靜宇、于戈、周明全、趙海、王耀南、蔡自興、陳志剛、桂衛(wèi)華、潘泉、李仁發(fā)、楊炳儒、周明天、吳敏、王汝傳。
這些高產(chǎn)作者均是計(jì)算機(jī)、信息技術(shù)領(lǐng)域的知名學(xué)者,排在前五位的作者簡(jiǎn)介:王士同,教授(博導(dǎo)),原江南大學(xué)信息學(xué)院院長(zhǎng),現(xiàn)任江南大學(xué)數(shù)媒學(xué)院首席教授;楊靜宇,南京理工大學(xué)模式識(shí)別與智能系統(tǒng)國(guó)家重點(diǎn)學(xué)科學(xué)術(shù)帶頭人、博士生導(dǎo)師;于戈,現(xiàn)任東北大學(xué)計(jì)算機(jī)軟件與理論研究所所長(zhǎng),2015年12月16日起任計(jì)算機(jī)科學(xué)與工程學(xué)院執(zhí)行院長(zhǎng),一級(jí)教授,博士生導(dǎo)師;周明全,教授,博士生導(dǎo)師。北京師范大學(xué)信息科學(xué)與技術(shù)學(xué)院院長(zhǎng),教育部虛擬現(xiàn)實(shí)應(yīng)用工程研究中心主任,教育部計(jì)算機(jī)科學(xué)與技術(shù)委員會(huì)軟件工程教學(xué)指導(dǎo)委員會(huì)委員。趙海,現(xiàn)任東北大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)研究所教授、博士生導(dǎo)師,學(xué)科責(zé)任教授,面向先進(jìn)裝備制造業(yè)嵌入式技術(shù)實(shí)驗(yàn)室(省教育廳重點(diǎn)實(shí)驗(yàn)室)主任,享受?chē)?guó)務(wù)院特殊津貼。相繼創(chuàng)建了東大新業(yè)信息技術(shù)股份有限公司、沈陽(yáng)市科技局無(wú)線(xiàn)傳感器網(wǎng)絡(luò)重點(diǎn)實(shí)驗(yàn)室、沈陽(yáng)市發(fā)改委物聯(lián)網(wǎng)應(yīng)用基礎(chǔ)研究工程實(shí)驗(yàn)室等。現(xiàn)任中國(guó)民主同盟中央委員、民盟遼寧省委副主委、遼寧省政協(xié)常委,曾任沈陽(yáng)市人民政府參事、沈陽(yáng)市委咨詢(xún)委員會(huì)委員。曾獲遼寧省第二批百千萬(wàn)人才工程百人層次人選、遼寧省優(yōu)秀博士學(xué)位論文指導(dǎo)教師、沈陽(yáng)市青年專(zhuān)業(yè)技術(shù)人才、沈陽(yáng)市優(yōu)秀科技工作者稱(chēng)號(hào)。
4 結(jié)論(Conclusion)
通過(guò)對(duì)計(jì)算機(jī)領(lǐng)域的2311995篇研究文獻(xiàn)的文獻(xiàn)計(jì)量學(xué)實(shí)證研究得出:計(jì)算機(jī)領(lǐng)域的主要研究機(jī)構(gòu)集中于我國(guó)的重點(diǎn)本科院校,研究領(lǐng)域主要集中在“數(shù)據(jù)庫(kù)、單片機(jī)、計(jì)算機(jī)、神經(jīng)網(wǎng)絡(luò)、遺傳算法、數(shù)據(jù)挖掘”等方面。隨著人工智能技術(shù)的發(fā)展,與之相關(guān)的計(jì)算機(jī)網(wǎng)絡(luò)安全、計(jì)算機(jī)的應(yīng)用、利用神經(jīng)網(wǎng)絡(luò)進(jìn)行故障診斷、神經(jīng)網(wǎng)絡(luò)及遺傳算法在數(shù)據(jù)挖掘中的應(yīng)用、單片機(jī)與無(wú)線(xiàn)傳感器、單片機(jī)與數(shù)據(jù)采集、基于云計(jì)算的數(shù)據(jù)挖掘、數(shù)據(jù)庫(kù)與計(jì)算機(jī)網(wǎng)絡(luò)等主題成為計(jì)算機(jī)領(lǐng)域的關(guān)注熱點(diǎn)。
參考文獻(xiàn)(References)
[1] Mohanapriya D.,Mahesh K..A novel foreground region analysis using NCP-DBP texture pattern for robust visual tracking[J].MULTIMEDIA TOOLS AND APPLICATIONS,2017,76(24):25731-25748.
[2] Chen Wang,Hongxun Yao,Xiaoshuai Sun.Anomaly detection based on spatio-temporal sparse representation and visual attention analysis[J].Multimedia Tools and Applications,2017,76(5):6263-6279.
[3] Luming Zhang,Yang Yang,Rongrong Ji,et al.Special issue on "visual semantic analysis with weak supervision"[J].Multimedia Systems,2017,23(1):1-3.
[4]吳運(yùn)兵,陰愛(ài)英,林開(kāi)標(biāo),等.基于多數(shù)據(jù)源的知識(shí)圖譜構(gòu)建方法研究[J].福州大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,45(03):329-335.
[5] 吳運(yùn)兵,楊帆,賴(lài)國(guó)華,等.知識(shí)圖譜學(xué)習(xí)和推理研究進(jìn)展[J].小型微型計(jì)算機(jī)系統(tǒng),2016,37(09):2007-2013.
[6] 蘇永浩,張馳,程文亮,等.CLEQS——基于知識(shí)圖譜構(gòu)建的跨語(yǔ)言實(shí)體查詢(xún)系統(tǒng)[J].計(jì)算機(jī)應(yīng)用,2016,36(S1):204-206;223.
[7] 劉嶠,李楊,段宏,等.知識(shí)圖譜構(gòu)建技術(shù)綜述[J].計(jì)算機(jī)研究與發(fā)展,2016,53(03):582-600.
[8] 劉知遠(yuǎn),孫茂松,林衍凱,等.知識(shí)表示學(xué)習(xí)研究進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2016,53(02):247-261.
[9] 王曉陽(yáng),鄭驍慶,肖仰華.智慧搜索中的實(shí)體與關(guān)聯(lián)關(guān)系建模與挖掘[J].通信學(xué)報(bào),2015,36(12):17-27.
[10] 楊良斌.數(shù)據(jù)挖掘領(lǐng)域研究現(xiàn)狀與趨勢(shì)的可視化分析[J].圖書(shū)情報(bào)工作,2015,59(S2):142-147.
[11] 王巍巍,王志剛,潘亮銘,等.雙語(yǔ)影視知識(shí)圖譜的構(gòu)建研究[J].北京大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,52(01):25-34.
[12] 詹川.大數(shù)據(jù)研究的知識(shí)圖譜分析[J].圖書(shū)館論壇,2015,
35(04):84-91.
作者簡(jiǎn)介:
張小娟(1981-),女,碩士,講師.研究領(lǐng)域:信息組織與信息檢索,文獻(xiàn)計(jì)量,知識(shí)圖譜,數(shù)據(jù)分析.