李成淵 任汶灝
無錫城市職業技術學院
與美國等發達國家相比,國內學者研究大數據起步較晚,我國最早的大數據宏觀政策是2012年發布的《廣東省實施大數據工作方案》,主要任務集中在推進政務公開以及完善廣東省內網絡系統上。我國學者對大數據的學術研究在2010年之后慢慢興起,在短短10年間,國內學者對大數據的研究主題熱點發生了深刻的變化。本文利用中國知網的計量可視化分析工具,借助2011—2020年十年間以“大數據”為主題的文獻,研究國內學者對大數據研究主題的文獻數量分析、核心期刊分析、研究機構分析以及主題熱點的發展歷程。
通過中國知網(CNKI)數據庫,以“大數據”“big data”為檢索詞, 2011—2020年為檢索期限,文獻檢索涉及學術期刊、學位論文、會議、報紙等,在文獻“主題”范圍內進行檢索。通過對檢索文獻資料的逐一篩查,最后共計得到中國大數據研究文獻265109篇。
中國知網(2001—2020年)國內大數據檢索文獻數量及增速如圖1所示。通過統計發現:(1)在文獻收錄總量方面,近10年中國知網數據庫收錄國內大數據研究文獻數量為265109篇;(2)在文獻收錄年份方面,國內大數據研究文獻被中國知網收錄最早年份為2011年;(3)在文獻數量年份變化方面,國內大數據研究文獻收錄數量總體呈上升趨勢;其中,2012—2017年,每年都保持高速增長;2013年的增速最快,高達208.92%;2018年有小回落;2019年,國內學者對大數據的研究達到峰值;2020年有些許回落,但研究數量仍舊十分可觀。
同樣是在中國知網,以“大數據”“big data”為檢索詞,檢索期限為2011—2020年,文獻檢索涉及核心學術。在文獻中,根據“關鍵詞”范圍內進行檢索。通過對檢索文獻資料的逐一篩查,最后共計得到發表在核心期刊上的國內大數據研究文獻9421篇。

圖1 中國知網(2001—2020年)國內大數據檢索文獻數量及增速期刊
通過統計發現:(1)在文獻收錄總量方面,近10年中國知網數據庫收錄國內大數據研究文獻數量為9421篇;(2)在文獻收錄年份方面,國內大數據研究文獻被中國知網收錄最早年份為 2011年;(3)在文獻數量年份變化方面,國內大數據研究文獻收錄數量總體呈上升趨勢;其中,2012—2017年,每年都保持高速增長;2018年有小小的回落;2019年,國內學者對大數據的研究達到峰值;2020年有些許回落,但研究數量仍舊十分可觀。
除了研究“大數據”在核心期刊上的發表數量和增速以外,還發現“大數據”主題研究集中在以下幾個期刊:《電子政務》(134篇)、《情報理論與實踐》(107篇)、《現代情報》(96篇)、《商業經濟研究》(94篇)、《計算機科學》(86篇)、《電信科學》(85篇)、《會計之友》(85篇)、《人民論壇》(84篇)、《情報雜志》(81篇)等。通過統計發現,排名較為靠前的期刊主要是計算機、圖書情報檔案、新聞傳播、電子商務、通信、會計等領域。
統計發現,研究“大數據”主題的機構主要集中在國內各大知名高校,包括武漢大學(302篇)、中國人民大學(259篇)、清華大學(229篇)、南京大學(191篇)、北京大學(156篇)、中國科技院大學(118篇)、吉林大學(88篇)、北京師范大學(87篇)、復旦大學(87篇)、上海交通大學(83篇)、中南大學(83篇)。其中,武漢大學對大數據下醫療衛生的研究探索較多,尤其是在經歷了新冠肺炎疫情后,將大數據與醫學融合的研究較深刻。中國人民大學對大數據環境下新聞傳播、圖書檔案、法學等領域研究較深入。清華大學對大數據環境下醫療、金融、電子商務、互聯網、通信等領域涉獵較多。南京大學主要研究大數據環境下的圖書情報、公共管理、智慧城市、教育等。
基于中國知網的計量可視化分析,在短短的10年間,國內大數據研究已經完成了整體布局、戰略研究,涉及的范圍幾乎已經覆蓋國內主要的經濟、政治、文化發展領域。大數據、云計算、人工智能、物聯網、智慧城市、互聯網、商業銀行、信息安全等關鍵詞出現的頻率最高,是最近10年國內大數據研究的主題熱點。
同樣基于中國知網的計量可視化分析,10年間國內大數據主題熱點可以歸納為以下領域:計算機(38835篇)、工商管理(22686篇)、通信經濟(17686篇)、教育學(17290篇)、新聞傳播(12738篇)、金融(11622篇)、商業經濟(11413篇)、工業經濟(11280篇)、圖書情報檔案(10374篇)、法學(6601篇)、公共管理(6196篇)、控制工程(5128篇)、農業經濟(4318篇)、城市經濟(4183篇)等??梢?,國內大數據的研究領域非常之廣,為中國大數據的開發和利用提供了堅實的理論基礎。
在中國知網,高級檢索時間范圍時,以一年為一個區間,對國內10年大數據研究主題熱點進行查詢和分析。
2011年,國內研究以大數據為主題的論文非常少,中國人民大學王珊、覃雄派、王會舉等學者發表論文《架構大數據:挑戰、現狀與展望》和《大數據分析——RDBMS與MapReduce的競爭與共生》,對大數據分析主流實現平臺進行了對比分析,研究MapReduce等新生平臺,以站在更高的層次來思考問題,從而找到適應時代需求的數據倉庫架構。
2015年,國務院發布了《促進大數據發展行動綱要》,這部戰略性綱要為我國未來5—10年的大數據應用、產業和技術的發展提供了行動指南。同年,李克強總理在政府工作報告中首次提出“互聯網+”行動計劃,研究熱點新增了“互聯網+”、政府治理等關鍵詞。與大數據相結合的領域進一步擴大到環保、智慧教育等各個社會領域。
2018年,河南省、河北省、四川省發布了各自省份的大數據行動計劃,區塊鏈、數據共享、數據治理、精準扶貧等研究熱點出現。劉海英提出了“大數據+區塊鏈”的共享經濟發展思路;曹菲提出將大數據技術應用到扶貧工作中,可以提高精準扶貧的效率。
2020年,是極不平凡的一年,這也體現在這一年的研究熱點上,大數據主題研究熱點發生了極大的改變,用戶體驗、智慧養老、新冠肺炎等新的關鍵詞出現。譚浩等學者探討了大數據在用戶體驗設計領域的主要應用場景以及實現方法;劉夢非等提出了智慧養老領域隱式交互未來發展方向;趙序茅等學者利用大數據,回溯了新冠肺炎擴散的趨勢并提出了針對性建議。
通過對國內2011—2020年大數據研究主題熱點分析,可以得出以下結論:國內對大數據的研究文獻不論從數量上還是質量上都在不斷發展和深入;利用中國知網進行可視化分析,發現研究大數據的主題熱點領域非常廣,幾乎涵蓋社會的方方面面;梳理2011—2020年大數據的主題熱點發現,每一年都有大數據政策的發布和熱點領域的變化發展。結果表明,大數據研究仍將成為我國重點研究的課題之一。