摘 要:大數據是繼云計算、物聯網之后IT行業又一次顛覆性的技術革命,其內涵和外延都處于不斷發展的過程中。從2011年大數據正式在互聯網信息技術行業流行開始到2013年“大數據元年”,大數據市場一直呈現爆炸式增長,各行各業都紛紛關注數據挖掘與數據分析。關于大數據的科研論文發表也隨之迅速增長,但是因為沒有歷史文獻可供參考,大數據領域的科學研究暫且仍處于相對空白狀態。本文基于國內知名數據庫對與大數據相關的科研論文發表進行了數據分析,對現階段大數據的研究熱度進行了分析,并對大數據的研究前景進行了預測,實證分析結果對大數據的研究具有一定的參考價值。
關鍵詞:大數據;科研論文;數據分析;數據挖掘
中圖分類號:G250.7 文獻標識碼:A 文章編號:1674-7712 (2015) 02-0000-01
一、大數據搜索熱度變化情況
(一)搜索熱度
隨著互聯網的迅速發展,人類社會逐漸進入大數據時代,而物聯網與云計算作為近年來的熱點已經受到不少業界人士的關注。云計算通常涉及通過互聯網提供動態易拓展、虛擬化的資源,它強調的是數據計算能力,而大數據是海量的計算對象,強調的是數據存儲能力,兩者相輔相成。很大程度上,大數據需要處理大數據的能力,包括數據獲取、篩選、轉化和統計等計算能力;云計算要求大部分服務存儲設備提供最基礎的數據存儲能力。物聯網是基于互聯網的信息載體,讓所有能夠被獨立尋址的普通物理對象實現互聯互通的網絡,物聯網連接的設施設備能夠產生大數據,但這些大數據與通常的社交數據不同,它們是異構的、多樣性的、非結構的和有噪聲的,通常是物與物、物與人之間的合作信息數據。
從2012年起開始高強度進入公眾視野的大數據用了接近一年的時間幾乎復制了2009~2011年云計算的神話。云計算和物聯網在2012年底和2014年初都曾有兩次比較的關注度下滑,但之后都有了明顯回升,尤其是物聯網,與此同時大數據也剛好處于關注度上升趨勢,因此筆者猜想是由于大數據的出現為物聯網和云計算某些研究領域帶來了突破,新的理論和技術誕生或相關科學研究取得顯著成效。這樣看來大數據研究的出現和進步對于物聯網和云計算的推動是具有歷史性突破意義的。
(二)大數據論文發表
大數據是IT技術發展到一定階段的產物,其內涵和外延都處于不斷發展的過程中,大數據是繼云計算、物聯網之后IT行業又一次顛覆性的技術革命,從2011年大數據正式在互聯網信息技術行業流行開始到2013年“大數據元年”[1],大數據市場一直呈現爆炸式增長,各行各業都紛紛關注數據挖掘與數據分析為企業創造高額利潤。本文以數據庫——中國知網為數據采集對象,中國知網是全球領先的數字出版平臺,是一家致力于為海內外各行各業提供知識與情報服務的專業網站。 目前中國知網服務的讀者超過4000萬,中心網站及鏡像站點年文獻下量突破30億次,是全球倍受推崇的知識服務品牌。
(三)論文被引次數
通常從論文被引次數可以看出該研究領域的空白情況[2],分析從2009年到2014年大數據論文被引用總次數(此處通過對被引用次數進行降序排列處理,對前50篇論文的被引用次數求和得到)。從圖1顯示的雷達圖可以看出,從2009到2013年的大數據論文引用次數都在不斷上升,但是并沒有呈現爆炸式增長,筆者認為一方面可能是因為筆者只調查了中國知網數據庫,如果通過調查多個種類的數據庫并利用權重進行處理論文被引用次數的變化可能更明顯,另一方面是因為各個研究領域的論文專業性可能較高,可以借鑒和引用的可能性不是很大,但是大數據仍屬于新興科技,每個研究領域入門論文被引用次數總是有小幅增加的。截至2014年9月29日,原始數據顯示2013年與大數據有關的論文被引用次數為1037,而2014年只有75,筆者認為一方面可能因為專家學者將論文都集中在2014年10月之后發表出版,論文引用情況沒有披露,導致2014年被引次數只有75次,另一方面可能因為各個領域的大數據研究已經高度專業化、成熟化,引用參考通常會涉及專業學術著作或者該應用領域的權威期刊文獻。
二、結語與啟示
大數據時代的到來給各行各業帶來影響,對于某些行業來說這些影響可能是致命的,徹底覆滅該行業的發展,對于某些行業來說可能是帶來了希望,跳出瓶頸,取得重大突破。本文就到底哪些行業和領域會遭到大數據興起的沖擊,而哪些行業會在大數據時代取得空前的發展和突破,以中國知網數據庫為研究對象,采集2008年到2014年的與大數據相關的論文發表數量、被引用信息、所屬領域等信息,進行多層次的統計分析,得出了一些初步結論。但是這只是筆者選擇中國知網這一個數據庫調查發現的結果,樣本取樣的范圍應該擴大化并進行加權處理,這樣的出來的結論可能更有說服力,筆者在以后的進一步研究中會注意解決此問題,開拓出新的方法和技術,以分析得出更加科學有效的信息。
參考文獻:
[1]中華網財經.大數據時代得“數據”者得天下[J/OL].中國大數據.http://www.thebigdata.cn/YeJieDongTai/11744.html
[2]Octavian.大數據,科研論文發表分析[J/OL].博客,2013,02,04.[2014-09-29]http://blog.csdn.net/wxdsdtc831/article/details/8570120