田曉玲
隨著大數據時代的全面到來,人們獲取信息的方式也發生了巨大改變,同時在獲取信息資源過程中,擁有了更多的途徑與渠道。這對于數據統計工作人員以及從事數據統計的學者來講就如同打開了一扇新的大門,同時面臨諸多的機遇和挑戰。
在信息技術高速發展背景下,當今社會已經快步走入大數據時代,并基于大數據技術支持下,能夠更加全面整合分析相關信息,逐步形成了全新而又便利的數據分析方法,這在大數據和統計學之間架設起一條彼此互通的橋梁。大數據技術的普及應用給統計學帶來了巨大變革,并對統計學的發展與提升起到了很大的促進作用,使得統計學未來發展前景越加廣闊。但是與此同時也給統計學帶來了諸多挑戰。
一、大數據時代下統計學概念概述
教科書上對統計學給出了這樣的定義:有效搜集整理分析隨機性數據,對考察問題給出推斷與預測,最終為行動提供數據支持。從根本上看,統計學是一門與數據有關的學科。如美國總統拜登在競選總統過程當中便是基于數據團隊支持下而取得成功的,而馬云在很早的時候就將大數據當作企業發展的重要戰略。步入大數據時代之后,在網絡技術支持下數據收集變得更加便利,傳統設備已經無法容納海量增長的數據信息,必須及時進行設備更新,而運用大數據對相關數據展開全面分析,才能確保信息的有效傳遞,并為推動社會不斷發展提供有效支撐。在當前社會發展進程當中,統計的都是極為重要的內容,如進行商品交換時,統計學發揮的作用更大,利用統計學還能及時掌握市場經濟信息。進入大數據時代,統計工作開展過程中,不能僅僅停留在隨機抽樣調查層面,而應當打破這種傳統統計方式,運用大數據技術手段獲取更為豐富的信息,進而為推動社會發展提供全面詳實的數據參考。
二、大數據時代對于統計學產生的影響
(一) 樣本概念變得更為深化
我們知道統計學離不開樣本,樣本是統計學的重要組成部分,只有保證樣本的有效性,才能將相關情況準確體現出來,在大數據快速發展時代,樣本概念和傳統數據相比出現了很大不同,通常我們得到的諸多網絡數據:一種為靜態網絡數據,即直接在客戶端創建的數據,不用進行提取便可應用,不用投入較多成本。另一種為動態數據,伴隨時間的改變數據也出現相應的變化,樣本也不再僅僅停留于隨機抽取,選定之后便可直接進行分析。
(二)從類型方面看,呈擴大之勢
傳統數據主要為結構化數據,其標準比較固定,而隨著大數據技術的快速發展,數據結構也出現了巨大改變,同時出現大量的異構數據。與此同時,大數據技術也改變了過去的儲存方式,大數據可以直接將探測的信號容納進去,并運用網絡實現不同結構數據的有效識別,并迅速儲存下來。
(三)收集概念得到擴展
過去統計工作開展過程當中,數據收集都是有目的的進行,效率不高,還需要投入較多的成本。而伴隨大數據技術的快速發展,在數據收集過程當中更加的步驟化,做好數據識別及處理工作,在此基礎上進行分析,從中探尋所需的數據,并合理儲存。但是在海量信息面前,必須要對數據的分析與識別給予充分重視,最大程度提高數據精準性與安全性,有效降低成本投入。
(四)數據來源較傳統不同
統計數據收集過程當中,過去都是依照研究目的進行收集,知道數據源,這些數據核對比較簡單。進入大數據時代信息獲取更加便利,而且很多數據無數據源,難以對記錄身份進行識別,所以在數據收集過程中應當充分重視數據源登記。
(五)量化方式發生變化
對于傳統的結構化數據來講,有著比較成熟的量化方式,通過對數據的收集與分析便能獲得結果,然而進入大數據時代,出現大量的異化結構數據難以通過直接分析的形式獲得結果。目前很多專家學者都在對非機構化數據的處理進行研究,進而推動統計學在大數據時代獲得更好發展。
(六)分析思維發生改變
從分析過程看,過去分析數據過程當中都是依照定性、定量以及最終定性的方式進行分析。但是大數據在進行統計分析時,只通過定量、定性便能獲取相應的結果。同時,傳統數據證實分析時都是按照假設證的方式進行分析,然而實踐發現,這種分析方式時常會出現較大誤差。而在大數據技術快速發展背景下,我們的思維為發現—總結,這是整合—發現最終定論的過程,在此過程中會有很多發現。
(七)統計軟件越來越多
過去在統計學開展過程當中主要應用SPSS、SAS、STATA等統計軟件,但隨著大數據的快速發展,主要是基于數據中心為前提,將大數據和軟件有效整合,極大地簡化了分析過程。通過以上分析不難發現,在大數據技術的快速發展背景下,可以更加主動統計,使得統計學在原有基礎上獲得了巨大進步與發展。
三、大數據時代下統計學面臨的挑戰
統計學有著非常久遠的發展歷程,形成了較為成熟的理論基礎,在生產實踐當中發揮的作用也越來越大,統計學的快速發展也深刻地影響到經濟社會的快速發展。但步入大數據時代之后,數據分布狀態呈現海量增長,并以分散式分布,這給統計學帶來了極為深刻的影響。首先大數據的“大”,數據信息現已突破了人們的想象。而大數據當中的“全”,可以使人們更加全面的認識大體量、多樣化的數據,數據樣本和總體彼此間的關系也出現巨大改變。而且多樣化的數據,也使得傳統數據統計主觀訴求出現巨大改變,之前人們進行統計分析過程當中,更多的關注“為什么?”但是大數據時代下的統計更加關注“是什么?”這種改變深刻影響到傳統統計學,推動大數據時代統計學的快速發展已經成為重要發展方向,然而傳統和更新之間彼此仍存在某些不相容的問題,所以在變革過程當中,需要全面綜合考慮各個方面。
第一,通過分析樣本標準不能看出,大數據時代樣本獲取變得更加便利,伴隨網絡技術的快速推進,大樣本標準也有了很大的發展和提升。傳統統計學將界限定在30,大于30為大樣本,小于30為小樣本。進入大數據時代,這個界限就太低了,沒辦法清除干擾信息,這就會給分析結果造成影響。所以,在掌握數據來源的基礎上,還應當對樣本標準做出及時更新,舊的數量可以通過大樣本數量進行替代,進而滿足大數據時代的發展要求。
第二,在選取樣本及其形式方面,傳統的統計學數據結構比較固定,傳統統計學固定結構化數據內藏著一定的統計規律,雖然可以從中了解到研究對象具有的數量關系,然而不是任何事物都存在相應的量化指標,有的指標雖然被量化,但是卻無法將研究對象清晰地解讀出來。在數據采集過程中,過去的統計數據庫難以處理這些數據,但是基于大數據支持下構建非結構數據庫,轉化這些數據,便可將多樣化的分析作用體現出來,這樣就在很大程度上降低了選取樣本的標準,進一步擴大統計范圍。
最后,在開發統計軟件過程當中也面臨著諸多挑戰,隨著大數據技術的快速提升,在分析數據過程中,都是基于數據進行非關系分析,面對海量的數據處理,需要更為合理的快速分析技術。
四、大數據時代下統計學面臨的發展機遇
(一)提升了統計質量
就統計質量而言,主要體現在適用、準確以及時效和平衡等幾個方面,適用主要是確保統計信息與相關要求相符合,統計信息必須要能夠充分滿足客戶需求,而大數據技術手段合理應用可以更加有效地提升適用功能。同時,過去所說的時效性,主要體現在統計所用的時間長短上,運用更短的時間進行統計,確保客戶能夠短時間內獲取統計信息,而基于大數據支持下其時效性更強。準確主要體現在估值和真值是否存在差別,在相應范圍當中數據有一定的誤差存在可視作正常。大數據技術下數據獲取更加全面,同時也有效包容了誤差,使誤差有效減少,提供了數據的真實性。平衡及協調,基于大數據支持下檢驗與核對數據信息,都需要滿足客戶不斷檢查,全面增強數據平衡性。
(二)降低了統計成本
基于數據收集層面進行分析,在大數據技術支持下,打破了過去通過問卷調查以及電話調查等形式進行統計的局面,可以快速利用互聯網完成數據統計,及時、迅速,提高了數據精準性,大大減少了成本投入。而且在利用數據方面,過去的統計數據過期之后,還需要進行行再次抽樣分析,并且信息公布存在很大局限性。大數據技術可以更加便捷地對于數據進行收集,并能反復利用這些數據,大大降低了統計成本。
(三)統計學作用范圍的增大
過去在統計學開展過程當中,時常受觀念、成本等諸多因素影響,經濟學的應用范圍也比較有限。而伴隨大數據時代的快速發展,數據也出現很大變化,可以快速地進行數據傳遞,為社會各行各業做出巨大貢獻,并在推動自身發展的基礎上,更好地服務社會大眾,推動國家建設。
(四)統計學科體系的延伸
將大數據應用于統計學當中,雖然也給統計工作帶來很大挑戰,但其發展機遇也更加廣闊。目前,統計學當中引入的大數據技術,海量的數據深刻影響到統計樣本選取及確定標準。過去簡單的抽樣調查,很難適應當前時代發展要求,所以統計樣本也必須要向著總體統計方向邁進,實現樣本統計和總體統計齊頭并進,有效應對傳統統計工作存在的不足,增強統計工作整體成效。
五、大數據時代下統計學的應對策略
(一)培養復合型人才
傳統的數據統計方法較為簡單,對數據人員的綜合素質要求不高,隨著大數據時代的到來,我國的統計工作變得日益復雜起來,各種類型的數據需要統計人員進行分析和整理,這在無形中增加了數據統計人員的工作量,為了適應新形勢下統計工作發展需求,我國的統計學領域必須重視人才的培養工作,建立一批復合型的人才隊伍,從而滿足大數據時代下統計學對統計人員的要求。當代的統計學人員不僅要具備良好的統計專業知識,還要擁有良好的統計能力以及軟件操作能力,所以相關單位必須要將提高統計學人員的綜合素質放在首位,運用各種形式培養統計人員的操作能力,真正的培養一批復合型的統計學人才隊伍,促進數據統計行業的發展。
(二) 推動統計學和大數據的協同發展
伴隨大數據技術的日益推進,也深刻影響到人們傳統的生產生活方式以及工作方式,受大數據技術影響,統計學必須要做出相應的調整,在開展數據統計工作時,相關的技術人員在掌握數據統計知識的基礎上,應該有效地結合統計學和大數據,通過大數據技術手段來對各種信息進行統計分析,并與統計方法有效結合,充分發揮大數據對統計學的促進作用,為統計學的健康發展提供助力。大數據技術在帶來巨大發展機遇的同時,也帶來了巨大的挑戰,統計學領域的相關人員必須緊跟時代潮流發展趨勢,融入到大數據時代中,促進統計學的發展。
(三)注重統計學的多學科合作
在大數據技術高速發展背景下,無論哪個行業,每天都會有海量的數據產生,單一的傳統學已經不能滿足信息處理的要求,但是在數據統計中,統計人員過分依賴計算機等一些軟件制約了統計學的發展。所以,數據統計學人員不僅要掌握必備的統計學知識,還要積極學習數學知識以及計算機知識,發揮不同學科的優勢,真正實現優勢互補,促進統計學與數學、計算機學科的合作,使統計學工作能夠滿足當下社會和人們生活對統計數據的需求。統計學與數學、計算機學科的合作和融合已經成為促進統計學發展的必由之路,相信在不久的將來,統計學在數學與計算機學科的推動下,將會朝著更加科學化和規范化的方向發展。
結語:
統計學當中數據是核心,也是統計學價值的重要體現,傳統的數據意義在大數據時代出現了巨大改變,數據所蘊含的信息、傳播以及分布速度已經打破了人們的想象,同時也轉變了數據具有的核心意義,因此更需要以大數據技術為支撐,推動統計學的快速發展。雖然統計學在大數據時代面臨諸多機遇和挑戰,但為適應新時期的發展要求,應當緊跟時代發展形勢,及時做出轉變,對大數據時代特征進行充分研究,并將大數據技術引入傳統統計學,這樣才能為統計學的快速發展奠定堅實的基礎。