陳雪如 鄖陽(yáng)中學(xué)
統(tǒng)計(jì)工作其實(shí)就是搜集數(shù)據(jù)、整理數(shù)據(jù)、分析數(shù)據(jù)和解釋數(shù)據(jù)的系統(tǒng)性過(guò)程,統(tǒng)計(jì)學(xué)離開(kāi)數(shù)據(jù)就失去了研究的價(jià)值;同理,數(shù)據(jù)離開(kāi)統(tǒng)計(jì)學(xué)就只是簡(jiǎn)單的數(shù)字,失去價(jià)值。只有利用統(tǒng)計(jì)學(xué)的原理與方法對(duì)數(shù)據(jù)加以整理、分析,才能提高數(shù)據(jù)精確度、適用度,發(fā)揮數(shù)據(jù)的價(jià)值。但在大數(shù)據(jù)時(shí)代,統(tǒng)計(jì)學(xué)迎來(lái)機(jī)遇與挑戰(zhàn),必須加強(qiáng)分析和探究。
在大數(shù)據(jù)時(shí)代要用辯證的、發(fā)展的眼光看待統(tǒng)計(jì)學(xué),在大數(shù)據(jù)思想框架下建立新的統(tǒng)計(jì)學(xué)科體系。大數(shù)據(jù)時(shí)代的總體統(tǒng)計(jì)思想與方法延伸統(tǒng)計(jì)學(xué)科體系,如統(tǒng)計(jì)學(xué)結(jié)合樣本統(tǒng)計(jì)與總體統(tǒng)計(jì),樣本統(tǒng)計(jì)要求樣本正確代表總體,因而總體必須觀察同質(zhì)單位,這種理想情況在現(xiàn)實(shí)中很難達(dá)到,以大數(shù)據(jù)為基礎(chǔ)的總體統(tǒng)計(jì)正好彌補(bǔ)樣本統(tǒng)計(jì)的不足。
大數(shù)據(jù)時(shí)代代表傳統(tǒng)分析、核算單個(gè)計(jì)算機(jī)所存儲(chǔ)數(shù)據(jù)的統(tǒng)計(jì)方法,突破單個(gè)計(jì)算機(jī)數(shù)據(jù)限制,基于移動(dòng)硬盤(pán)匯聚整理眾多計(jì)算機(jī)中存儲(chǔ)的數(shù)據(jù),形成新的數(shù)據(jù)流環(huán)境,實(shí)現(xiàn)對(duì)冗雜分散數(shù)據(jù)的集中分析與處理,提高數(shù)據(jù)統(tǒng)計(jì)效率。隨著數(shù)據(jù)類(lèi)型的持續(xù)增多,適用的統(tǒng)計(jì)方法也越來(lái)越多,統(tǒng)計(jì)學(xué)在大數(shù)據(jù)技術(shù)的支持下逐漸走上分類(lèi)、高效的數(shù)據(jù)分析處理道路[1]。
大數(shù)據(jù)時(shí)代促進(jìn)各行各業(yè)的信息數(shù)據(jù)化變革與更新,影響人們學(xué)習(xí)、工作與生活的方方面面,報(bào)表與數(shù)據(jù)的網(wǎng)絡(luò)搜索查詢(xún)技術(shù)能提高人們采集數(shù)據(jù)、利用數(shù)據(jù)的效率,拓寬有效的統(tǒng)計(jì)數(shù)據(jù)獲取渠道,使人們享受極大的便利。預(yù)處理則體現(xiàn)出統(tǒng)計(jì)學(xué)隨機(jī)抽樣調(diào)查和沉淀處理冗雜非標(biāo)準(zhǔn)數(shù)據(jù),主要分為清洗、矯正和填補(bǔ)這三個(gè)階段,保證在存儲(chǔ)數(shù)據(jù)的過(guò)程中將無(wú)效數(shù)據(jù)篩選出來(lái),同時(shí)增強(qiáng)統(tǒng)計(jì)數(shù)據(jù)庫(kù)的相互聯(lián)系,大大提高數(shù)據(jù)的傳遞與共享效率。
在觀念、成本等的傳統(tǒng)因素的影響下,統(tǒng)計(jì)學(xué)主要在行業(yè)統(tǒng)計(jì)、部門(mén)統(tǒng)計(jì)中發(fā)揮作用,服務(wù)于政策的制定、服務(wù)的完善。但統(tǒng)計(jì)學(xué)在大數(shù)據(jù)時(shí)代不僅有助于快速拓展統(tǒng)計(jì)領(lǐng)域,還在醫(yī)學(xué)、金融、計(jì)算機(jī)等學(xué)科發(fā)揮作用。如數(shù)據(jù)分析,數(shù)學(xué)和計(jì)算機(jī)一樣,都是統(tǒng)計(jì)分析工具,數(shù)學(xué)夯實(shí)統(tǒng)計(jì)學(xué)的理論基礎(chǔ),計(jì)算機(jī)使統(tǒng)計(jì)分析更便捷,復(fù)雜的數(shù)據(jù)處理問(wèn)題得到解決,在豐富統(tǒng)計(jì)學(xué)發(fā)展內(nèi)涵的同時(shí)擴(kuò)大統(tǒng)計(jì)學(xué)的作用范圍。
在過(guò)去,統(tǒng)計(jì)學(xué)大多停留在應(yīng)用抽樣技術(shù)、建模和模式分析等層面,這樣的方式在大數(shù)據(jù)時(shí)代不再適用于統(tǒng)計(jì)需求,信息量龐大和數(shù)據(jù)的多元化發(fā)展導(dǎo)致統(tǒng)計(jì)方法被限制在范圍內(nèi)的數(shù)據(jù)掃描分析當(dāng)中。與此同時(shí),樣本統(tǒng)計(jì)依舊占據(jù)重要地位,在大數(shù)據(jù)時(shí)代難以提高統(tǒng)計(jì)數(shù)據(jù)的精確度。統(tǒng)計(jì)學(xué)主要是基于篩選的數(shù)據(jù)研究數(shù)量間以及數(shù)量特征的關(guān)系,考察樣本統(tǒng)計(jì)數(shù)據(jù)的價(jià)值決定著樣本的選取性、標(biāo)準(zhǔn)性,然而大數(shù)據(jù)增加確定樣本標(biāo)準(zhǔn)性和選取樣本的難度,統(tǒng)計(jì)學(xué)也因此迎來(lái)巨大挑戰(zhàn)。
在大數(shù)據(jù)時(shí)代,人們面對(duì)繁多的、冗雜的數(shù)據(jù),需要了解數(shù)據(jù)的表面意思,注重分析產(chǎn)生數(shù)據(jù)的原因和數(shù)據(jù)的特征,這就使傳統(tǒng)統(tǒng)計(jì)學(xué)遇到難題,必須創(chuàng)新原有統(tǒng)計(jì)方法,滿(mǎn)足人們的需求。龐大的數(shù)據(jù)量超乎人們想象,其分散性、多樣性的特征給選取數(shù)據(jù)造成巨大困難,在收集樣本數(shù)據(jù)時(shí)遇到選取范圍廣、難度系數(shù)高、標(biāo)準(zhǔn)界定不清等問(wèn)題[2]。另外,隨著電子信息產(chǎn)生越來(lái)越多的數(shù)據(jù),網(wǎng)絡(luò)數(shù)據(jù)沒(méi)有可以遵循的規(guī)律,統(tǒng)計(jì)學(xué)的數(shù)據(jù)卻具備結(jié)構(gòu)性、邏輯性,在樣本選取中很容易丟失有價(jià)值的數(shù)據(jù),樣本存在偏頗,造成損失。
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)信息是核心,統(tǒng)計(jì)學(xué)的發(fā)展要從中汲取動(dòng)力,產(chǎn)生大量統(tǒng)計(jì)數(shù)據(jù)分析需求。傳統(tǒng)統(tǒng)計(jì)方法無(wú)法繼續(xù)適應(yīng)大數(shù)據(jù)時(shí)代的數(shù)據(jù)特點(diǎn),要求統(tǒng)計(jì)學(xué)要基于大數(shù)據(jù)的特點(diǎn),從滿(mǎn)足及服務(wù)于各領(lǐng)域的需求出發(fā),推進(jìn)數(shù)據(jù)分析理論和方法的創(chuàng)新發(fā)展。如在大數(shù)據(jù)時(shí)代要注意結(jié)合統(tǒng)計(jì)思維和信息技術(shù),因?yàn)榻y(tǒng)計(jì)技術(shù)對(duì)龐大的數(shù)據(jù)量特別是囊括諸多非結(jié)構(gòu)化數(shù)據(jù)而言是遠(yuǎn)遠(yuǎn)不夠的,首要問(wèn)題就是計(jì)算,只有密切結(jié)合統(tǒng)計(jì)技術(shù)和信息技術(shù),才能提高計(jì)算效率,促進(jìn)統(tǒng)計(jì)學(xué)和大數(shù)據(jù)的融合。
統(tǒng)計(jì)學(xué)是一門(mén)注重實(shí)踐操作的學(xué)科,在學(xué)習(xí)統(tǒng)計(jì)學(xué)的知識(shí)時(shí)必須夯實(shí)基礎(chǔ),掌握好基礎(chǔ)知識(shí),更要形成良好思維,掌握的數(shù)據(jù)的收集、統(tǒng)計(jì)和整理方法、技巧,培養(yǎng)專(zhuān)業(yè)統(tǒng)計(jì)思維,以便在大數(shù)據(jù)時(shí)代正確分辨所需數(shù)據(jù),分析數(shù)據(jù)的關(guān)聯(lián)性及相關(guān)數(shù)據(jù)。總之,大數(shù)據(jù)時(shí)代穩(wěn)步推進(jìn)統(tǒng)計(jì)學(xué)的改革和發(fā)展,人們面臨更高的要求,提高統(tǒng)計(jì)思維、整合統(tǒng)計(jì)學(xué)與先進(jìn)的網(wǎng)絡(luò)信息技術(shù)、智能技術(shù)勢(shì)在必行,從容應(yīng)對(duì)挑戰(zhàn),提高樣本選取與數(shù)據(jù)分析的精確度,抓住機(jī)遇大力發(fā)展統(tǒng)計(jì)學(xué)。