王那那 山東省青島市黃島區(qū)黃島街道辦事處
(一)統(tǒng)計(jì)數(shù)據(jù)的規(guī)范性較差。首先,統(tǒng)計(jì)本身具有極強(qiáng)的數(shù)據(jù)依賴性,統(tǒng)計(jì)數(shù)據(jù)的使用對規(guī)范性要求頗高,但是大數(shù)據(jù)環(huán)境下統(tǒng)計(jì)數(shù)據(jù)應(yīng)用的基本數(shù)據(jù)大多為元數(shù)據(jù)。元數(shù)據(jù)是指沒有進(jìn)行數(shù)據(jù)處理的數(shù)據(jù),缺少規(guī)范性,而且元數(shù)據(jù)比較粗糙,可讀性差、解讀難度也比較高;其次,統(tǒng)計(jì)數(shù)據(jù)與大數(shù)據(jù)系統(tǒng)的適配性也是導(dǎo)致統(tǒng)計(jì)數(shù)據(jù)規(guī)范性差的原因之一。大數(shù)據(jù)技術(shù)在數(shù)據(jù)挖掘、開發(fā)以及操作方面的應(yīng)用要求大數(shù)據(jù)與其系統(tǒng)之間具有高度的適配性。如果數(shù)據(jù)與數(shù)據(jù)處理系統(tǒng)之間的適配程度不高,需要找尋適配的數(shù)據(jù)系統(tǒng)進(jìn)行數(shù)據(jù)遷移。因此,如果數(shù)據(jù)系統(tǒng)處理存在費(fèi)用不足、系統(tǒng)崩潰等方面的問題,將對整個(gè)數(shù)據(jù)統(tǒng)計(jì)處理工作帶來巨大的影響。
(二)數(shù)據(jù)的訪問性較弱。大數(shù)據(jù)是互聯(lián)網(wǎng)信息技術(shù)不斷發(fā)展的產(chǎn)物,是信息技術(shù)在網(wǎng)絡(luò)信息時(shí)代的突出表現(xiàn)。隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,大數(shù)據(jù)技術(shù)逐漸被應(yīng)用與社會(huì)生活的各個(gè)方面。一般統(tǒng)計(jì)數(shù)據(jù)的處理流程主要有數(shù)據(jù)審核、匯總、分析、形成報(bào)告等等。但是受到專業(yè)性、制度分化等方面的限制,一些統(tǒng)計(jì)數(shù)據(jù)所需要的數(shù)據(jù)資源很難找尋,基層數(shù)據(jù)的訪問性較差,這也是影響數(shù)據(jù)報(bào)告的一個(gè)重要因素[1]。數(shù)據(jù)訪問性受限使得許多基層數(shù)據(jù)無法充分挖掘其數(shù)據(jù)價(jià)值。當(dāng)前統(tǒng)計(jì)數(shù)據(jù)對數(shù)據(jù)的應(yīng)用更多的停留在數(shù)據(jù)資源的歸整之中,而且還有很多數(shù)據(jù)因?yàn)楸4娌划?dāng)?shù)仍蜻z失,使得數(shù)據(jù)的挖掘與使用價(jià)值大大降低。
(三)數(shù)據(jù)價(jià)值的挖掘較低。大數(shù)據(jù)已從近年來的眾生呼喚迅速成為實(shí)踐現(xiàn)實(shí),大數(shù)據(jù)充斥于各行各業(yè),各個(gè)領(lǐng)域[2]。但是現(xiàn)在基層數(shù)據(jù)依舊存有大量的數(shù)據(jù)未曾充分挖掘其數(shù)據(jù)價(jià)值,很多基層數(shù)據(jù)能夠充分地反應(yīng)全國經(jīng)濟(jì)的發(fā)展情況,各種統(tǒng)計(jì)數(shù)據(jù)能夠反應(yīng)出社會(huì)的各個(gè)方面信息。統(tǒng)計(jì)工作涉及的范圍比較廣,但是因?yàn)閿?shù)據(jù)挖掘方法的限制、數(shù)據(jù)制度上的不連貫以及專業(yè)壁壘限制等等因素的影響,統(tǒng)計(jì)工作很難得到一個(gè)全面深度挖掘。除此之外,缺少多維度的數(shù)據(jù)價(jià)值平臺(tái)也是限制統(tǒng)計(jì)數(shù)據(jù)價(jià)值挖掘的主要因素之一。
(一)數(shù)據(jù)資源的整合與管理。數(shù)據(jù)資源的整合與管理是統(tǒng)計(jì)數(shù)據(jù)的基本工作之一,大數(shù)據(jù)技術(shù)在統(tǒng)計(jì)數(shù)據(jù)中的應(yīng)用主要表現(xiàn)在各類元數(shù)據(jù)的整合與管理。統(tǒng)計(jì)數(shù)據(jù)中的元數(shù)據(jù)不僅僅是一些網(wǎng)絡(luò)數(shù)據(jù),還有一些是來自政府部門統(tǒng)計(jì)中的數(shù)據(jù),比如質(zhì)監(jiān)、工商以及民政等多個(gè)部門的行政數(shù)據(jù)等等。統(tǒng)計(jì)部門利用大數(shù)據(jù)整合技術(shù),將各種資源數(shù)據(jù)整合起來進(jìn)行分析,最后形成清晰、準(zhǔn)確的高質(zhì)量、規(guī)范化統(tǒng)計(jì)數(shù)據(jù)報(bào)告。除此之外,統(tǒng)計(jì)數(shù)據(jù)還利用大數(shù)據(jù)處理平臺(tái)實(shí)現(xiàn)數(shù)據(jù)圖片的清晰化表達(dá),準(zhǔn)確清晰數(shù)據(jù)轉(zhuǎn)換,并根據(jù)不同的元數(shù)據(jù)審核與評估,來監(jiān)控與編碼數(shù)據(jù)管理,提供元數(shù)據(jù)的支撐,解決當(dāng)前許多統(tǒng)計(jì)報(bào)告中數(shù)據(jù)資源不全的問題。
(二)數(shù)據(jù)資源的分析應(yīng)用。分析是大數(shù)據(jù)資源利用的重要環(huán)節(jié),除了基本的數(shù)據(jù)整合之外,統(tǒng)計(jì)數(shù)據(jù)也為用戶提供了數(shù)據(jù)可視化分析與查詢工作。比如從用戶的視角對數(shù)據(jù)進(jìn)行分析挖掘,多維度查詢數(shù)據(jù),對統(tǒng)計(jì)數(shù)據(jù)進(jìn)行分析、挖掘,以此來形成統(tǒng)計(jì)報(bào)告,準(zhǔn)確描述并直接反映社會(huì)生活。目前統(tǒng)計(jì)數(shù)據(jù)應(yīng)用中最常用的數(shù)據(jù)資源分析手段,就是使用R語言,建立多元線性回歸、描述性統(tǒng)計(jì)以及隨機(jī)等數(shù)據(jù)分析方法,為數(shù)據(jù)報(bào)告的形成提供分析接口,彌補(bǔ)統(tǒng)計(jì)數(shù)據(jù)的一些不足之處。模型式的數(shù)據(jù)表達(dá)更為直觀、清晰,且具有可讀性。除此之外,大數(shù)據(jù)環(huán)境下的統(tǒng)計(jì)工作還能夠根據(jù)統(tǒng)計(jì)用戶的不同需求制定數(shù)據(jù)圖表,并導(dǎo)出符合用戶需求的格式文件。
(三)數(shù)據(jù)資源的共享應(yīng)用。作為一種無形財(cái)富,統(tǒng)計(jì)數(shù)據(jù)不會(huì)因?yàn)橐环匠钟卸鴮?dǎo)致另一方利益受損,全球經(jīng)濟(jì)一體化在統(tǒng)計(jì)數(shù)據(jù)上得到了很好的體現(xiàn),統(tǒng)計(jì)數(shù)據(jù)已成為了一種可以共享交換的資源[3]。大數(shù)據(jù)時(shí)代,數(shù)據(jù)不再是一個(gè)個(gè)孤立的存在,互聯(lián)網(wǎng)為數(shù)據(jù)提供了一個(gè)整合平臺(tái),互聯(lián)網(wǎng)平臺(tái)上的數(shù)據(jù)以及各種數(shù)據(jù)報(bào)告之間存在共享、互聯(lián)性。大數(shù)據(jù)時(shí)代,各種不同類型的數(shù)據(jù)都能夠在網(wǎng)絡(luò)平臺(tái)上進(jìn)行發(fā)布,除了被應(yīng)用于一些數(shù)據(jù)研究之中,還能夠通過網(wǎng)絡(luò)來獲取一些高質(zhì)量的精準(zhǔn)數(shù)據(jù),促使統(tǒng)計(jì)數(shù)據(jù)的共享利用。
統(tǒng)計(jì)數(shù)據(jù)共享的優(yōu)勢主要表現(xiàn)在以下四個(gè)方面:第一,統(tǒng)計(jì)數(shù)據(jù)共享有助于增進(jìn)公眾與國家各部門之間的信任度,提高政府部門的執(zhí)行力度;第二,統(tǒng)計(jì)數(shù)據(jù)共享有助于提高數(shù)據(jù)搜集的工作效率,降低數(shù)據(jù)搜集的時(shí)間成本,全面地了解數(shù)據(jù)資料,同時(shí)還能夠幫助統(tǒng)計(jì)數(shù)據(jù)做出更為精準(zhǔn)的決策,最大程度地發(fā)揮統(tǒng)計(jì)報(bào)告的價(jià)值,提高社會(huì)公眾的滿意度;第三,統(tǒng)計(jì)數(shù)據(jù)共享有助于提高各個(gè)部門的元數(shù)據(jù)處理與使用,通過對比整理各類數(shù)據(jù),增強(qiáng)數(shù)據(jù)的可信度,提高數(shù)據(jù)質(zhì)量。第四,統(tǒng)計(jì)數(shù)據(jù)共享分為基本數(shù)據(jù)分享和特定數(shù)據(jù)分享兩個(gè)方面,這種分類方式有助于提高特定數(shù)據(jù)的梳理,強(qiáng)化專業(yè)領(lǐng)域數(shù)據(jù)的處理能力,還有助于解決統(tǒng)計(jì)報(bào)告不夠?qū)I(yè)的問題,為統(tǒng)計(jì)工作人員提供更為專業(yè)的數(shù)據(jù)資源,幫助統(tǒng)計(jì)工作人員提供更為精準(zhǔn)、專業(yè)數(shù)據(jù)報(bào)告。
綜上所述,大數(shù)據(jù)時(shí)代,數(shù)據(jù)成為社會(huì)生活的重要元素。本文從大數(shù)據(jù)環(huán)境下統(tǒng)計(jì)數(shù)據(jù)遇到的一些問題入手,并從數(shù)據(jù)資源整理整合、數(shù)據(jù)分析以及數(shù)據(jù)共享三個(gè)方面分析大數(shù)據(jù)環(huán)境下統(tǒng)計(jì)數(shù)據(jù)的應(yīng)用管理。經(jīng)過分析了解到大數(shù)據(jù)技術(shù)在統(tǒng)計(jì)數(shù)據(jù)中的應(yīng)用范圍極廣,雖然存在各種問題,但從整體上來看,仍有很大的發(fā)展前景,值得關(guān)注。