999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中國(guó)大數(shù)據(jù)與統(tǒng)計(jì)學(xué)發(fā)展的需求預(yù)測(cè)模型

2017-03-30 00:07:24林揚(yáng)嘯
現(xiàn)代經(jīng)濟(jì)信息 2017年1期
關(guān)鍵詞:大數(shù)據(jù)

林揚(yáng)嘯

摘要:大數(shù)據(jù)是21世紀(jì)的熱點(diǎn)話題之一,統(tǒng)計(jì)學(xué)是傳統(tǒng)的數(shù)據(jù)分析學(xué)科。利用百度指數(shù)提供的“用戶關(guān)注度”功能,本文選取2012年-2016年5年260周的百度周平均搜索指數(shù)為研究對(duì)象,以百度搜索指數(shù)來(lái)反映社會(huì)關(guān)注熱度,研究大數(shù)據(jù)與統(tǒng)計(jì)學(xué)關(guān)注熱度之間有無(wú)相關(guān)性,以及大數(shù)據(jù)搜索指數(shù)發(fā)展的趨勢(shì)變化。根據(jù)圖形分析與相關(guān)系數(shù)的計(jì)算,可知大數(shù)據(jù)與統(tǒng)計(jì)學(xué)搜索熱度呈現(xiàn)正相關(guān)關(guān)系,該關(guān)系線性程度不大,多為非線性關(guān)系。根據(jù)大數(shù)據(jù)的季平均搜索指數(shù)、每四周平均搜索指數(shù)的變化趨勢(shì)研究表明,大數(shù)據(jù)搜索指數(shù)不存在明顯季節(jié)性,存在明顯的正趨勢(shì)性;其搜索熱度自2012年初至2015年2季度以來(lái)呈明顯上升趨勢(shì),其后增長(zhǎng)速率放緩,呈現(xiàn)更為顯著的波動(dòng)性,由此可知2015年2季度為其明顯的一個(gè)轉(zhuǎn)折點(diǎn),符合其發(fā)展趨勢(shì)的模型有修正指數(shù)模型,以及龔珀茲曲線模型和皮爾曲線模型這兩個(gè)生長(zhǎng)曲線模型,結(jié)果顯示三個(gè)模型的擬合度均較理想,其中龔珀茲曲線的擬合度最高。根據(jù)擬合結(jié)果,從大數(shù)據(jù)搜索指數(shù)反映的社會(huì)關(guān)注熱度來(lái)看,大數(shù)據(jù)搜索指數(shù)的發(fā)展已趨于飽和趨勢(shì),其飽和值為4300左右。

關(guān)鍵詞:大數(shù)據(jù);統(tǒng)計(jì)學(xué);百度指數(shù);趨勢(shì)外推

中圖分類號(hào):F27 文獻(xiàn)識(shí)別碼:A 文章編號(hào):1001-828X(2017)001-0000-02

引言

現(xiàn)代社會(huì),數(shù)據(jù)量呈爆炸式增長(zhǎng)趨勢(shì),數(shù)據(jù)已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)。2012年以來(lái),大數(shù)據(jù)一詞越來(lái)越多地被提及,人們用它來(lái)描述和定義信息爆炸時(shí)代產(chǎn)生的海量數(shù)據(jù),并命名與之相關(guān)的技術(shù)發(fā)展與創(chuàng)新。而統(tǒng)計(jì)學(xué)作為傳統(tǒng)的數(shù)據(jù)分析方法,在擁有海量數(shù)據(jù)的現(xiàn)代社會(huì)既有著巨大的機(jī)遇,但由于大數(shù)據(jù)突破了傳統(tǒng)統(tǒng)計(jì)學(xué)關(guān)于樣本和總體界定等等限制,也對(duì)傳統(tǒng)統(tǒng)計(jì)學(xué)的分析方法提出了前所未有的沖擊和挑戰(zhàn)。在現(xiàn)實(shí)生活中,并沒(méi)有一門基于大數(shù)據(jù)的專業(yè)產(chǎn)生,各大企業(yè)往往通過(guò)招收統(tǒng)計(jì)學(xué)、計(jì)算機(jī)、數(shù)學(xué)等相關(guān)專業(yè)的人才來(lái)滿足其大數(shù)據(jù)分析工作的要求,盡管如此,關(guān)于大數(shù)據(jù)的熱門是否捧熱了統(tǒng)計(jì)學(xué)之類的相關(guān)學(xué)科的說(shuō)法一直眾說(shuō)紛紜;此外經(jīng)過(guò)了幾年的對(duì)大數(shù)據(jù)關(guān)注的大熱,市場(chǎng)逐漸對(duì)其回歸理性,甚至出現(xiàn)了“大數(shù)據(jù)泡沫”這樣的質(zhì)疑聲音。本文借助百度搜索指數(shù),對(duì)2012年-2015年每一周大數(shù)據(jù)、統(tǒng)計(jì)學(xué)兩詞條的反映其關(guān)注熱度的搜索指數(shù)進(jìn)行定性、定量分析,實(shí)現(xiàn)以下目的:

觀察從百度搜索指數(shù)中反映出的人們對(duì)于大數(shù)據(jù)、統(tǒng)計(jì)學(xué)度的變化趨勢(shì),了解在人們關(guān)注度方面二者有無(wú)相關(guān)性、有怎樣的相關(guān)性,即大數(shù)據(jù)的大熱有沒(méi)有帶來(lái)統(tǒng)計(jì)學(xué)關(guān)注度的變化。

通過(guò)建立統(tǒng)計(jì)模型,觀察大數(shù)據(jù)關(guān)注熱度5年來(lái)的變化,了解現(xiàn)實(shí)中其在關(guān)注度發(fā)展過(guò)程中所處的階段,即現(xiàn)實(shí)中對(duì)大數(shù)據(jù)的關(guān)注依然處于上升階段還是已經(jīng)趨于飽和。采用定量、定性結(jié)合的分析方法,將統(tǒng)計(jì)學(xué)和大數(shù)據(jù)的搜索指數(shù)時(shí)間序列作線圖,并計(jì)算線性相關(guān)系數(shù),觀察兩者的變化規(guī)律,并計(jì)算兩者有無(wú)線性相關(guān)關(guān)系。為滿足消除隨機(jī)性波動(dòng)和保留足夠數(shù)據(jù)量的需要,分別計(jì)算大數(shù)據(jù)搜索指數(shù)的每四周、每季度加權(quán)平均值。觀察圖形有無(wú)季節(jié)性、周期性波動(dòng);觀察圖形是否存在轉(zhuǎn)折點(diǎn),以此為基礎(chǔ)選擇統(tǒng)計(jì)模型。根據(jù)圖形識(shí)別的結(jié)果,建立可能的統(tǒng)計(jì)模型,并通過(guò)比較R方值的方法來(lái)選擇適當(dāng)?shù)哪P汀?/p>

一、中國(guó)統(tǒng)計(jì)學(xué)發(fā)展與大數(shù)據(jù)發(fā)展的相關(guān)性分析

用橫坐標(biāo)表示周次,縱坐標(biāo)表示搜索指數(shù),將大數(shù)據(jù)和統(tǒng)計(jì)學(xué)的搜索指數(shù)時(shí)間序列在一個(gè)圖中分別做折線圖,從圖像中可以看出,57周以前,統(tǒng)計(jì)學(xué)的搜索熱度大于大數(shù)據(jù)的搜索熱度,57周以后,大數(shù)據(jù)搜索熱度逐漸超過(guò)統(tǒng)計(jì)學(xué)搜索熱度。90周之后,大數(shù)據(jù)和統(tǒng)計(jì)學(xué)的變動(dòng)趨勢(shì)呈現(xiàn)一定的相似性,例如都在214周時(shí)達(dá)到谷值,而后回升。在178周大數(shù)據(jù)搜索達(dá)到峰值,182周統(tǒng)計(jì)學(xué)搜索量達(dá)到峰值,在此期間統(tǒng)計(jì)學(xué)的增長(zhǎng)略落后于大數(shù)據(jù)的增長(zhǎng),但是分布的形狀大體一致。

2.季平均值線性相關(guān)系數(shù)=0.292112357

結(jié)果分析:兩組數(shù)據(jù)的線性相關(guān)程度都不高,其中季平均線性相關(guān)系數(shù)略高于周平均線性相關(guān)系數(shù)。說(shuō)明大數(shù)據(jù)與統(tǒng)計(jì)學(xué)的搜索指數(shù)之間并不存在明顯的線性相關(guān)關(guān)系,但是從圖中看出二者變化趨勢(shì)具有相似性,因此猜測(cè)二者可能具有某種非線性相關(guān)關(guān)系。

因?yàn)橄嚓P(guān)關(guān)系并不等于因果關(guān)系,因此對(duì)于如上結(jié)果我們做出兩種假設(shè):

在90周以后,統(tǒng)計(jì)學(xué)的分布類似并且略落后于大數(shù)據(jù)的增長(zhǎng),這可能是由于人們對(duì)于大數(shù)據(jù)的關(guān)注,引發(fā)了人們對(duì)于統(tǒng)計(jì)學(xué)這個(gè)相關(guān)學(xué)科的關(guān)注。

兩者類似的分布形態(tài),可能是由于全國(guó)所有用戶搜索頻次的周期性、隨機(jī)性變動(dòng)所引致的,大數(shù)據(jù)、統(tǒng)計(jì)學(xué)搜索指數(shù)變動(dòng)之間并沒(méi)有直接的因果關(guān)系。

二、中國(guó)大數(shù)據(jù)需求量預(yù)測(cè)模型

由于原始數(shù)據(jù)有260周,波動(dòng)性過(guò)大,為了得到更為準(zhǔn)確的結(jié)論,我們僅對(duì)其按每季度、每四周兩種方式計(jì)算加權(quán)平均值得到的時(shí)間序列作討論,其目的是(1)平滑隨機(jī)波動(dòng);(2)判定按每季度和每四周平均哪個(gè)有季節(jié)性;(3)每季度平均更能反映長(zhǎng)期趨勢(shì),但數(shù)據(jù)較少,只能以季為單位預(yù)測(cè)未來(lái)值;每四周平均的數(shù)據(jù)較多,且可以進(jìn)行更短期的預(yù)測(cè)。

1.季節(jié)性、趨勢(shì)性的判定

(a)圖形判別法

建立按季平均和按每四周平均的橫坐標(biāo)為季度或周次,縱坐標(biāo)為搜索指數(shù)的折線圖,按季節(jié)平均、按每四周平均,大數(shù)據(jù)搜索指數(shù)都不存在明顯的季節(jié)性;另外由于后一年的值往往大于前一年的值,因此可以判定其存在趨勢(shì)性。

(b)建立一元線性回歸方程并檢驗(yàn)顯著性

季平均值:;

每四周平均值:;

由于兩個(gè)時(shí)間序列一元線性回歸的R2均顯著,所以大數(shù)據(jù)搜索指數(shù)顯然存在線性趨勢(shì)。

結(jié)論:上述過(guò)程從圖形和計(jì)算兩個(gè)角度得出了以下結(jié)論:大數(shù)據(jù)搜索指數(shù)并不存在明顯的季節(jié)性,不適合使用時(shí)間序列分解法;大數(shù)據(jù)搜索指數(shù)存在明顯的趨勢(shì),一元回歸有較好的擬合優(yōu)度,但是一元回歸使用的前提是時(shí)間序列不存在明顯的轉(zhuǎn)折點(diǎn),為了進(jìn)一步確定更好的擬合模型,我們繼續(xù)如下討論。

2.轉(zhuǎn)折點(diǎn)的判定

作橫坐標(biāo)為季度,縱坐標(biāo)為搜索指數(shù)的折線圖,可以看出,2015年2季度為一個(gè)明顯的轉(zhuǎn)折點(diǎn),在這之前,類似于線性一元增長(zhǎng);在之后,2015年3季度僅為3989,2015年4季度僅為4015,并無(wú)太大增長(zhǎng),此后呈現(xiàn)下降上升交替出現(xiàn)的形式。

3.模型選擇結(jié)論

因?yàn)椴淮嬖谠诿黠@的季節(jié)性,所以不選擇時(shí)間序列分解模型;又因?yàn)橛忻黠@的轉(zhuǎn)折點(diǎn),所以不應(yīng)對(duì)所有數(shù)據(jù)采取一元回歸的方式;搜索指數(shù)的變化類似于先增長(zhǎng)后穩(wěn)定,符合上述條件的模型有:

(1)修正指數(shù)模型;(2)龔珀茲曲線模型;(3)皮爾曲線模型。

4.模型的建立

基于matlab軟件,模型擬合結(jié)果如下:

(1)修正指數(shù)模型:

特點(diǎn):該模型00時(shí),以增長(zhǎng)速度遞減的方式遞減。t趨于無(wú)窮大時(shí)a為其極限。

(a)每季平均值:。保留兩位小數(shù)后得到如下預(yù)測(cè)函數(shù):

當(dāng)t趨于無(wú)窮大時(shí),搜索指數(shù)趨近于6389.78。

(b)每四周平均值:。保留兩位小數(shù)后得到如下預(yù)測(cè)函數(shù):

當(dāng)t趨于無(wú)窮大時(shí),搜索指數(shù)趨近于6650.56。

每期預(yù)測(cè)值原始數(shù)據(jù)見(jiàn)附表4。

(2)龔珀茲曲線模型:

特點(diǎn):屬于生長(zhǎng)曲線模型,形狀類似于S形,可以描述并判斷事物經(jīng)歷的發(fā)生、發(fā)展到成熟的過(guò)程。

(a)每季平均值

5.模型比較

每季平均R2值,修正指數(shù)曲線模型為0.9516,龔珀茲曲線模型為0.9582,皮爾曲線模型為0.9539;每四周平均R2值,三者分別為0.902、0.9075、0.9033。

三個(gè)模型的R2均達(dá)到了顯著性水平,可知模型擬合度很高,其中按每季平均計(jì)算的擬合優(yōu)度,由于平滑了更多的隨機(jī)性因素,擬合度都大于按每四周平均計(jì)算的擬合優(yōu)度。龔珀茲曲線模型的R2值最高,其次是皮爾曲線模型,再次是修正指數(shù)曲線模型。

結(jié)果分析:大數(shù)據(jù)搜索指數(shù)不存在季節(jié)性,但存在明顯的周期性。從2012年以來(lái),其搜索指數(shù)呈快速遞增趨勢(shì),2015年2季度左右以后,其增速放緩,逐漸呈現(xiàn)飽和趨勢(shì)。在飽和度的預(yù)測(cè)方面,修正指數(shù)t無(wú)窮大的條件難以實(shí)現(xiàn),我們主要根據(jù)后兩個(gè)模型進(jìn)行判定,得到了大數(shù)據(jù)搜索指數(shù)已經(jīng)趨于飽和,并且飽和值位于4200-4600左右的結(jié)論,即市場(chǎng)對(duì)于大數(shù)據(jù)搜索的熱度,已經(jīng)從狂熱趨于理性。

參考文獻(xiàn):

[1]耿直.大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)面臨的機(jī)遇與挑戰(zhàn)[J].統(tǒng)計(jì)研究,2014,31(1):5-9.

[2]云舟工作室.MATLAB6數(shù)學(xué)建模基礎(chǔ)教程[M].北京:人民郵電出版社,2001.

[3]曹挺.統(tǒng)計(jì)學(xué)是新世紀(jì)具有輝煌前景的學(xué)科[N].中國(guó)信息報(bào),2002.

猜你喜歡
大數(shù)據(jù)
基于在線教育的大數(shù)據(jù)研究
“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
基于大數(shù)據(jù)的小微電商授信評(píng)估研究
大數(shù)據(jù)時(shí)代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數(shù)據(jù)在出版業(yè)的應(yīng)用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯(lián)網(wǎng)+”對(duì)傳統(tǒng)圖書出版的影響和推動(dòng)作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
主站蜘蛛池模板: 免费观看精品视频999| 国产亚洲视频中文字幕视频| 国产成人三级在线观看视频| 欧美精品在线视频观看| 2020亚洲精品无码| 91精品免费久久久| 亚洲欧美一区二区三区麻豆| 亚洲人成人伊人成综合网无码| 国产一级精品毛片基地| 国产成人一区| 福利国产在线| 国产成人无码久久久久毛片| 日韩123欧美字幕| 免费99精品国产自在现线| 国产成人综合亚洲欧美在| 久久99国产综合精品女同| 久久精品电影| 亚洲综合18p| 亚洲综合狠狠| 亚洲丝袜中文字幕| 91偷拍一区| 91精品啪在线观看国产60岁| 无码国产伊人| 97视频免费在线观看| 91成人在线免费观看| 亚洲精品欧美重口| 国产亚洲精久久久久久久91| 色亚洲成人| 无码高潮喷水专区久久| 婷婷亚洲最大| 国产一区免费在线观看| 国产91视频免费| 国产麻豆另类AV| 天天色天天综合网| 国产美女精品一区二区| 香蕉eeww99国产在线观看| 国产精品女主播| 日韩午夜片| 免费全部高H视频无码无遮掩| 在线观看国产网址你懂的| 精品久久久久久成人AV| 天天综合亚洲| 久久久久国产精品嫩草影院| 日韩高清在线观看不卡一区二区| 日韩 欧美 国产 精品 综合| 欧美a级完整在线观看| 天天综合网色| 国产在线日本| 欧美在线视频不卡第一页| 亚洲第一在线播放| 亚洲精品视频在线观看视频| 成人精品免费视频| 亚洲国产成人无码AV在线影院L| 亚洲精品日产AⅤ| 欧美另类精品一区二区三区| 国产呦视频免费视频在线观看 | 亚洲精品手机在线| 免费一级α片在线观看| 精品国产一区二区三区在线观看 | 欧美激情视频二区三区| 国产香蕉一区二区在线网站| 亚洲区一区| 国产婬乱a一级毛片多女| 国产h视频在线观看视频| 在线中文字幕网| 欧美日韩另类在线| 国产成+人+综合+亚洲欧美| 日韩毛片基地| 综合人妻久久一区二区精品 | 婷婷99视频精品全部在线观看| 国产黄色片在线看| 午夜视频日本| av在线无码浏览| 中文字幕精品一区二区三区视频| 久久精品国产亚洲AV忘忧草18| 国产特级毛片aaaaaa| 日本人妻一区二区三区不卡影院| 99青青青精品视频在线| aaa国产一级毛片| 国产嫖妓91东北老熟女久久一| 久久香蕉国产线看精品| 久久黄色一级片|