郭海兵
[摘 要] 大數(shù)據(jù)的時(shí)代背景下,統(tǒng)計(jì)學(xué)專業(yè)迎來(lái)了機(jī)遇,同時(shí)也面臨著巨大的挑戰(zhàn)。結(jié)合大數(shù)據(jù)分析的特點(diǎn),分別從培養(yǎng)目標(biāo)的定位、信息技術(shù)教育的提升以及實(shí)踐教育的增強(qiáng)這三個(gè)角度,探討統(tǒng)計(jì)學(xué)專業(yè)教學(xué)改革的方向。
[關(guān) 鍵 詞] 大數(shù)據(jù);統(tǒng)計(jì)學(xué);全數(shù)據(jù)模式;樣本數(shù)據(jù)
[中圖分類號(hào)] G642 [文獻(xiàn)標(biāo)志碼] A [文章編號(hào)] 2096-0603(2016)31-0184-02
目前,“大數(shù)據(jù)”已經(jīng)逐漸成為了婦孺皆知的熱詞。雖然大數(shù)據(jù)的精確概念是在2009年前后提出來(lái),并于2012年開(kāi)始流行,然而對(duì)于大數(shù)據(jù)技術(shù)的應(yīng)用早已開(kāi)展。例如,沃爾瑪公司通過(guò)銷售數(shù)據(jù)分析,對(duì)關(guān)聯(lián)商品組合促銷,提升銷售量;谷歌公司通過(guò)用戶的搜索關(guān)鍵詞,能夠快速地定位流行疾病的病源地。并且隨著互聯(lián)網(wǎng)技術(shù)的進(jìn)步,各種大數(shù)據(jù)技術(shù)的成功案例層出不窮。美國(guó)政府在2012年3月發(fā)布的《大數(shù)據(jù)研究和發(fā)展倡議》,把大數(shù)據(jù)稱作“未來(lái)社會(huì)發(fā)展的新石油”,把發(fā)展大數(shù)據(jù)研究提到國(guó)家戰(zhàn)略的高度上來(lái)。2015年,《中國(guó)大數(shù)據(jù)發(fā)展調(diào)查報(bào)告》表明近幾年來(lái)我國(guó)大數(shù)據(jù)市場(chǎng)價(jià)值接近40%的速度在增長(zhǎng),2015年達(dá)到了115.4億元。全球化的背景下,大數(shù)據(jù)已經(jīng)走進(jìn)了每一個(gè)角落,正在給我們的政府管理、企業(yè)運(yùn)行和信息獲取創(chuàng)造價(jià)值和機(jī)遇;與此同時(shí),也對(duì)我們的生活、學(xué)習(xí)和工作提出了變革要求。
作為一門收集整理數(shù)據(jù),并結(jié)合數(shù)學(xué)模型進(jìn)行量化分析,進(jìn)而作出推斷預(yù)測(cè)的學(xué)科,統(tǒng)計(jì)學(xué)是一門綜合性和應(yīng)用性比較強(qiáng)的學(xué)科。這一屬性十分契合大數(shù)據(jù)分析的要求,因此大數(shù)據(jù)時(shí)代的到來(lái),推動(dòng)了統(tǒng)計(jì)專業(yè)的快速發(fā)展。近年來(lái),很多的新興院校都相繼開(kāi)設(shè)了統(tǒng)計(jì)專業(yè),統(tǒng)計(jì)學(xué)專業(yè)正在面臨一個(gè)繁榮期。然而,就像一把雙刃劍,大數(shù)據(jù)給統(tǒng)計(jì)學(xué)專業(yè)騰飛和發(fā)展榮幸了機(jī)遇,與此同時(shí),也對(duì)傳統(tǒng)的統(tǒng)計(jì)學(xué)的教育和教學(xué)提出了迫切的變革需求。
一、大數(shù)據(jù)在統(tǒng)計(jì)分析中的新特點(diǎn)
(一)數(shù)據(jù)收集方式的改變
在傳統(tǒng)的統(tǒng)計(jì)中,數(shù)據(jù)的收集是通過(guò)人為對(duì)樣本的屬性進(jìn)行逐一采集、整理,形成一系列橫平豎直的結(jié)構(gòu)化數(shù)據(jù),然后利用這些樣本信息,進(jìn)行描述分析、統(tǒng)計(jì)推斷。然而,現(xiàn)代的信息技術(shù)使得樣本數(shù)據(jù)的收集實(shí)現(xiàn)了信息化和自動(dòng)化。例如,通過(guò)爬蟲(chóng)程序直接抓取互聯(lián)網(wǎng)數(shù)據(jù),工業(yè)生產(chǎn)中的傳感器獲取的數(shù)據(jù)等等。另外,數(shù)據(jù)的形式呈現(xiàn)出多樣化,除了傳統(tǒng)的表格數(shù)據(jù),還有諸如文本數(shù)據(jù)、音頻數(shù)據(jù)和視頻數(shù)據(jù)等。這就需要在統(tǒng)計(jì)專業(yè)學(xué)生培養(yǎng)過(guò)程中,一方面重視信息收集方式的教學(xué);另一方面做好多維數(shù)據(jù)處理技術(shù)的傳授工作。
(二)樣本數(shù)據(jù)模式和全數(shù)據(jù)模式
傳統(tǒng)統(tǒng)計(jì)中,由于數(shù)據(jù)收集能力的限制,很多時(shí)候我們無(wú)法獲取全數(shù)據(jù),只能通過(guò)隨機(jī)樣本,利用少數(shù)的特征對(duì)總體的屬性進(jìn)行統(tǒng)計(jì)推斷。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)獲取的方式和技術(shù)發(fā)生了巨大的變化,人們可以通過(guò)互聯(lián)網(wǎng)、即時(shí)通訊工具以及數(shù)據(jù)庫(kù),獲取各種海量數(shù)據(jù)。面對(duì)這樣的海量數(shù)據(jù),隨機(jī)抽樣不再有太大的意義了。因此,大數(shù)據(jù)背景下,全數(shù)據(jù)就是樣本數(shù)據(jù),即樣本就是總體。傳統(tǒng)的統(tǒng)計(jì)分析重點(diǎn)是,通過(guò)樣本信息預(yù)測(cè)總體的特征屬性,大數(shù)據(jù)分析更加側(cè)重于發(fā)現(xiàn)海量數(shù)據(jù)下的各種關(guān)聯(lián)細(xì)節(jié)。
(三)模型分析的弱化
傳統(tǒng)的統(tǒng)計(jì)中,側(cè)重在變量之間建立模型,刻畫(huà)出變量之間的因果關(guān)系,而相關(guān)分析只是作為進(jìn)行模型分析之前,進(jìn)行數(shù)據(jù)探索的一個(gè)小小的手段而已。然而,在大數(shù)據(jù)中,數(shù)據(jù)的結(jié)構(gòu)復(fù)雜,變量眾多,體量較大,有時(shí)候很難用一個(gè)“普世”函數(shù)描述出變量之間的準(zhǔn)確關(guān)系。無(wú)法綜合評(píng)價(jià)出變量之間關(guān)系的情況下,我們可以部分揭示出變量之間的關(guān)系。事實(shí)上,由于相關(guān)分析無(wú)需太多的模型假設(shè),運(yùn)算成本較低等眾多原因,使得相關(guān)關(guān)系的分析成為大數(shù)據(jù)分析的基礎(chǔ)。
(四)模型的復(fù)雜性和精確性難以量化平衡
傳統(tǒng)的統(tǒng)計(jì)學(xué)處理的數(shù)據(jù),都是在時(shí)間和空間設(shè)定的情況下結(jié)構(gòu)化的數(shù)據(jù)。在數(shù)據(jù)的處理上遵循數(shù)據(jù)清洗整理,利用經(jīng)典統(tǒng)計(jì)模型,在設(shè)定的精度范圍里對(duì)總體的特征進(jìn)行推斷和分析。這樣的過(guò)程中,模型的復(fù)雜度和精確度,都可以在我們事先設(shè)定的情況下進(jìn)行。然而,在大數(shù)據(jù)背景下,一方面,數(shù)據(jù)的收集過(guò)分依賴技術(shù)手段,很難進(jìn)行人為的精度控制。另一方面,數(shù)據(jù)的來(lái)源無(wú)論是空間上還是時(shí)間上都更加復(fù)雜,格式多樣,這就使得數(shù)據(jù)前期的清洗處理變得非常困難,由于存在系統(tǒng)性的偏差,很難將全部的雜質(zhì)項(xiàng)從數(shù)據(jù)中萃取掉。在秉持“數(shù)據(jù)多比少好”的情況下,就得接受數(shù)據(jù)混亂和不確定性的代價(jià)。在大數(shù)據(jù)中忽略一部分模型的精確性,并不是說(shuō)不要模型的精確性,而是指我們對(duì)于模型的精確性的可控性在減弱。
二、統(tǒng)計(jì)專業(yè)教學(xué)改革的方向
時(shí)代的發(fā)展、技術(shù)的進(jìn)步對(duì)于統(tǒng)計(jì)學(xué)專業(yè)提出更高的期望和要求,結(jié)合統(tǒng)計(jì)學(xué)專業(yè)現(xiàn)有教學(xué)體系中存在的問(wèn)題,給出了統(tǒng)計(jì)學(xué)專業(yè)教學(xué)改革的方向。
(一)培養(yǎng)目標(biāo)的定位
過(guò)去國(guó)內(nèi)對(duì)于統(tǒng)計(jì)專業(yè)定位是分割成諸如經(jīng)濟(jì)統(tǒng)計(jì)、數(shù)理統(tǒng)和其他的統(tǒng)計(jì)幾個(gè)類別。學(xué)校的招生過(guò)程也是按照這樣的幾個(gè)類別進(jìn)行招生。這就使得學(xué)生的培養(yǎng)被固定在幾個(gè)人為設(shè)定的格子里,湮滅了各個(gè)知識(shí)之間的交叉結(jié)構(gòu)。自從統(tǒng)計(jì)學(xué)專業(yè)被升格為一級(jí)學(xué)科之后,這種狀況有所改善。隨著大數(shù)據(jù)的出現(xiàn),統(tǒng)計(jì)分析技術(shù)的服務(wù)范圍已經(jīng)不再局限于諸如學(xué)術(shù)廟堂、政府部門以及高端公司等這樣的精英圈子;普通的社會(huì)機(jī)構(gòu)、企業(yè)和工廠等各行各業(yè)對(duì)統(tǒng)計(jì)專業(yè)產(chǎn)生了迫切需求。
因此,在統(tǒng)計(jì)學(xué)專業(yè)的定位上,應(yīng)該摒棄傳統(tǒng)的簡(jiǎn)單分割成經(jīng)濟(jì)統(tǒng)計(jì)和數(shù)理統(tǒng)計(jì)的理念。大數(shù)據(jù)背景下,統(tǒng)計(jì)學(xué)作為一項(xiàng)分析工具,需要與其他專業(yè)做好銜接和服務(wù)工作,培養(yǎng)多元化的分析人才。在統(tǒng)計(jì)學(xué)專業(yè)培養(yǎng)目標(biāo)的定位上,應(yīng)該充分考慮統(tǒng)計(jì)分析的工具性,促進(jìn)統(tǒng)計(jì)專業(yè)與各自優(yōu)勢(shì)學(xué)科的交叉和融合,形成“多元化”的培養(yǎng)目標(biāo)。既能培養(yǎng)出理論分析的精英人才,也能培養(yǎng)出簡(jiǎn)單數(shù)據(jù)管理者。
(二)統(tǒng)計(jì)理論和信息技術(shù)的平衡
傳統(tǒng)的統(tǒng)計(jì)學(xué)專業(yè)的課程體系中,專業(yè)主干課程圍繞數(shù)理基礎(chǔ)、統(tǒng)計(jì)分析以及信息技術(shù)這樣的幾塊。通常偏重的統(tǒng)計(jì)理論側(cè)重于數(shù)理邏輯課程的教學(xué);而側(cè)重與統(tǒng)計(jì)應(yīng)用相關(guān)的內(nèi)容(如經(jīng)濟(jì)統(tǒng)計(jì))側(cè)重于統(tǒng)計(jì)分析的課程教學(xué)。這樣的安排都忽略了對(duì)統(tǒng)計(jì)專業(yè)學(xué)生進(jìn)行信息技術(shù)的培養(yǎng)??v觀整個(gè)數(shù)據(jù)分析的流程,從最初的數(shù)據(jù)收集,數(shù)據(jù)的分析和結(jié)論,都是離不開(kāi)信息技術(shù)的支持。特別是大數(shù)據(jù)分析,無(wú)論是硬件上面還是軟件上面,都對(duì)數(shù)據(jù)分析的參與者提出了很高的要求。
因此無(wú)論是傳統(tǒng)的經(jīng)濟(jì)統(tǒng)計(jì),還是數(shù)理統(tǒng)計(jì),掌握一定的信息技術(shù)是一個(gè)必要的條件。這需要在課程設(shè)置上,既要引入適當(dāng)?shù)挠布矫妫惨訌?qiáng)軟件的教育。以往統(tǒng)計(jì)學(xué)專業(yè)的軟件教學(xué)主要以SPSS、Eview等這類封裝好了,以體驗(yàn)式為主的統(tǒng)計(jì)軟件。對(duì)于這類軟件無(wú)論是在處理數(shù)據(jù)的體量上,還是處理數(shù)據(jù)方式的靈活度上,都無(wú)法適應(yīng)大數(shù)據(jù)分析的需求。在軟件教學(xué)方面,培養(yǎng)學(xué)生一定的編程能力是非常必要的,相比于機(jī)械的拖拽軟件分析數(shù)據(jù),編程分析更加靈活,能夠激活數(shù)據(jù)分析者的主動(dòng)性和創(chuàng)造性。
(三)實(shí)踐教學(xué)模式的創(chuàng)新
近年來(lái),隨著對(duì)統(tǒng)計(jì)專業(yè)應(yīng)用性認(rèn)識(shí)的不斷加深,很多學(xué)校對(duì)實(shí)踐教學(xué)環(huán)節(jié)也是越來(lái)越重視,在課程的設(shè)計(jì)上增加了實(shí)踐環(huán)節(jié)的比重。但是相比于數(shù)量上的提升,實(shí)踐環(huán)節(jié)的質(zhì)量依然還有很大的提升空間。尤其是在大數(shù)據(jù)的背景下,很多實(shí)踐環(huán)節(jié)過(guò)分側(cè)重人工數(shù)據(jù)采集和局部樣本信息的分析。主要表現(xiàn)在這些方面:(1)數(shù)據(jù)的收集手段上,沒(méi)有充分使用現(xiàn)代信息技術(shù)方法。例如,有些學(xué)校的教學(xué)實(shí)踐中,還是停留在讓學(xué)生上街發(fā)放問(wèn)卷的階段;稍好一點(diǎn)的學(xué)校運(yùn)用了諸如問(wèn)卷星這樣網(wǎng)上問(wèn)卷的形式。而大數(shù)據(jù)背景下,這種獲取的數(shù)據(jù)有方式,無(wú)論是在數(shù)量還是質(zhì)量方面都是相對(duì)不足。我們需要讓學(xué)生在數(shù)據(jù)獲取能力方面適當(dāng)進(jìn)行提升,例如,加以適當(dāng)?shù)呐嘤?xùn),讓學(xué)生掌握一些網(wǎng)絡(luò)上爬取數(shù)據(jù)的技術(shù)。(2)傳統(tǒng)的模型驅(qū)動(dòng)的實(shí)踐內(nèi)容,在一定程度上不適應(yīng)大數(shù)據(jù)分析原則。傳統(tǒng)的實(shí)踐課程中,側(cè)重運(yùn)用模型去揭示數(shù)據(jù)之間的關(guān)系,并且相應(yīng)的表現(xiàn)在我們的評(píng)價(jià)體系上,過(guò)分強(qiáng)調(diào)了模型的合理性和正確性。大數(shù)據(jù)分析應(yīng)該基于數(shù)據(jù)出發(fā),通過(guò)一些技術(shù)手段來(lái)揭示數(shù)據(jù)之間的關(guān)系;有的時(shí)候很難在大數(shù)據(jù)之間建立模型,或者很難建立一個(gè)現(xiàn)有的模型。實(shí)踐教學(xué)過(guò)程中,讓學(xué)生形成數(shù)據(jù)至上的理念,也就是在分析過(guò)程中盡量讓模型去適應(yīng)數(shù)據(jù),而不是基于一些改造手段,讓數(shù)據(jù)去適應(yīng)模型。(3)除了學(xué)校的項(xiàng)目實(shí)習(xí),積極鼓勵(lì)學(xué)生走出學(xué)校,獲取實(shí)習(xí)機(jī)會(huì)。校外實(shí)習(xí)接觸的問(wèn)題更實(shí)際,既能檢驗(yàn)學(xué)生的學(xué)習(xí)效果,也能激發(fā)學(xué)生的學(xué)習(xí)興趣,從而實(shí)現(xiàn)教學(xué)相長(zhǎng)。
大數(shù)據(jù)時(shí)代的到來(lái),成就了統(tǒng)計(jì)學(xué)專業(yè)的繁華,統(tǒng)計(jì)專業(yè)的發(fā)展也必將會(huì)推動(dòng)大數(shù)據(jù)輝煌。“繁華落盡處,互為渡舟人?!备鞣N現(xiàn)象的隨機(jī)性、不確定性,掩蓋了萬(wàn)物之間錯(cuò)綜復(fù)雜的關(guān)系,統(tǒng)計(jì)方法能夠幫我們撥云見(jiàn)日??茖W(xué)在發(fā)展,技術(shù)在進(jìn)步,一成不變的東西終將會(huì)走出歷史的舞臺(tái),統(tǒng)計(jì)學(xué)專業(yè)也不例外,培養(yǎng)方式的改革迫在眉睫。
參考文獻(xiàn):
[1]王忠.美國(guó)推動(dòng)大數(shù)據(jù)技術(shù)發(fā)展的戰(zhàn)略價(jià)值及啟示[J].中國(guó)發(fā)展觀察,2012(6).
[2]中國(guó)大數(shù)據(jù)發(fā)展調(diào)查報(bào)告[R].北京:中國(guó)信息通信研究院,2015.
[3]耿直.大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)面臨的機(jī)遇與挑戰(zhàn)[J].統(tǒng)計(jì)研究,2014(11).
[4]劉春杰.大數(shù)據(jù)時(shí)代對(duì)當(dāng)代統(tǒng)計(jì)學(xué)教育的挑戰(zhàn)[J].統(tǒng)計(jì)與決策,2015(8).
[5]邱東,李子奈,肖紅葉.經(jīng)濟(jì)學(xué)類專業(yè)統(tǒng)計(jì)學(xué)、計(jì)量經(jīng)濟(jì)學(xué)課程教學(xué)現(xiàn)狀調(diào)研報(bào)告[J].中國(guó)大學(xué)教學(xué),2007(11).