祁冠文
摘 要: 隨著中國(guó)經(jīng)濟(jì)的迅猛發(fā)展,中國(guó)對(duì)外開(kāi)放的程度不斷加深,體現(xiàn)在教育行業(yè)中很顯著的一點(diǎn)便是中國(guó)留學(xué)生人數(shù)增加、規(guī)模擴(kuò)大,掀起了一股留學(xué)熱潮。本文運(yùn)用統(tǒng)計(jì)學(xué)的原理和時(shí)間序列分析的基本理論,選取每年赴美留學(xué)人數(shù)作為觀測(cè)值,對(duì)這一現(xiàn)象進(jìn)行基本的探究和分析,擬構(gòu)建合適的模型,做出科學(xué)的預(yù)測(cè),為定量研究這一社會(huì)現(xiàn)象提供依據(jù)和思路。
關(guān)鍵詞: 時(shí)間序列 ARIMA模型 中國(guó)赴美留學(xué)人數(shù)
一、引言
中國(guó)作為世界上最大的發(fā)展中國(guó)家,正在日新月異地提升其各方面的軟硬實(shí)力。無(wú)論是經(jīng)濟(jì)、政治還是社會(huì)領(lǐng)域,整個(gè)社會(huì)和國(guó)民都在不斷進(jìn)步、發(fā)展,視野和心態(tài)越來(lái)越理性、開(kāi)闊、兼容并包。在教育領(lǐng)域,科學(xué)和技術(shù)日益受到重視,人們對(duì)知識(shí)和學(xué)術(shù)更尊重和推崇,對(duì)政治和經(jīng)濟(jì)的穩(wěn)定進(jìn)步與發(fā)展,知識(shí)的作用都愈發(fā)明顯,知識(shí)經(jīng)濟(jì)甚至可以算老生常談了。
本文在反映留學(xué)熱潮的各種數(shù)據(jù)和信息中,選取了比較具有代表性的——1996年至2012年每年中國(guó)學(xué)生赴美留學(xué)的人數(shù)作為觀察值序列,應(yīng)用課程學(xué)習(xí)的時(shí)間序列分析的理論,對(duì)其進(jìn)行歸納和研究,并以此構(gòu)建ARIMA模型,對(duì)所收集的數(shù)據(jù)進(jìn)行擬合。一方面從更本質(zhì)更基礎(chǔ)的層面上認(rèn)識(shí)時(shí)間序列理論,另一方面對(duì)所學(xué)內(nèi)容做一次基本的實(shí)踐應(yīng)用,并對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)。經(jīng)過(guò)具有代表性的數(shù)據(jù)和模型的構(gòu)建,可以更充分更全面地了解近年的留學(xué)趨勢(shì),對(duì)留學(xué)的形勢(shì)有一個(gè)更客觀的把握。
2.模型的理論基礎(chǔ)
2.1時(shí)間序列分析理論基礎(chǔ)
時(shí)間序列分析是將某種統(tǒng)計(jì)指標(biāo),或在不同時(shí)間的不同數(shù)值,按時(shí)間順序排列起來(lái),以便于研究其發(fā)展變化,并能以此預(yù)測(cè)未來(lái)的一種統(tǒng)計(jì)方法。
在拿到一個(gè)觀察值序列后,首先要對(duì)它的平穩(wěn)性和純隨機(jī)性進(jìn)行檢驗(yàn)。非平穩(wěn)序列,由于它不具有二階矩平穩(wěn)的性質(zhì),因此對(duì)它的統(tǒng)計(jì)分析要周折一些,通常要進(jìn)行進(jìn)一步的檢驗(yàn)、變換或處理,才能確定適當(dāng)?shù)臄M合模型。如果序列平穩(wěn),則進(jìn)行純隨機(jī)檢驗(yàn)。如果序列值彼此之間沒(méi)有任何相關(guān)性,就意味著該序列是一個(gè)沒(méi)有記憶的序列,過(guò)去的行為對(duì)將來(lái)的發(fā)展沒(méi)有絲毫影響,從統(tǒng)計(jì)分析的角度而言,這種序列沒(méi)有任何分析價(jià)值。只有這些序列值之間具有密切的相關(guān)關(guān)系,歷史數(shù)據(jù)對(duì)未來(lái)的發(fā)展有一定影響的序列,才值得我們花時(shí)間挖掘其中的有效信息,預(yù)測(cè)序列的未來(lái)發(fā)展。
2.2模型構(gòu)建的理論基礎(chǔ)
一個(gè)序列經(jīng)過(guò)預(yù)處理被識(shí)別為平穩(wěn)非白噪聲序列,那就說(shuō)明該序列是一個(gè)蘊(yùn)含相關(guān)信息的平穩(wěn)序列。在統(tǒng)計(jì)上,我們通常建立一個(gè)線性模型擬合該序列的發(fā)展,借此提取該序列中的有用信息。ARMA(Auto Regression Moving Average)模型是目前最常用的平穩(wěn)序列擬合模型。
ARMA(p,q)模型的結(jié)構(gòu)為
x■=Φ■+Φ■x■+…+Φ■x■+ε■-θ■ε■-…-θ■ε■Φ■≠0,θ■≠0E(ε■)=0,Var (ε■)=σ■■,E(ε■ε■)=0,s≠tEx ?搖■ε■=0,?坌s 式中,p為自回歸模型的階數(shù),q為移動(dòng)平均模型的階數(shù)。在用ARMA模型擬合觀察值序列時(shí),要根據(jù)樣本自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的性質(zhì)進(jìn)行估計(jì)。這就是模型的識(shí)別過(guò)程即定階過(guò)程。 實(shí)際上,在自然界中絕大部分序列都是非平穩(wěn)的,因而對(duì)非平穩(wěn)序列的分析更普遍、更重要,人們采用的分析方法更多。由確定性導(dǎo)致的非平穩(wěn),通常顯示出非常明顯的規(guī)律性,比如有顯著的趨勢(shì)或者有固定的變化周期,這種規(guī)律性信息通常比較容易提取,而由隨機(jī)因素導(dǎo)致的波動(dòng)則非常難以確定和分析。確定性因素分解方法不能充分提取觀察值序列中的有效信息,導(dǎo)致模型擬合精度不夠理想。隨機(jī)時(shí)序分析方法的發(fā)展彌補(bǔ)了確定性分解方法的不足。差分運(yùn)算具有強(qiáng)大的確定性信息提取能力,許多非平穩(wěn)序列進(jìn)行差分運(yùn)算后會(huì)顯示出平穩(wěn)序列的性質(zhì),這時(shí)我們稱(chēng)這個(gè)非平穩(wěn)序列為差分平穩(wěn)序列。對(duì)差分平穩(wěn)序列可以使用ARIMA(Auto Regressive Integrated Moving Average)模型擬合。 ARIMA(p,d,q)模型的結(jié)構(gòu)為 Φ(B)?犖■x■=Θ(B)ε■E(ε■)=0,Var (ε■)=σ■■,E(ε■ε■)=0,s≠tEx ?搖■ε■=0,?坌s 其中,Φ(B)=1-Φ■B-Φ■B■-…-Φ■B■為平穩(wěn)可逆ARMA(p,q)模型的自回歸系數(shù)多項(xiàng)式;?犖■=(1-B)■,d表示x■的差分階數(shù);Θ(B)=1-θ■B-θ■B■-…-θ■B■為平穩(wěn)可逆ARMA(p,q)模型的移動(dòng)平滑系數(shù)多項(xiàng)式。ARIMA模型的實(shí)質(zhì)就是差分運(yùn)算與ARMA模型的組合。這說(shuō)明任何非平穩(wěn)序列只要通過(guò)適當(dāng)階數(shù)的差分運(yùn)算實(shí)現(xiàn)差分后平穩(wěn),就可以對(duì)差分后序列進(jìn)行ARMA模型擬合。 3.結(jié)語(yǔ) 社會(huì)科學(xué)文獻(xiàn)出版社近日發(fā)布的《國(guó)際人才藍(lán)皮書(shū):中國(guó)留學(xué)發(fā)展報(bào)告》顯示,2012年中國(guó)出國(guó)留學(xué)人數(shù)已占全球人數(shù)的14%,而成為全球輸出留學(xué)生最多的國(guó)家?!斑M(jìn)入新世紀(jì)以來(lái),最突出的新情況就是自費(fèi)出國(guó)群體激增,低齡化、大眾化、選擇多樣化、地域分布廣,專(zhuān)業(yè)選擇更實(shí)用,出國(guó)方式更多”。中國(guó)與全球化研究中心主任王輝耀如是總結(jié)。在全球教育水平發(fā)展各異的各個(gè)國(guó)家中,美國(guó)以其最權(quán)威的學(xué)術(shù)水平、最高端的科研能力及匯集了頂尖的名校、教授和人才的特征成為對(duì)中國(guó)學(xué)生最有吸引力的國(guó)家。美國(guó)是我們研究留學(xué)發(fā)展趨勢(shì)最有代表性的國(guó)家。近幾年中國(guó)赴美國(guó)留學(xué)人數(shù)激增,成為美國(guó)第一國(guó)際生源國(guó)。自中美兩國(guó)建交以來(lái),美國(guó)成為中國(guó)開(kāi)展教育對(duì)外交流最重要的國(guó)家。 留學(xué)的大潮勢(shì)必會(huì)對(duì)未來(lái)的國(guó)際國(guó)內(nèi)形勢(shì)造成巨大影響。隨著出國(guó)留學(xué)從精英教育向大眾教育的轉(zhuǎn)變,留學(xué)會(huì)越來(lái)越受到各界的關(guān)注。不斷升溫的“留學(xué)熱”不僅是中國(guó)社會(huì)發(fā)展的必然結(jié)果,還是加快中國(guó)發(fā)展進(jìn)程的積極力量。 本文確定了一個(gè)較合適的ARIMA模型,對(duì)歷年赴美留學(xué)人數(shù)進(jìn)行了相對(duì)簡(jiǎn)單的擬合和預(yù)測(cè),定量分析了留學(xué)發(fā)展的基本情勢(shì)。但是留學(xué)的“大眾化”只是近一二十年才日漸顯著的,數(shù)據(jù)明顯不足。時(shí)間序列分析可以提供一種分析思路。眾多留學(xué)機(jī)構(gòu)、部門(mén)及專(zhuān)家學(xué)者都是基于非常有限的信息,但通過(guò)更復(fù)雜、全面的數(shù)據(jù)與模型對(duì)今后數(shù)年的留學(xué)人數(shù)做了更科學(xué)的估計(jì)與預(yù)測(cè)。2013年后,每當(dāng)新的一年的留學(xué)生數(shù)據(jù)產(chǎn)生的,本模型可以不斷修正、完善,并因觀測(cè)值的增加而具備更精準(zhǔn)的預(yù)測(cè)能力,從而得出更有價(jià)值的預(yù)測(cè)結(jié)果。 參考文獻(xiàn): [1]王燕.應(yīng)用時(shí)間序列分析[M].北京:中國(guó)人民大學(xué)出版社,2008. [2]王輝耀.中國(guó)留學(xué)發(fā)展報(bào)告(2012)[M].北京:社會(huì)科學(xué)文獻(xiàn)出版社,2012:37-47. [3]鄧暉,崔琦,賈遠(yuǎn)琨.出國(guó)留學(xué)人數(shù)激增莘莘學(xué)子究竟為了啥[N].中國(guó)改革報(bào),2012-10-17(4).