劉龍祥
(東平明湖中學(xué) 山東 泰安 271000)
奧林匹克運(yùn)動會,簡稱奧運(yùn)會,它是競技體育頂級盛會,引得全世界最頂尖的運(yùn)動員紛紛角逐。其所獲獎牌數(shù)及國家排名不僅是一個國家體育運(yùn)動競技水平的反映,也是國家經(jīng)濟(jì)、政治和綜合實力的體現(xiàn)。面臨即將到來的第三十二屆東京奧運(yùn)會,獎牌榜前十名是大家普遍關(guān)注的話題。
對于奧運(yùn)會獎牌榜預(yù)測方面的研究,國內(nèi)外已有一些學(xué)者對此進(jìn)行了嘗試。較早關(guān)于這方面的研究是以社會學(xué)和經(jīng)濟(jì)學(xué)角度展開的,有Ball[1]、Gimes A R等人。然而直到30年后這方面的理論研究才重新為人所關(guān)注,Shyghart[2]首度重新利用過渡形經(jīng)濟(jì)方法預(yù)測分析了世界各國在奧運(yùn)會上取得的成績,近來Bernard等[3]得出人口數(shù)顯著影響一個國家的奧運(yùn)成績;雷桂成[4]初步提出奧運(yùn)會獎牌與綜合國力的密切聯(lián)系;李力研[5]分析人種特征對運(yùn)動成績優(yōu)劣的影響。
然而在過去的這些研究中,學(xué)者們普遍只采用了時間序列預(yù)測或者多元線性回歸之一的方法,進(jìn)行了單一維度的考量,卻沒有綜合地應(yīng)用多個模型進(jìn)行探究。故此本文綜合地應(yīng)用時間序列模型和多元非線性回歸模型,系統(tǒng)地對該問題展開研究。
首先討論歷屆奧運(yùn)會成績和本次成績的關(guān)系,是研究金牌數(shù)y自身的發(fā)展規(guī)律,可以通過多種現(xiàn)有模型或自建模型來進(jìn)行預(yù)測。一般可以做時間序列分析。時間序列分析的理論基礎(chǔ)為:設(shè)若時間序列(或隨機(jī)過程)的任一元素與其前期元素(等)之間存在著某種關(guān)聯(lián),則我們可以根據(jù)該時間序列的既往觀測值來預(yù)測其未來的取值。本文中應(yīng)用的模型如下描述:
(1)自回歸模型(AR):p階的自回歸模型簡記為AP(p),指的是如下形式的隨機(jī)過程:
其中為待求的參數(shù),p是滯后期限的數(shù)據(jù),而為白噪聲,也就是滿足經(jīng)典計量經(jīng)濟(jì)模型要求的隨機(jī)誤差項。在本文的研究中,首先使用二階的自回歸模型建模,進(jìn)行初步的預(yù)測分析。
(2)自回歸移動平均模型(ARMA):該模型是將自回歸過程AR與移動平均過程MA結(jié)合起來,在數(shù)學(xué)上,我們總可以把一個高階的AR過程分解為某個低階AR和另一個高階AR過程之和,而這個分解出來的高階AR又可以用一個較低階的MA過程來替代,所以原本的隨機(jī)過程可以轉(zhuǎn)化為低階AR過程和低階MA過程之和。一般來說,ARMA(p,q)帶有兩個參數(shù),其中AR(p)為p階自回歸模型,MA(q)為q階移動平均模型。在本文的研究中,使用ARMA(1,1)作為優(yōu)化的時間序列模型,做進(jìn)一步求解。
本文采用的世界各國在歷屆奧運(yùn)會獲得獎牌數(shù)據(jù)來源于中國奧委會官方網(wǎng)站上公布的成績。依照國際奧林匹克委員會的官方排名榜排列,首先衡量金牌枚數(shù)的多少,銀牌次之,最后對比銅牌枚數(shù)。因此筆者在這里只研究對各國家奧運(yùn)會金牌數(shù)的預(yù)測。
本文中筆者將采用自回歸滑動平均模型進(jìn)行預(yù)測,為了模型的精確度,1988,1992年的奧運(yùn)會成績不作為預(yù)測樣本數(shù)據(jù)。最終,選取1996年—2008年作為訓(xùn)練集(即第一組數(shù)據(jù)為1996—1992—1988),2012和2016年作為預(yù)測集。在國家選擇上,選取2016里約奧運(yùn)會金牌榜前三十八名的國家作為研究對象。(第28~38名并列獲取兩枚金牌)
假設(shè)某國家某屆奧運(yùn)會成績主要與此國家在前兩屆奧運(yùn)會中的成績有關(guān)。雖然此論文只研究對金牌數(shù)的預(yù)測,但很明顯,往屆的銀牌數(shù),銅牌數(shù)也與本屆的金牌數(shù)會有關(guān)聯(lián)性。例如,某運(yùn)動員在此屆奧運(yùn)會中獲得銀牌,那么他是有沖擊金牌的潛力的,一個國家本屆奧運(yùn)會獲得銀牌甚至銅牌的人越多,此國運(yùn)動員中下屆可能獲得金牌的人就越多。因此,選取前兩屆的金牌數(shù),銀牌數(shù),銅牌數(shù)作為特征。同時由于歷屆奧運(yùn)會設(shè)置的項目數(shù)不同,每屆奧運(yùn)會的金、銀、銅牌數(shù)也不相同。因此,將獎牌數(shù)全部換算為所占百分比。
通過AR(2)模型的求解和驗證,發(fā)現(xiàn)第t屆的金牌比例,主要受上一屆金銀銅牌比例及上上屆金牌比例的影響。在此基礎(chǔ)上,建立更加完善的ARMA(1,1)模型,并利用MATLAB進(jìn)行求解。以2012年和2016年的奧運(yùn)會金牌數(shù)量作為測試集,可以得到如下結(jié)果:
(1)2012年的預(yù)測結(jié)果序列與真實金牌序列的相關(guān)系數(shù)為0.96422,均方誤差為10.89382;
(2)2016年的預(yù)測結(jié)果序列與真實金牌序列的相關(guān)系數(shù)為0.98327,均方誤差為6.38375。
根據(jù)以往的學(xué)者研究發(fā)現(xiàn),國家綜合實力明顯影響奧運(yùn)會成績。一般來說,國家綜合實力強(qiáng)的國家普遍比綜合實力弱的國家在奧運(yùn)會上取得的成績更好。這里,筆者嘗試用多元非線性回歸來探究它們之間的定量關(guān)系。假設(shè)國家綜合實力可以由以下幾個方面反映
4.1.1 經(jīng)濟(jì)水平 國內(nèi)生產(chǎn)總值(GDP=Gross Domestic Product)是指一個國家(國界范圍內(nèi))所有常駐單位在一定時期內(nèi)生產(chǎn)的所有最終產(chǎn)品和勞務(wù)的市場價值。GDP是國民經(jīng)濟(jì)核算的核心指標(biāo),也是衡量一個國家或地區(qū)總體經(jīng)濟(jì)狀況重要指標(biāo)。
4.1.2 工業(yè)發(fā)展水平 衡量一個國家基礎(chǔ)工業(yè)發(fā)展水平的重要標(biāo)志是鋼鐵工業(yè),因此選用年鋼產(chǎn)量來衡量。通常用來衡量一個國家的石油化學(xué)工業(yè)發(fā)展水平的標(biāo)志是乙烯的產(chǎn)量,因此選用年乙烯的產(chǎn)量來衡量。
4.1.3 科技水平 以各國每年發(fā)表的科技期刊文章數(shù)量作為一個國家科技發(fā)展水平的衡量標(biāo)準(zhǔn)。
4.1.4 國土 國土越廣闊,一般來說,蘊(yùn)含的各種自然資源就越豐富。國土面積的大小是區(qū)分大國小國的主要尺度。可以說國土是一個國家強(qiáng)弱的天然條件。
4.1.5 人口 一個國家的人口越多,它的勞動力越多。人口數(shù)量的多少必定會影響國家的實力。人口越多,潛在的優(yōu)秀運(yùn)動員數(shù)量越多,從而影響金牌的數(shù)量。
4.1.6 基礎(chǔ)設(shè)施 隨著時代的發(fā)展,互聯(lián)網(wǎng)(包括電腦,手機(jī)等上網(wǎng)工具)已經(jīng)成為一些發(fā)展水平較高的國家國民的生活必備。選取每一百人中互聯(lián)網(wǎng)用戶數(shù)量來衡量一個國家基礎(chǔ)設(shè)施的完備水平。
4.2.1 醫(yī)療水平 好的醫(yī)療水平可有效降低運(yùn)動員傷病對其造成的不可逆的影響,以及指導(dǎo)運(yùn)動員以科學(xué)合理的方式進(jìn)行訓(xùn)練。以嬰兒死亡率來衡量醫(yī)療水平。
4.2.2 東道主效應(yīng)與次場效應(yīng) 東道主國家對飲食、氣候、場地、環(huán)境都非常適應(yīng),且東道主國家在觀眾支持程度上有明顯優(yōu)勢。
4.2.3 國家體制 社會主義國家與資本主義國家的政府號召力、對國家資源的整合能力不同,以至于對奧運(yùn)成績有所影響。用虛擬變量Socialism表示,當(dāng)國家為社會主義國家,Socialism=1,否則Socialism=0。
4.2.4 人種與文化傳統(tǒng) 不同的人種體能不同,在不同的運(yùn)動項目上各有優(yōu)勢。而不同的文化傳統(tǒng)導(dǎo)致各國對體育的重視程度不同。
本文使用到的數(shù)據(jù)均來自世界銀行。包括總GDP,人均GDP,人均能源使用量,各國每年發(fā)表的科技期刊文章數(shù)量,國土面積,人口數(shù),每一百人中互聯(lián)網(wǎng)用戶數(shù)量。
綜合以上兩章的模型,在此建立一個更加綜合的預(yù)測模型,即考慮往期奧運(yùn)會成績的因素,又考慮國家綜合實力等方面的五大因素,將模型綜合描述為:
將38個國家的數(shù)據(jù)進(jìn)行訓(xùn)練,對2020年的奧運(yùn)成績做出預(yù)測,最終得到預(yù)測結(jié)果見表1。
總結(jié)前文內(nèi)容,本文先利用時間序列預(yù)測的方法,使用自回歸模型和ARMA模型進(jìn)行預(yù)測,之后利用多元非線性回歸模型,對獎牌的諸多影響因素進(jìn)行了考量。能夠看出,國家的經(jīng)濟(jì)發(fā)展、工業(yè)發(fā)展和人口數(shù)量的提高,都對獎牌的取得有著正面的促進(jìn)作用;同時奧運(yùn)會的成績中,東道主的主場優(yōu)勢不可忽略,社會主義制度本身也會對該國在奧運(yùn)會中的表現(xiàn)有著促進(jìn)作用。

表1 2020年奧運(yùn)會金牌榜預(yù)測結(jié)果
[1] Ball Donald W.Olympic Games Competition:Structural Correlates ofNational Success[J].International Journal of Comparative Sociologu,1972,12:86- 200.
[2] Grimes A Ray,William J.Kelly,Paul H,Rubin. A Socioeconomic Modelof National Olympic Performance[J].Social Science Quarterly,1974,55,777-782.
[3] Levine Ned.Why Do Countries Win Olympic Medals? Some Structural Correlates of Olympic Games Success:1972[J].Sociology and SocialResearch,1974,58:353- 360.
[4]藺銀萍,王建軍.運(yùn)用時間序列法預(yù)測2008 年奧運(yùn)會獎牌數(shù)[J].南京體育學(xué)院學(xué)報,2007,6(1):31- 32.
[5]范珣,齊輝.運(yùn)用趨勢直線外推法預(yù)測2008 年奧運(yùn)會中國獲獎牌數(shù)[J].遼寧體育科技,2007,29(4):57- 58.