付文婧


目前很多高校會(huì)利用體育健康測(cè)試成績(jī)得出學(xué)生體質(zhì)健康及格率,并且該成績(jī)會(huì)直接納入學(xué)生全面素質(zhì)教育發(fā)展體系。但是傳統(tǒng)大學(xué)生體育健康標(biāo)準(zhǔn)測(cè)試所得成績(jī)?nèi)源嬖谝欢ǖ娜藶橐蛩氐挠绊憽H绾胃纳迫藶橐蛩赜绊懀⑼ㄟ^利用統(tǒng)計(jì)方法和模型更新大學(xué)生體育健康標(biāo)準(zhǔn)測(cè)試是本研究需要解決的問題。
1 具體分析過程
1.1 研究對(duì)象及指標(biāo)
以中北大學(xué)材料科學(xué)與工程學(xué)院380名女生為總樣本量,評(píng)價(jià)指標(biāo)為體育測(cè)試的6項(xiàng)指標(biāo):肺活量X1,立定跳遠(yuǎn)X2,坐位體前屈X3,50mX4,800mX5,1min仰臥起坐X6。
1.2 數(shù)據(jù)預(yù)處理及描述性分析
將380個(gè)總體單元編碼,進(jìn)行簡(jiǎn)單隨機(jī)抽樣(總體N中任意抽取n個(gè)個(gè)體為樣本,各樣本被抽中的概率相等),最后抽取樣本量為30個(gè)(Excel隨機(jī)生成編號(hào)),重新編號(hào)后即為本次的研究對(duì)象。由于X5,X6為逆向指標(biāo),令X5=100/S800,X4=1/S50(S為800m和50m用時(shí),單位:秒),便于分析。
通過描述性統(tǒng)計(jì)分析得出,肺活量(X1)方差最大(為2142),說明該指標(biāo)在各樣本之間差距最大;而50m的方差(0.098)小于1,說明樣本50m成績(jī)之間相差不大。肺活量X1和立定跳遠(yuǎn)X2(130.0)方差排在第一第二,是學(xué)生體測(cè)成績(jī)之間較好的區(qū)分指標(biāo)。
1.3 因子分析的適用性
因子分析是指研究從變量群中提取共性因子的統(tǒng)計(jì)技術(shù)。利用KMO系數(shù)檢驗(yàn)和Bartlett的球形度檢(KMO系數(shù)需大于0.5,球形檢驗(yàn)顯著性需小于0.05)可判定是否適合使用因子分析模型。進(jìn)行因子旋轉(zhuǎn),利用旋轉(zhuǎn)后的因子載荷按照所含信息的百分比提取公因子(所含信息量稱為信息貢獻(xiàn)率一般需要大于70%,否則不適合用此方法進(jìn)行因子提取),選取旋轉(zhuǎn)載荷碎石圖特征值大于1的公因子即為樣本最后分類數(shù)。
利用SPSS進(jìn)行數(shù)據(jù)分析,結(jié)果顯示KMO(0.732)>0.7,球形檢驗(yàn)顯著性(<0.000)<0.05,通過相關(guān)系數(shù)矩陣檢驗(yàn)。因子間相關(guān)系數(shù)基本都>0.3,說明30個(gè)樣本間存在較強(qiáng)的相關(guān)關(guān)系,適合做因子分析。通過因子分析旋轉(zhuǎn)提取出的兩個(gè)因子F1和F2(碎石圖特征值分別為2.683和1.167,圖一所示)用來代替原來6個(gè)指標(biāo)解釋學(xué)生體育測(cè)試水平,提取的信息總量(累計(jì)貢獻(xiàn)率)為77.168%,含有較大的信息量。
通過旋轉(zhuǎn)后的成分矩陣,得出因子對(duì)初始6項(xiàng)指標(biāo)的解釋程度,F(xiàn)1對(duì)指標(biāo)立定跳遠(yuǎn)X2、50mX4、800mX5和1min仰臥起坐X6解釋程度較大,F(xiàn)2對(duì)指標(biāo)肺活量X1和坐位體前屈X3的解釋程度較大。命名第一因子為運(yùn)動(dòng)型因子(F1),第二因子為素質(zhì)型因子(F2)。利用得分方程函數(shù)公式:
(i為提取公因子個(gè)數(shù),j為原有因子個(gè)數(shù),a為旋轉(zhuǎn)矩陣系數(shù)),利用旋轉(zhuǎn)后成分矩陣得到系數(shù),最終得分方程如下:
F1=0.228X1+0.606X2+03606X3+0.855X4+0.832X5+0.864X6
F2=0.789X1-0.1X2-0.688X3+0.221X4-0.1X5-0.029X6
根據(jù)共因子得分,以特征值所占比例為權(quán)數(shù)(權(quán)重分別為0.697,0.303),計(jì)算綜合因子得分。計(jì)算公式為:
將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化后,因子得分的平均值為0,故離0越遠(yuǎn)因子得分越突出。綜合得分后得到優(yōu)、良、中、差四個(gè)等級(jí),得分由差到優(yōu)分別為:(-∞,-1),(-1,0),(0,1)和(1,∞)。對(duì)比初始測(cè)試標(biāo)準(zhǔn)的成績(jī),得出5個(gè)差異較大的異常值如表二所示。主要原因?yàn)椋?5號(hào)樣本由于在運(yùn)動(dòng)型因子方面得分較低,所以在新的標(biāo)準(zhǔn)中該因子得分較低;而10號(hào)、12號(hào)、18號(hào)由于在運(yùn)動(dòng)型因子上得分較高,故綜合得分較高。可以看出,運(yùn)動(dòng)型因子是第一因子,因子貢獻(xiàn)率為54.723%,遠(yuǎn)高于素質(zhì)型因子,所以在統(tǒng)計(jì)標(biāo)準(zhǔn)測(cè)試中占主導(dǎo)地位。
1.4 結(jié)果驗(yàn)證
1.4.1 K均值聚類法檢驗(yàn)
由于事先定好分組為四組,故采用K均值聚類法(提前設(shè)定分類個(gè)數(shù)利用程序進(jìn)行自動(dòng)分類),可以做到把體育素質(zhì)水平相當(dāng)?shù)膶W(xué)生分到一組,通過各組成員的強(qiáng)弱勢(shì)進(jìn)行不同的訓(xùn)練,使得學(xué)生的身體素質(zhì)進(jìn)一步提高。
結(jié)果如表三所示,第一類是兩種因子中得分都不高的人,平均得分不超過-1.7分,說明在目前的體育測(cè)試中沒有該個(gè)體的優(yōu)勢(shì)項(xiàng),因此她們需要加強(qiáng)體育鍛煉;第二類素質(zhì)型因子得分相對(duì)較低的人,(F2平均得分不超過1)說明她們的體育測(cè)試的得分低的原因是由于肺活量X1和坐位體前屈X3成績(jī)不夠好。建議需要運(yùn)動(dòng)后進(jìn)行適當(dāng)?shù)厥嬲购屠欤部梢酝ㄟ^適當(dāng)增加有氧運(yùn)動(dòng)時(shí)間提高成績(jī);第三類是以運(yùn)動(dòng)型因子的六項(xiàng)指標(biāo)得分較低群體,(F1平均得分不超過-1)她們?cè)谠擃愋蜏y(cè)試中成績(jī)較差,可以適當(dāng)?shù)赜?xùn)練自己的爆發(fā)力,例如進(jìn)行規(guī)律的有氧運(yùn)動(dòng)訓(xùn)練等等;第四類是兩項(xiàng)因子得分都不錯(cuò)的人,平均得分超過2.29分,她們主要要做的是適當(dāng)?shù)腻憻挘€(wěn)定水平即可。
1.4.2 貝葉斯判別
貝葉斯判別的思想就是判斷給定的X屬于i類還是j類,即判別X進(jìn)入上述兩類的概率大小。根據(jù)貝葉斯判別,得出后驗(yàn)概率P(Gi|Xk)和P(Gj|Xk)進(jìn)行比較,在X相等條件下發(fā)生Gi時(shí)的P值大,則歸為Gi類,反之,歸為Gj類。進(jìn)行誤判的平均損失利用公式:
30個(gè)樣本的聚類正確率為93.33%,判別結(jié)果誤差較低,僅有個(gè)別樣本在聚類的過程中判斷失誤。誤判的是16號(hào)(L12)、26號(hào)(L21)。可能是由于肺活量方差太大,而在這樣的情況下,得分情況受到其他指標(biāo)影響占比較小;并且在兩類因子中存在相關(guān)關(guān)系,可能存在兩類測(cè)試成績(jī)得分都不高的樣本的綜合得分不會(huì)很差,同理,某類因子下測(cè)試得分高但綜合起來得分低也是有可能的。
2 結(jié)語
本文通過對(duì)中北大學(xué)材料科學(xué)與工程學(xué)院30名女生的體測(cè)成績(jī)進(jìn)行試分析,發(fā)現(xiàn)體測(cè)的6項(xiàng)指標(biāo)可以分為兩類因子:運(yùn)動(dòng)型因子和素質(zhì)型因子。并且發(fā)現(xiàn)運(yùn)動(dòng)型因子的成績(jī)會(huì)在更大程度上影響樣本的總體體測(cè)成績(jī)。
運(yùn)用多元統(tǒng)計(jì)分析大學(xué)生體育標(biāo)準(zhǔn)測(cè)試成績(jī)減少了人為地賦予權(quán)重的因素影響,它可以突出每個(gè)學(xué)生在某幾個(gè)因子下的得分情況,有助于更好地提高體測(cè)成績(jī)。但因子分析較為繁瑣,測(cè)評(píng)時(shí)間較長(zhǎng),對(duì)測(cè)評(píng)人的專業(yè)要求也比較嚴(yán)格。但可以通過編程進(jìn)行數(shù)據(jù)錄入和計(jì)算簡(jiǎn)化程序。由于這六項(xiàng)指標(biāo)的量綱差距過大,導(dǎo)致大家很容易誤解將某一項(xiàng)作為決定性因素。并且,身高體重指標(biāo)是一個(gè)適中指標(biāo),很難把它放進(jìn)因子分析中,最好的方法是人為賦予權(quán)重,這也是筆者認(rèn)為目前統(tǒng)計(jì)因子分析對(duì)體育測(cè)試綜合評(píng)價(jià)最不足的地方。由于不可抗因素,很多個(gè)體沒有參加體測(cè)或者沒有被抽出作為測(cè)試樣本,數(shù)據(jù)存在一定誤差,不排除因子個(gè)數(shù)會(huì)增加或者權(quán)重改變。
(作者單位:拉夫堡大學(xué)體育管理專業(yè))