王麗麗 王增輝
(吉林農業大學信息技術學院,吉林 長春 130118)
應用SPSS軟件對速滑直道技術足底峰值壓強數據的主成分分析
王麗麗 王增輝
(吉林農業大學信息技術學院,吉林 長春 130118)
根據體育統計方法中的主成分分析方法的原理,應用SPSS軟件,對速度滑冰直道技術中產生的足底壓強峰值數據進行主成分分析,為提高速度滑冰訓練的有效性提供科學依據。
體育統計;主成分分析;SPSS軟件
體育統計是體育實踐中數據分析的重要工具,在體育科學化進程中發揮著不可替代的作用。體育統計學的研究應該與運動實踐相結合,為運動實踐提供理論支持與指導。SPSS是英文Statistical Package For Social Science的縮寫,即“社會科學統計軟件包”。目前,它是世界上通用、并具有權威性的統計分析軟件包。雖然它名為“社會科學統計軟件包”,實際上它除了在社會科學領域中發揮巨大作用外,在自然科學的各個領域也得到越來越廣泛的應用。
應用SPSS軟件對速度滑冰運動員直道技術中足底壓強峰值數據進行統計分析,可以更好的比較足底各區域對產生足底壓強的貢獻的大小,為提高速度滑冰訓練的有效性提供科學依據。
2.1文獻資料法
在研究過程中,根據論文的研究目的、研究內容的要求,查閱了有關體育統計學和速度滑冰的多種體育期刊、書籍、網上資料等。
2.2統計處理法
應用SPSS軟件,對6名二級以上運動等級的專門從事速度滑冰訓練的男運動員在速度滑冰直道技術中產生的足底壓強數據進行主成分分析,并分析得到的結果。
3.1總體主成分的定義
設X=(X1,X2,…Xp)T為p維隨機向量,其協方差矩陣為Cov(X)=∑=E[(X-E(X))( X-E(X))T]它是一個p階非負定方陣。按照主成分分析的思想,首先構造X1,X2,…Xp的線性組合
Y1=a1TX= a11X1+ a12X2+…+ a1pXp
確定a1=(a11,a12,…,a1p)T,使得Var(Y1)= Var(a1TX)=a1T∑a1達到最大。但必須對a1加以限制,否則Var(Y1)無界。在約束條件a1Ta1=1之下,求a1使得Var(Y1)達到最大。Y1=a1TX稱為X的第一主成分。
如果第一主成分Y1在a1方向上分散性不足以反映原變量的分散性,則在構造X1,X2,…Xp的線性組合
Y2=a2TX= a21X1+ a22X2+…+ a2pXp
為使Y1和Y2所反映的信息不重疊,要求Y1與Y2不相關,即Cov(Y1,Y2)=0,在約束條件a2Ta2=1之下,求a2使得Var(Y2)達到最大。Y2=a2TX稱為X的第二主成分。
一般地,如果 Y1,Y2,…,Yk-1在a1不足以反映原變量的信息,則在構造X1,X2,…Xp的線性組合
Yk=a2kTX= ak1X1+ ak2X2+…+ akpXp
在約束條件a2Ta2=1及Cov(Yk,Yi)=0(i=1,2,…k-1)之下,求ak使得Var(Yk)達到最大。Yk=akTX稱為X的第k個主成分。
按上述方法,我們最多可以構造出p個方差大于零的主成分。
3.2貢獻率
貢獻率反映了該主成分提供的信息量占總信息量的百分比。P個變量可得到p×p的相關陣,最多可得p個特征值。由小到大給出即:λ1,λ2…λp
則第k個主成分的貢獻率為:
前m個主成分的累計貢獻率反映了前m個主成分合起來提供的信息量占總信息量的百分比。通常取累計貢獻率85%或特征值1的前幾個主成分。
3.3主成分分析結果
為了進行以后的分析,我們把足底不同區域壓強數據考察的指標作為變量,記:X1—H1區域足底壓強峰值,X2—H2區域足底壓強峰值,X3—M4區域足底壓強峰值,X4—M3區域足底壓強峰值,X5—M2區域足底壓強峰值,X6—M1區域足底壓強峰值,X7—T1區域足底壓強峰值。序號1—6代表六名男運動員。以此數據為樣本,建立數據集。
用SPSS作主成分分析需借助因子分析程序,在因子分析中用“主成分法”提取因子,并且不作旋轉,這時得到的初始特征值及相應的貢獻率、累計貢獻率就是主成分分析中的特征值及相應的貢獻率、累計貢獻率。結果:
由計算結果可知,大于1的特征值有兩個,累計貢獻率為89.37%,其后的主成分貢獻率都很小,再取作用不大,所以取兩個主成分。
第一主成分為:
Y1=0.7755778X1+0.6647197X2+0.8920651X3+0.9130328X4+0.5363003X5+0.6854025X6+0.4454412X7
第一主成分各分量的系數均為正且較接近,反映了速度滑冰運動員直道技術中足底各區域對峰值壓強產生的總體貢獻。
第二主成分為:
Y2=0.4356246X1-0.5875917X2-0.2424493X3-0.3789514X4-0.460916X5+0.676981X6+0.8939084X7
第二主成分中,變量X1,X6,X7的系數為正,對應足底區域為H1,M1,T1。其他變量系數為負。
1)計算第一主成分得分并對其排序,結果六名運動員第一主成分得分從高至低分別是3,2,5,1,6,4。第一主成分反映了速度滑冰運動員直道技術中足底各區域產生峰值壓強的總體貢獻,第一主成分得分高的運動員反映了該運動員瞬間達到的壓強峰值也大。建議將第一主成分得分與運動員的體重綜合考慮,若第一主成分得分高且該運動員體重相對較輕,則認為該運動員瞬間發力較大。
2)第二主成分反映了速度滑冰運動員直道技術中足底H1,M1,T1區域對產生峰值壓強的貢獻較大。其中,變量X6,X7的系數較大,也就是M1,T1區域即足前區對峰值壓強的產生貢獻最大。
[1] 梅長林,范金城.數據分析方法[M].北京:高等教育出版社,2006:113-124.
[2]陳及治.體育統計[M].北京:人民體育出版社,2002:206-224.
[3]王曉芬.體育統計與SPSS[M].北京:人民體育出版社,2002:242-245.
[4]劉貴寶.速滑蹬冰足底動力學特征的研究[J].首都體育學院學報,2005,17(1):16-18.
[5]馬國東.優秀女子速滑運動員彎道蹬冰技術的研究[J].吉林體育學院學報,2005,21(4):50-51.
PrincipalComponentAnalysisUsingSPSSonMaximumFullBottomIntensityPressureofSpeedSkating
Wang Lili,Wang Zenghui
(Institute of Information Technology,Jilin Agricultural University,Changchun,130118,Jilin,China)
According to Principal Component Analysis,a statistical method in Physical Statistics and using of SPSS,we analyze the maximum pressure data that generated by speed skating straight technology.The main purpose is to improve the effectiveness of speed skating training and provide a scientific basis.
principal component analysis;physical statistics;SPSS
2009-06-02;
2009-08-08
王麗麗(1982-),女,吉林長春人,助教,研究方向:數據挖掘與人工智能。
G80-32
A
1672-1365(2010)01-0058-02