[摘要] 回歸分析是在掌握大量觀察數據的基礎上,利用數理統計方法建立因變量與自變量之間的回歸關系函數表達式(稱回歸方程式)。回歸分析中,當研究的因果關系只涉及因變量和一個自變量時,叫做一元回歸分析;當研究的因果關系涉及因變量和兩個或兩個以上自變量時,叫做多元回歸分析。目前,在體育統計學中大多采用SPSS統計軟件進行回歸分析,本文利用Excel的圖表以及數據分析工具,通過建立“最優”回歸方程對因變量進行預報或控制。
[關鍵詞] Excel; 回歸; 體育統計學; 應用
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2011 . 19. 036
[中圖分類號]TP317.3 [文獻標識碼]A [文章編號]1673 - 0194(2011)19- 0065- 02
1引言
回歸分析中,依據描述自變量與因變量之間因果關系的函數表達式是線性的還是非線性的,分為線性回歸分析和非線性回歸分析。多元線性回歸是指不只一個自變量的線性回歸分析。多元線性回歸方程可以表示為(以二元為例):
Y = b0 + b1x1 + b2x2
在實際問題中, 人們總是希望從對因變量有影響的諸多變量中選擇一些變量作為自變量, 應用多元回歸分析的方法建立“最優”回歸方程以便對因變量進行預報或控制。所謂“最優”回歸方程, 主要是指希望在回歸方程中包含所有對因變量y影響顯著的自變量而不包含對y影響不顯著的自變量的回歸方程。它的主要思路是在考慮的全部自變量中按其對y的作用大小, 顯著程度大小或者說貢獻大小, 由大到小地逐個引入回歸方程, 而對那些對y作用不顯著的變量可能始終不被引入回歸方程。本文把因變量設置為肺活量,自變量設為體重、速度靈巧項目成績、柔韌力量項目成績。
2應用實例
采用隨機抽樣的方式從30個學生中抽?。保競€樣本,記錄其肺活量,體重、速度靈巧項目成績、柔韌力量項目成績等。將這些數據匯總顯示在工作表A2:E19單元格區域,如圖1所示。試根據這些數據找到肺活量與體重、速度靈巧項目成績、柔韌力量項目成績3個自變量之間的關系,以便進行肺活量預測。試根據這些數據建立回歸模型。如果某學生體重、速度靈巧項目成績、柔韌力量項目成績分別為:65千克、12秒、16厘米,試預測其肺活量。
3建立模型
3.1采用圖表法判斷各變量與肺活量的線性相關關系
分別選中體重與肺活量、速度靈巧項目與肺活量、柔韌力量項目與肺活量,利用圖表向導建立X、Y散點圖,觀察是否是線性相關,在此基礎上右擊散點圖添加趨勢線,在打開的“添加趨勢線”對話框中作如圖2所示的設置。其中在“類型”選項卡中選擇“線性圖” “選項”選項卡中選中“顯示公式”和“顯示R平方值”。結果如圖3、圖4、圖5所示。
其中,R2 為擬合系數(相關系數),圖中分別為:0.977 8、0.939 6、0.979 3,從中可以看出體重、速度靈巧項目成績、柔韌力量項目成績都與肺活量高度相關,即它們都對肺活量產生影響。
3.2利用數據分析工具得出回歸分析報告判斷其線性關系
首先選擇“工具”菜單 “加載宏”命令,在打開的“加載宏”對話框中選中“分析工具庫”;單擊“工具”菜單 “數據分析”命令,在打開的“數據分析”對話框中選中“回歸”,作如圖6所示的設置。得到的體重回歸分析報告如圖7所示。
其中R2為0.977 79,截距為990.889 3,斜率為15.988 84,與圖表法相吻合。按照同樣的方法分別建立速度靈巧項目成績回歸分析報告、柔韌力量項目成績回歸分析報告、體重-速度靈巧項目成績回歸分析報告、體重-柔韌力量項目成績回歸分析報告、速度靈巧項目成績-柔韌力量項目成績回歸分析報告、體重-速度靈巧項目成績-柔韌力量項目成績回歸分析報告等(如圖8所示)。
3.3建立“最優”回歸方程
對這些回歸分析報告進行整理,如表1所示,找出調整后R2的最大值對應于體重、速度靈巧項目成績、柔韌力量項目成績3個自變量(x1、x2、x3)。
建立的回歸方程為:Y = 1 355.92 + 7.269x1 + 2.096x2 + 11.347x3
從回歸方程也可以看出,肺活量與體重、速度靈巧項目成績、柔韌力量項目成績均有線性正相關關系。
3.4進行預測
根據體重-速度靈巧項目成績-柔韌力量項目成績回歸分析報告,已知:回歸方程截距為1 355.92,斜率1(對應體重)為7.269,斜率2(對應速度靈巧項目成績)為2.096,斜率3(對應項目柔韌力量項目成績)為11.347,將體重65千克、速度靈巧項目成績12秒、柔韌力量項目成績16厘米代入回歸方程,得肺活量預測值為2 035.1毫升。
從上述的分析計算過程中可以看出,利用Excel進行多元線性回歸分析,比應用SPSS統計軟件更為簡捷、實用,從而使體育統計分析更具實用價值。
主要參考文獻
[1] Excel Home. Excel應用大全[M]. 北京:人民郵電出版社,2008.