董皓天 李志豪 萬錚宇 朱津
摘 要:本文對某校學生的晨跑情況進行了抽樣調查。了解到學生群體中普遍對現行晨跑制度中每天固定的晨跑距離感到不滿,因此本課題組從這個問題出發,考慮學生個體課程情況和天氣情況與每天適宜的晨跑距離之間的關系。使用回歸分析中多類別的Logistic回歸方法構建數學模型,從而對能否優化現有的晨跑機制進行了可行性研究。并得到以下一些結論:
(1)當日睡眠情況及第一節是否有課是能否進行運動的重要依據;(2)大學生每日課程量會對運動效果及身體健康產生重要影響;
(3)利用logistic回歸構建數學模型可以改善現有運動量的僵化情況;(4)在數據足夠支持的情況下,可以挖掘出更多影響因子
關鍵詞:每日課程量;天氣情況;回歸分析;Logistic
一、引言
大學生體質歷來是我國社會各界關注的重點,為了提升大學生的身體素質,讓大學生養成主動鍛煉的好習慣,全國各大高校陸續推行晨跑APP打卡制度。與此同時,我們通過調研發現,打卡制度固定僵化的模型存在缺陷。通過閱讀大量相關文獻,先從天氣情況考慮如何改善現在的晨跑制度,再通過分發問卷從學生方面了解情況,從而找出問題所在,以求提高學生們的運動質量和運動熱情。故下文將從天氣和個人兩方面進行分析。
二、研究對象和方法
在我們的研究中,針對2017和2018級在校大學生為主要研究對象。本研究主要采用文獻綜述,問卷調查的方法和數理統計分析研究方法。通過查閱相關資料并由體育學院專家審核設計制定最終調查問卷。
我們通過設置二十道簡明的單選題,涵蓋被調查者的個人信息外,也包含本課題中關于因變量取值,即是否晨跑,晨跑后個人感覺;解釋變量取值,即睡眠質量,第一節是否有課,課程數,對晨跑的個人喜好的問題
調查對象是在校大學生,共有700名同學對此次問卷進行認真作答,回收有效問卷683份,回收率97.6 %。
三、回歸模型的建立
我們選取 值(顯著性概率值)作為統計量來逐個檢驗自變量的顯著性,當 時,可接受原假設,即此自變量不顯著,應當予以剔除。并且選取F作為統計量來檢驗回歸方程的顯著性, ,其中 , ,當 值大于臨界值 時,說明回歸方程顯著。
我們使用逐步回歸的基本思想將變量逐個引入模型,每引入一個解釋變量后都要進行 檢驗,并對已經選入的解釋變量逐個進行 值的檢驗,當原來引入的解釋變量由于后面解釋變量的引入變得不再顯著時,則將其刪除。以確保每次引入新的變量之前回歸方程中只包含顯著性變量。這是一個反復的過程,直到既沒有顯著的解釋變量選入回歸方程,也沒有不顯著的解釋變量從回歸方程中剔除為止。以保證最后所得到的解釋變量集是最優的。
(1)模型的探索
為探究大學生個體在某一天是否參與晨跑,以及晨跑質量的影響要素,通過隨機選取學生群體,記錄每日出勤狀況,當天的天氣和課程情況及前一天的睡眠情況等。并且為了方便計算,我們將合適的運動量劃為五個不同的等級。而同時要使這些變量和運動量之間有聯系,通過查閱資料,我們使用Logistic回歸建立合適的函數關系。
(2)自變量和因變量的選取
我們利用顯著性水平進行逐步回歸,以確定自變量是否應該加入到回歸模型中。我們先前較為看好的“個人喜好程度”,因其較不顯著,予以剔除,也從側面說明了現在大學生對晨跑行為較為抵觸。
我們假設大學生不存在身體健康情況這一影響因素,所以并沒有選取它作為一個自變量。因為惡劣的環境會使得人們的運動成果適得其反,所以我們選取天氣情況及其污染程度作為兩個自變量中。同時,學生當日的課程也與運動效果有著顯著關系,是故我們選取當日課程量作為第三個自變量。
我們選擇使用多類別的Logistic回歸,所以我們的因變量為定性因變量,即只有1,2,3,4,5這五個值,依次代表不運動,運動500米,運動1000米,運動1500米,運動2000米。
(3)基本模型
多類別的Logistic回歸函數通式如下
其中 是指多類別的Logistic回歸模型中第 組樣本的因變量取第 個類別的概率
是指第 組樣本的因變量取第 個類別的系數
(4)模型的求解
依據上述式子確定的模型,我們將“第一節是否有課”“、“前日睡眠質量”、”“當天課程數量”這三個自變量設為X1,X2,X3,將“應跑距離”這個因變量設為Y,并將通過問卷所收集到的數據依次導入SPSS,然后通過SPSS軟件計算三個未知參數的估計值,其中的 的取值在下表中。
其中的 的取值在下表中
(5)模型的檢驗與優缺點
對于求解出的模型,我們選取作為檢驗數據中的240組數據代入我們的模型之中得到了240組預測結果,并與我們與原先的數據進行比對發現正確率達到了80.83%這也說明了我們的模型對于每日的運動量的預測是較為準確的。將因變量和自變量都轉化為定性變量,認為logistic回歸是較為不錯的方案。還可進一步考慮下述內容:
(1)本課題的的主旨是調查課程數量,第一節是否有課,前一晚的睡眠質量,對運動的個人喜好程度等不同變量對當天適當的晨跑距離的影響,但是由于大學生晨跑受到次數指標的限制,且有截止時間,也就是說可能會發生如下情形:快到截止時間了,某同學仍未達到次數要求,則此時他是否作出晨跑決策完全與睡眠質量,課程數等無關。諸如這樣的樣本會大大影響回歸的準確度。
(2)本回歸模型在選取樣本時,雖已極大可能的保證每個樣本之間是獨立的,但是不可避免的樣本之間還是會相互影響,在如下情形下,回歸方程會受到嚴重影響:假設某幾個樣本是同一宿舍,則這幾個樣本每個人作出是否晨跑的決策可能會收到某一個人的影響。
四、模型的運用
通過求得Logistic回歸的各項系數,模型便由此完成構建。我們將單個學生的具體情況以數據方式代入方程,便可得到晨跑取不同數值的概率,而我們選擇能使得概率達到最大的晨跑距離的數值作為結果,即可確定該學生在今日應該晨跑的距離。
通過模型所確定的不同學生在不同情況下應該晨跑的距離,我們能夠以此改善當今固化單一的晨跑制度,將晨跑距離與每個學生個人情況結合起來,以重新規定一個更加人性,理性的晨跑制度。
參考文獻:
[1] 劉波,羅剛林.霧霾環境天氣下對戶外體育運動人群影響研究[J].環境科學與管理,2018,43(01):94-97.
[2] 張金國.揚州大學學生晨跑現狀調查及影響因素的實證研究[D].揚州大學,2018.
[3] 申其淇.大學生體育鍛煉運動量與幸福感的關系的調查研究——以北京師范大學為例
[4] 中國體育科學學會運動心理學分會、中國心理學會體育運動心理專業委員會.第十一屆全國運動心理學學術會議摘要集(會后版)
[5] 中國體育科學學會運動心理學分會、中國心理學會體育運動心理專業委員會:中國體育科學學會運動心理學分會,2018:1.
基金項目:
項目經費來源:揚州大學大學生客創基金項目。本項目得到“江蘇高校品牌專業建設工程資助項目(數學與應用數學,PPZY2015B109)”經費資助。
(作者單位:揚州大學)