桂春燕 劉鑫
河南理工大學體育學院 河南焦作 454003
學生體質健康對整個國家、整個民族至關重要。2016 年國務院頒布《“健康中國2030”規劃綱要》,把健康擺在了優先發展戰略位置上,強調要提高全民的身體素質,加大學校健康教育力度。我國《國家學生體質健康標準》(以下簡稱為《標準》)是學校對于《國家體育鍛煉標準》的具體實施,目的是鼓勵在校學生自覺鍛煉身體,促進學生體質健康發展,促使學生身體正常發育和全面發展,增強體質,糾正和改進學生體質健康狀況的突出問題,引導學生努力擁有健康的體魄和健全的人格。同時,《標準》也是學生體質健康的個體評價和學生是否能夠畢業的基本條件之一。因此,國內關于此方面的研究非常豐富。
目前,研究多集中在學生體質測試結果的數據分析[1],存在問題[2]及公示的困境與出路[3],測試實施的困境及對策[4-5],影響學生體質健康的相關因素及發展對策[6],關于學生體質健康研究的研究綜述[7],體質健康標準測試指標體系的演進過程、演變特點[8-10],國內外體質指標體系的對比分析[11-12],體質評價方法研究[13],對《標準》本身進行評價[14-18]等方面。本文通過文獻資料法、觀察法、邏輯分析法,基于測量學“三性”理論和評價學基本理論對我國執行的《標準》測評結果的科學性進行相關評述,期望我國《標準》測評能夠更具有科學性、適用性。
體質,即人體的質量。我國體育界學者認為,體質是人體在遺傳性和獲得性的基礎上表現出來的人體形態結構、生理機能、身體素質、心理品質和適應能力等相對穩定的特征[19],其主要涉及以下內容。(1)身體形態發育水平:體格、體型、姿勢、營養、身體成分等。(2)生理機能水平:機體新陳代謝水平及各器官系統效能。(3)身體素質和運動能力發展水平:速度、力量、耐力、靈敏、協調、柔韌和走、跑、跳、投、攀、爬等。(4)心理發育水平:本體感知能力、個性、意志、情感等。(5)適應能力:對內外環境的適應能力和對疾病的抵抗能力。
健康一詞有著豐富的內涵,《辭海》中將其定義為人體各器官系統發育良好、功能正常、體質健壯、精力充沛并具有良好勞動效能的狀態[19]。1946年世界衛生組織將其界定為:健康乃是一種在身體上、心理上和社會適應方面的完好狀態,而不僅僅是沒有疾病和虛弱的狀態。1989年世界衛生組織又進一步深化了健康概念,認為健康應包括軀體健康、心理健康、社會適應良好和道德健康。可見,健康的概念很廣泛,它涵蓋了生理、心理和社會適應3個方面,而且它的概念也會隨著社會的發展和研究的不斷深入而更新變化。
通過收集文獻資料,查閱并整理了我國歷次學生體質健康標準指標體系及評價(見表1、表2、表3)。表1 為2002 年《標準》(試行方案)指標及評價,涉及學生身體形態、生理機能和身體素質的相關指標,但沒有涉及心理發育水平和適應能力。小學四年級以下更注重身體形態的評價,五年級及以上更注重心肺機能和速度力量素質的評價。身體素質的相關指標主要供學生進行選擇性的測試,但實際不是學生自己選擇,而是各個學校自由選擇統一測試項目,在選擇的過程中,教師會選擇學生容易通過的項目。如評價大學生心肺機能的項目中,一般學校會選擇臺階試驗,因為學生懼怕1 000 m 和800 m 跑,教師在學生進行耐力跑時心理壓力也比較大,臺階試驗對于教師和學生更容易把握。

表1 2002年《國家學生體質健康標準》(試行方案)指標及評價

表2 2007年《國家學生體質健康標準》指標及評價

表3 2014年新的《國家學生體質健康標準》指標及評價
2007年正式頒布的《標準》(見表2)在2002年試行方案的基礎上增加了籃球、足球及排球的基本技能,能充分評價學生的運動能力,但都是選測項目,很多學校在測試的過程中避重就輕,選擇容易得分、容易測試的50 m跑、立定跳遠項目,所以三大球的基本技能指標設置形同虛設。
2014新修訂的《標準》(見表3)全部為必測項目,目的是追求公平,反映心肺機能的肺活量在所有年級中都需要測試。另外,身高標準體重用國際通用的指標BMI表示,刪除了三大球技術的基本技能測評項目。
3.1.1 測量有效性基本定義
測量的有效性即效度,是指測量的結果(成績)真實地反映測量目的的程度[19]。《標準》測量的目的是綜合評價學生的體質健康水平,促進學生體質健康發展,激勵學生積極參加體育鍛煉。但是,從《標準》(試行方案)、正式的《標準》到新修訂的《標準》,指標集中在評價身體形態、身體素質及生理機能上,并沒有包含體質與健康概念及范疇所涉及到的心理發育水平及適應能力。所以《標準》的測量指標不全面,測試結果無法完全滿足測量目的,有效性值得質疑。
3.1.2 影響測量效度的相關因素
影響測量有效性的因素主要包括測量的可靠性、受試者總體特征以及測量的難度和區分度等。
我國地域遼闊,東西南北氣候、飲食和生活習慣等差異很大,人體的身體形態、身體機能、身體素質以及心理狀態也存在較大差異,而《標準》為了追求所謂的公平,全國用唯一一套測試指標和評價標準來測量評價學生的體質健康狀況,影響了測量的效度,因為它對受試者總體特征考慮不夠充分,降低了測量結果的效度。
部分指標的難度和區分度不夠,以2014 年新《標準》為例,從測量實踐中觀察到,反映學生肌肉耐力的男生引體向上和女生仰臥起坐,女生很容易達到仰臥起坐的標準且容易拿到高分,而絕大部分男生引體向上在及格分以下甚至零分,所以指標的選取很難達到滿足效度要求的區分度和難度。只有測量難度適中,區分度高,有效性才會提高。反之,效度會降低[20]。
測量過程中由于部分學生和體育教師不配合而影響測量的可靠性,也會引起效度的降低。效度的降低會加大測量的誤差,就難以真實反映現今學生的體質健康狀況。用誤差較大的結果作為學生評獎評優、畢業與否、學校體育工作開展情況評價的一個重要條件,有失公平性和科學性。
3.2.1 測量信度基本定義
信度即測量的可靠性是指在相同條件下對同一批受試對象使用相同的測量手段,重復測量結果的一致性程度[19]。目前,很多學校在體育課上由體育教師完成《標準》的測試,測量結果在很大程度上取決于體育教師和學生的配合。
3.2.2 影響測量信度的相關因素
影響信度的主要因素有測量誤差(包括測試者、受試者、測試儀器、測試方法、測試環境、抽樣誤差等)、受試者個體差異、受試群體的能力水平、測量指標的類型、測試細則等方面。
通過對近10 年大學體育教學的觀察,發現有些院校鑒于人力、財力的考慮將體質健康測試工作安排在體育課上進行,在一定程度上增加了體育教師的工作量,很多學校測試的數據都是人工記錄。部分體育教師消極對待年復一年的測試工作,測試過程中不親自到場,對學生監督不夠,數據隨便填寫等現象影響了測量的信度。
測試儀器不統一,測試器材的原理、型號差異明顯,儀器的誤差存在范圍不一致[15],測試儀器出現破舊故障而沒有及時維修,都會導致測量誤差增大。由于儀器少而參加測試學生多,有時測試人員無暇顧及測量值的真實性,直接將學生報告的測量值錄入,影響了測量的可信度[20]。另外,由于測試結果關系到學生的評獎評優及畢業等,部分學生在測試過程中尋找代測人,甚至有人以此搭建一條利益鏈,嚴重干擾了測量結果的可信度。還有部分學生在測試過程并未盡力,對照標準認為及格即可,這種主動配合的測試也可能導致測量結果可信度不高[20-21]。
受試者群體能力水平及測試細則影響信度。以某高校為例,每年新生的測試都安排在學生軍訓后馬上完成,因為要完成上報測試數據的任務,學生還沒有完全了解測試的目的和具體要求,加之部分體育教師對此測試的細則不進行詳細的講解,大一的學生就在迷茫中參加了測試,從而降低了測量結果的信度。也有部分高校大三、大四學生的測試實際上是安排在大二完成的,并不能反映受試群體在某一階段的體質健康狀況,測量結果的可信度降低。另外,我國地域廣闊,受試者群體的能力水平差異比較大,用統一的測量指標進行測試,其信度值得質疑[9]。
目前,新《標準》測試指標不足以反映學生的體質與健康狀況,測試項目也趨于簡單,效度的高低也直接影響信度的高低。鑒于對以上多種因素的分析,我國《標準》測試的可信度相對較低,未能真實實現測試要達到的目的。
測量客觀性是指不同測試者對同一受試對象同時測量,通過測量結果的一致程度來衡量測試者誤差大小[19]。影響客觀性的因素主要包括測試者水平、測試的規范化及標準化程度、測量指標特征及測量尺度。《標準》的測試者一般是學校的體育教師,很多教師沒有經過專門培訓,并且教師對測試的積極性并不高,甚至有的教師認為每年兩次的測試是浪費人力財力,所以部分測試者并沒有認真完成測試工作,會對測量結果的客觀性產生較大影響[20]。《標準》測試原則上是規范化、標準化程度較高的,但在實際測試過程中,測試者和受試者并沒有真正按照規范的流程進行,測量尺度的把握也差異較大,在一定程度上也影響了測量的客觀性。
測量的效度、信度及客觀性是用來衡量測量誤差大小的指標。要想提高測量結果的科學性,客觀性、可靠性和有效性都必須提高,三者缺一不可。可靠性是有效性的必要條件,而非充分條件。有效性是可靠性的充分條件,即有效性高,可靠性一定高。所以用“三性”水平都不高的測量數據去反映學生體質健康狀況缺少科學性,《標準》要達到的目的和實現的意義很難完成,評價學生體質健康的結果值得質疑。
評價是對所獲得信息進行加工處理,通過科學的分析作出價值判斷,并賦予被測事物或現象某種意義的過程。評價類型可分為相對評價、絕對評價和進步度評價。評價標準可分為絕對評價標準即參照標準、相對評價標準即常模標準以及動態評價標準。目前《標準》采用的評價類型是相對評價,評價標準為常模標準。相對評價是評價個體在群體里的基本狀況,相對評價標準的制定是以學生樣本體質測試的平均成績為常模的,如果學生整個群體的體質健康狀況不容樂觀,那么即使學生被評為優秀等級,學生的體質健康狀況也未必就好,這樣可能會給學生參與體育鍛煉造成誤導。因此,相對評價和常模標準很難定位學生體質健康狀況到底如何,對于不同年齡段用何種標準能夠真正達到體質健康的要求,學生通過完成這一測試無從知曉。
建議《標準》的評價標準采用常模標準和參照標準相結合的方式共同使用,同時在評價系統內設計學生進步度評價標準。雖然制定各年級參照標準比較困難,但鑒于學生體質健康的現狀,相關教育者和專家有責任有義務去研究設計,只有這樣,學生才能通過《標準》的測試,真正清楚自己體質健康的實際水平,《標準》才具有實際存在的價值。設計進步度評價有利于學生同自己的以往成績比較而判斷進步程度,更能調動鍛煉身體的能動性,而不僅僅停留在為了拿到評獎評優、畢業資格的功利性動機上。學生的體質健康狀況問題是客觀事實的,“少年強則國強”,青少年的體質健康狀況是不容忽視的,它關乎國家的未來和民族的希望,所以,即使參照標準設計難度較大,這個問題也必須解決。
我國《國家學生體質健康標準》的制定從2002年試行到2014 年重新修訂花費了許多專家學者、體育工作者們大量心血,它的測量及評價也花費了大量的人力、物力和財力,在國內已具有很大的影響力,成為各級學校及學生家長關注的焦點問題之一,也是體質研究者們重要研究的話題之一。但《標準》本身的指標設置、執行過程及評價標準的科學性影響了測量結果的真實性,按照測量學“三性”基本理論評價,其科學性是較低的,評價標準的設計也無法真實反映學生的體質健康狀況。建議《國家學生體質健康標準》的名稱改為《國家學生體質標準》或《國家學生鍛煉標準》,因為健康的內涵是很豐富的,這樣的測試是無法評價學生健康狀況的,指標的設定要更多地選用真正測量學生身體素質及運動能力的指標,學生只有掌握了基本的運動能力如球類運動等,才會更有方向性地參加體育鍛煉,進而提高身體素質,增強體質。心理指標和社會適應能力指標是比較敏感而復雜的,也比較難以量化,但從《標準》名稱來看,應該包括兩者的相關指標,為了防止學生鑒于達標的考慮而造成測量結果的不真實,可以設置相關指標,但可不計入體質總分。評價標準的設定可采用常模評價、參照評價和進步度評價相結合的方式,用更科學的方法去測量和評價學生真實的體質狀況,真正調動學生參加體育鍛煉的主動性。
本研究旨在為出臺其他相關政策奠定堅實基礎,為真正貫徹執行《“健康中國2030”規劃綱要》做出貢獻,為實現“健康中國2030”做出努力。