李 博,刁玉翠,李 靜,洪金濤,孫建剛,劉 陽,5
兒童時期的粗大動作發展是基本運動技能(Fundamental Movement/Motor Skill,FMS)的重要分支,兒童FMS 的測評是評估、診斷、監控個體動作發展的重要指標[1-2]。鑒于FMS 發展的重要性,發達國家的常規做法是對兒童的FMS進行縱向的大規模普查,如美國早在20 世紀80 年代就已對兒童的動作發展進行測評,并將其納入《美國學校體育教育發展現狀報告》分析指標,進行跟蹤式調查[3];德國的全國性調研“德國兒童與青少年健康訪查調研項目”中3~17 歲的兒童FMS 情況是其重要內容之一[4]。當前我國學校體育中缺少對學生FMS 發展情況的普查,而擁有一套科學的FMS 測評體系是進行大規模普查工作的前提,因此基于我國體育文化背景和學生動作發展情況的FMS 測評體系亟待被研發[5-8]。
美國粗大動作發展測試(TGMD)是由美國密西根大學的Ulrich 教授制定,以3~10 歲兒童作為測試對象,用來評價兒童FMS 發展水平的工具。經過30 多年的發展,目前已經更新到第三版,即TGMD-3,該測試采用過程性評價與結果性評價相結合的方式通過對兒童進行包括前滑步在內的13 個粗大動作的完成質量進行評分,進而評估測試對象的FMS 的發展情況。經過30 年的發展,TGMD 已經成為世界上應用最廣泛的FMS 測評工具[6]。TGMD 的研發是基于美國本土兒童動作發展狀況制定,根據經典測量理論的知識,由于地區之間的文化差異,國外測評工具在我國使用之前要進行一系列“本土化”工作[9],對我國學者而言該項工作包括測評體系的語言體系漢化和信效度檢測等工作。當前國內的研究中對TGMD 的應用中跳過了語言體系漢化工作,造成了應用中存在TGMD 測量系統中相關術語“不統一”的現象,如現有文獻中對“Gallop”動作的翻譯有“馬步跑”“跑馬步”“前滑步”“前滑”等多種翻譯,這種現象的存在可能會造成TGMD 的錯誤使用,因此有必要進行術語統一以規范TGMD 的應用。
鑒于上述情況,本研究對TGMD 的產生及發展、測試體系、信效度及應用現狀進行系統梳理。為我國兒童動作發展評價體系的構建提供鏡鑒和思路,推動我國兒童FMS 測評體系的研發工作。
TGMD 系列是由美國密西根州立大學Dale A.Ulrich 在1981 年研制。TGMD 系列原始版本(TGMD -1)是1981 年Ulrich 在其博士論文中發布的,隨后在2000 年和2013 年進行了版本更新,對應的版本分別是TGMD -2 和TGMD -3。TGMD 是一種直接觀察、注重動作過程的FMS 評估工具,每項技能有3~5 個表現標準(觀測點),這些動作標準用于界定兒童在完成某個動作時軀干和四肢配合是否協調、FMS的形成是否精確,是否達到自然、順暢的動作技能模式。該系列的常模操作測試情景均是在美國本土完成的,適用年齡段基本涵蓋了兒童FMS 發展的敏感時期。該系列的設計初衷是為了甄別那些動作發展總體表現明顯落后于同齡人的兒童。TGMD 的產生和發展具有特定的社會和學術背景,主要是基于以下3 個方面。
終身體育理念是在“二戰”之后受國際終身教育思想的影響和體育運動的發展,特別是大眾體育的興起而提出的。人體動作表現貫穿于人類的全生命周期,從胚胎和嬰兒期的固有非條件反射,到兒童少年時期的FMS,再到成年時期的專項運動技能,研究者們認識到人類動作發展和體育運動之間存在著極為緊密的關系[2]。因此科學的解釋人類動作發展的規律可以更加有效地教授或引導人們依據這種客觀規律來掌握和學習動作技能,從而達到建立終身體育意識、具有終身體育能力和促進身心健康的目的。在此背景下,兒童動作發展測評的工具被各國學者相繼開發。
兒童“運動技能”測評是美國學校體育課程中“對學生體育學習”評價的主要內容之一[3]。對于兒童而言,最常見的學校體育教育課程內容是FMS,3~10 歲兒童的運動技能發展主要體現在FMS 的完善程度上,該年齡段是兒童發展FMS 的敏感時期,因此該階段的學生“運動技能”評價中將FMS 列為主要觀測指標,并不是側重于專項運動技能,因此TGMD 系列作為FMS 測評的體系在美國的體育課程評價中被廣泛應用[10]。最新版的《K-12 體育教育標準》中明確指出一個具有完備的Physical Literacy(以下簡稱PL)的學生應“具備展示各種基本動作技能和動作模式的能力”,在PL 的理念進入學校體育教育之后,學生FMS 發展更是成為PL 的主要操作定義之一[11],這也就成為美國學生FMS 普查的范圍不斷擴大的重要原因[3]。
兒童的FMS 發展存在正常發展、超前發展、滯后發展和障礙發展4 種現象,正常和超前發展可以被家長或教師接受,但滯后發展和障礙發展的兒童則需要被檢出以便進行合理的干預或治療[12]。以最常見的發育性動作協調障礙(Developmental Coordination Disorder,DCD)為例,又稱動作技能協調障礙,指的是由于動作能力的不足導致日常生活能力和學習成就受到影響的一組神經發育障礙性疾病[13]。DCD 不會隨著年齡的增長而“恢復”,甚至會持續到青春期和成年期[14]。而TGMD 系列則是較常被用于DCD 篩查的工具[15]。除此之外,TGMD 系列還被用于自閉癥譜系障礙[16]、智力障礙[17]等具有非典型發育特征的兒童群體。
TGMD 系列構建是基于經典測量理論的基礎之上。經典測量理論亦稱“真分數理論”。該理論假設觀測分數X 是由真分數T 及隨機測量誤差E 所組成,即X=T +E;誤差E的平均數等于0;誤差E 與真分數T 間的相關為0[18]。在經典測量理論的知識體系中認為測評體系的構建需要經過信效度檢驗、項目分析、常模構建以及標準化等基本建造程序。標準化測評對實施程序、對象范圍、施測環境、測試方式、測驗時限、分數解釋(常模)做了統一的規定,這樣測評能夠在異時、異地,不同的主試等條件下進行,并能得到同等有效的測評結果。標準化的思想主要來自自然科學中對實驗條件進行嚴格控制以降低測量誤差,其方法主要是通過對無關變量和干擾變量控制。TGMD 系列在現實操作中均已經具有了完整的操作手冊,并對操作情景、工具規格以及測試人員品質等提出要求,較高的標準化程度保證了測試的信效度,同時保障了常模解釋的準確性,這也是它得以廣泛應用的重要原因。
標準和嚴謹的測試流程是保證該工具可以進行大面積推廣應用的重要原因。TGMD 系列主要包含兩個維度(移動和球技),測量了兒童動作技能里的移動技能和物體控制技能。最新版的TGMD-3 于2013 年發布并開始進行大樣本規范性的信效度數據檢測工作,TGMD -3 中主要包含了移動和球技兩個分測試。移動測試中包含跑等6 項技能;球技測試包括雙手持棒擊定位球等7 項技能,兩個子測試共計13 項測試動作,每個測試動作都有3~5 項具體的完成標準,測試動作正確執行得1 分,無法正確執行得0 分,重復測試,分值區間為0~100,其中移動分測試總分46 分,球技分測試總分54 分。在測試前需要獲得包括人口學信息(性別、年齡、居住地)和常規生理信息(體重狀況、優勢手、優勢腳)在內的個人信息,單次整個測試流程需要15~20 min,并且所需的器材均是體育課中常用的器材。
為了規范TGMD 的應用,本研究對TGMD -3 中的技能、器材和路線進行漢語翻譯,在考慮中國特定的文化因素和用語習慣的基礎上,使用紙質辭書(如:牛津高階英漢雙解詞典第9 版)、電子辭書(如:Google 翻譯)等翻譯工具,按照“全體作者合作翻譯→英文專業翻譯人員審查→運動技能專家審查→一線體育教師審查”的翻譯路徑方法。翻譯出TGMD-3 測試技能、器材和路線(如表1)。

表1 TGMD-3 測試技能、器材和路線Table 1 Testing skills,materials and directions included in TGMD-3
TGMD 系列采用“常模參照評價”的評價方式,根據不同年齡階段的平均表現制成常模,繪制成兒童FMS 的“發展性常模”。原始版本TGMD-1 的常模測評樣本是居住在美國8 個州的909 名兒童,并根據性別、種族和居住地等指標進行了區分。“常模”和“標準化樣本”是測量學里兩個重要的概念,常模參照測驗中被測對象相對發展水平的衡量依靠常模的確立,而常模又是在標準化樣本的基礎上建立起來的。在TGMD 系列中,標準化的樣本是基于大樣本量的美國本土兒童。但是,現有的研究也證實,文化背景、語言體系和人種的差異均會使同齡兒童的粗大動作發展產生較大差異[19]。因此,基于美國的常模并不一定適用于其他國家或地區,基于應用國家或地區兒童數據的常模建設工作是應用該系列的常規工作[20-21]。也正因如此,多數測評體系存在跨文化測評[22]效度減弱的問題,其數據常模不能精確地適用于他國兒童,因此各國學者會根據本國兒童的實際情況有針對性地制定測評工具[6]。
Ulrich 的最新一項研究通過對807 名美國兒童的TGMD-3 測試來檢驗其信效度。結果顯示重測信度較高,移動測試(ICC=0.97)、球技測試(ICC=0.95)和總分(ICC=0.97)的ICC 具有一致性。效度指標中,TGMD -3 具有可接受的項目難度(范圍=0.43~0.91)和項目區分度(范圍=0.34~0.67)。探索性因子分析支持TGMD -3 的單因素結構,其變異率為73.82%;驗證性因素分析支持單因素模型,以上顯示TGMD -3 可接受的結構效度,結果表明,TGMD -3具有很高的信效度[23]。TGMD 系列除了在大樣本量的典型發育兒童使用信效度的檢測之外,還在智力障礙[17,24]等非典型發育兒童群體中進行了信效度檢測,也證實該體系在非典型群體兒童中同樣具有較高的信效度。工具的信效度檢驗工作是測評工具推廣的重要步驟,對于工具的推廣和應用至關重要,因此相關的研究數量較多。
經典測量理論中認為信度等于真分數變異數與實得分數變異數之比。測驗的信度是指測驗的可靠程度。它表現為測驗結果的一致性和穩定性,信度是反應測驗結果受到隨機誤差影響程度的指標,是評價測驗質量的最基本的指標[25]。在其他國家和地區的信度測試中,TGMD 系列也顯示出具有較高的信度值。此外,有研究比較了TGMD -2 和TGMD-3 的評分者信度和重測信度,運用組內相關性用于檢查評分之間和評分者內部的可靠性,其結果顯示,TGMD-2 的測試總分和TGMD-3 的測試總分表現出較高的評分者信度(ICC:0.92~0.96)[26]。TGMD -3 在我國上海兒童的信度檢驗中,各項指標也顯示該工具具有較好的信度[27]。
經典測量理論里認為效度等于有效分數變異數與實得分數變異數之比。TGMD 是對人類動作行為樣本的客觀和標準化的測量工具,是屬于方法學的“測驗”范疇,其效度不同于實驗。測驗的效度是指一個測驗在測量某項指標時所具有的準確程度。它所回答的基本問題是:一個測驗測量對象的什么特性,它對該特性的測量有多準確?測驗的效度越高,則表示它所測結果越能代表所測對象的真正特征[28]。結構效度中Ulrich 通過檢查四個關鍵假設來驗證TGMD 系列的結構效度,分別是:(1)與實際年齡的相關性;(2)每組中高中低三個層次之間存在個體差異;(3)總分與子測試得分的相關性;(4)因子分析,最終指數顯示在0.90~0.96 之間。TGMD-2 在我國山東地區兒童的效度測試中[29],內容效度(辨別力和難度)、結構效度(總分與子測試得分的相關性)和效標關聯效度(效標采用的是“學生體育課的運動成績和體育教師日常評價”)等指標的均呈現出較良好的結果。
TGDM 系列的優點有:(1)適用對象涵蓋了FMS 發展的敏感時期,且該測試體系所有的年齡段應用同一套測量工具,這為兒童動作發展的縱向比較提供基礎;(2)TGMD 測試流程標準嚴謹且多種環境應用下高信效度,這為全球視域下兒童FMS 的國際比較提供工具。(3)適用對象廣泛,不僅適用于正常發育的兒童,對部分非典型發育的兒童同樣適用。(4)相比較而言,TGMD 還有測試耗費少和對場地器材等硬件設施要求低的優點。
TGMD 系列的缺點有:(1)該系列沒有包括穩定性的相關測評。TGMD 系列是FMS 最常用的測評工具。FMS 包括3 個下位范疇;移動技能、物體控制技能和穩定性技能[1]。然而,TGMD 可以通過移動子測驗測試移動技能,通過球技子測驗測試物體控制技能,但卻缺乏對穩定性技能的測試。(2)測試指標的選取是基于美國的文化體系,部分指標適用性有限[19]。Kim 的研究運用身高體重指數(BMI)和TGMD-2 對216 名韓國兒童的測試中發現FMS 與BMI 不相關,與健康體重和肥胖不相關,這和既往研究的結論有較大的差異,研究者認為這種結果產生的原因很可能是由于TGMD的適用性問題[30]。再如“雙手擊定位球”動作是基于美國大眾體育中的“棒球”擊球動作選取的,但是在亞洲的體育文化當中應用此指標,其區分度情況需要進一步證實[31]。(3)過程性評價的弊端。Ward 等的研究選取了10 名小學教師和7 名兒童動作發展專家對兒童在TGMD -2 中跳躍、單腳跳、踢和投擲4 種技術的10 種表現進行人為打分評判,發現教師和專家對兒童FMS 總體熟練度的判定并沒有差異,但是對于單個動作觀測點的判定卻存在較大差異。研究者認為,無論施測者的經驗如何,對于動作熟練標準的具體實施還是有難度的。這項研究提示,對于諸如TGMD 這類應用過程性評價的工具存在由于施測者問題而降低效度的缺點[32]。
主要用途有:(1)識別與篩查。主要應用于兒童保育學領域,用于識別和篩查那些動作發展遲緩或障礙的兒童[15,33]。(2)教學設計評估。主要應用與體育教學課程中,評估運動技能干預或教學的成功與否。Ryan 等的一項在美國綜合學校體育活動計劃背景下開展的研究中利用TGMD-2 評價了1 460 名低收入家庭兒童,觀察經過12 周的干預計劃之后的動作技能變化,以此來評估該計劃的實施效果[34]。(3)評估個體動作發展進度。主要用于兒童FMS的評估,主要涉及到FMS 相關的橫斷面以及縱向追蹤研究等[35]。一項研究應用TGMD -3 評估了英格蘭的貧困地區和不同種族地區的不同年齡階段FMS 發展情況,發現FMS的發展在兒童期和種族之間的性別之間存在差異[36]。此外Issartel 等的研究顯示TGMD 在12 歲兒童(該系列的適用年齡為3~10 歲)中也具有很好的信效度,適用年齡范圍的擴大提高了該系列的普適性[37]。(4)干預項目或政策評估。評估兒童群體在FMS 發展方面的進程。如有研究運用TGMD-2 測量了我國大陸地區的兒童FMS 之后發現我國兒童移動動作技能整體優于美國兒童,而物體控制技能整體偏低[38]。
當前國際上與TGMD 相關的研究數量較多,這些研究集中在歐美等發達國家或地區,亞洲數據匱乏[10],相比較而言我國兒童的數據則更為匱乏。我國學者從2005 年起就開始進行TGMD 相關的介紹和實測工作。我國學者李靜和梁國立于2005 年將TGMD-2 引入了該系列,并于2007 年就TGMD-2 的信效度在我國山東地區進行了測試,其結果表明在該地區具有良好的信效度[29]。一項研究通過TGMD -2 測試學前兒童FMS 發展,驗證該工具在學前兒童中使用的信效度,結果顯示TGMD-2 表現出較好的信效度,不同年齡與性別組呈現出得分差異,具有較好的區分度[39]。刁玉翠等通過上海市的1 186 名兒童對TGMD -3 進行了信效度檢驗并構建了上海市常模[27]。圖1 選取了核心期刊中我國應用TGMD 系列的研究,從該圖中可以看出當前與此工具相關的研究的主要是橫斷面研究,其中一部分研究通過TGMD 工具對中國兒童進行測量,并與中國香港、美國和巴西等國的兒童進行比較[38,40-41];另一部分研究中通過該工具的測量探討FMS 發展與動作能力感知[42]、身體活動量[43]、體能[44]和身體素質[45]等變量間的關系。此外,該圖中還顯示盡管相關的研究總數量較少,但呈現出逐年上升的趨勢。

圖1 國內研究應用TGMD 系列的時間序列圖Figure 1 Time series diagram of the domestic research on application of TGMD series
TGMD 系列以其適用性廣、操作性強,高信效度等特性成為當前世界上應用最廣泛的兒童FMS 測評體系。但是跨文化應用效度減弱問題依然是成為TGMD 推廣的“絆腳石”,相關的亞洲數據匱乏是當前該體系在實際推廣中遇到的問題[7]。因此各國學者會根據本國的實際情況進行有針對性地制定基于本國兒童的動作發展測評體系[6]。測評體系主要包括“測量系統”和“評價系統”兩部分,既往研究中當前中國臺灣學者孫世恒等以TGMD 為典范研制了基于臺灣兒童的“大肌肉群動作發展測評”(PGMQS)[46];北京體育大學羅冬梅團隊研制了“3~6 歲學齡前兒童大肌肉群動作發展評價量表”[47],但上述工具停留在“測量系統”層面,可以看出當前我國大陸地區相關的動作發展測評體系較為匱乏。因此,在借鑒和應用TGMD 系列測試流程和評分標準的基礎上,根據工具研發的目的,選取具有我國兒童特色的動作技能指標,構建中國兒童FMS 測量工具,隨后應根據中國兒童的動作發展數據,構建評價體系常模,并參考“國民體質監測”工作的流程,將我國兒童的動作發展測評納入定期的大規模兒童身心健康發展調研中。
人體的動作發展水平既是判斷和檢測機體的身體形態、機能、素質、動作能力等體質健康狀況的外在表現,又是檢測人的體質狀況的基礎因素[2]。我國有針對兒童的大規模的體質普查工作,但是對于動作發展研究還停留在學術研究層面。一方面,兒童FMS 的發展關乎成年時期專項運動技能能否保持,是“終身運動”的基石;另一方面,具有非典型動作發育特征兒童的早期篩查是干預、治療該類兒童的重要前提。因此,建議將動作發展篩查工作納入兒童的健康評價體系,以我國“兒童動作發展測評體系”為工具,開展大規模的兒童動作發展篩查評價,以評估我國兒童的動作發展情況,為后續的兒童動作發展“監控→預測→改進”等工作打下基礎。
作為當前世界上應用最廣泛的FMS 測評工具的TGMD,其成功推廣的原因不僅在于測評體系的高度標準化,更重要的是FMS 的發展確實在兒童時期至關重要。但就目前我國的學術界的情況來看,對兒童動作發展的研究還不夠深入,同時我國學生的FMS 發展情況還沒有納入系統的學生發展評價工作。本研究部分展現了TGMD 的發展歷史和應用現狀,研究者期望本研究可以拋磚引玉,一方面國內學術界加快加深對兒童動作發展研究的開展,將兒童動作發展測評體系的研發盡早提上議程。另一方面在學校體育教育中,將兒童動作發展納入到學生發展測評工作當中,盡快構建學生動作發展“監控→預測→改進”的工作體系,以提升學生的身心健康水平。