張寧
(寧夏大學 體育學院,寧夏 銀川 750021)
體育類核心期刊中運動醫學論文的統計學應用錯誤案例分析
張寧24
(寧夏大學 體育學院,寧夏 銀川 750021)
就近年來體育類核心期刊運動醫學科研論文撰寫中常見的統計學應用誤區進行分析,結果發現:①實驗分組不合理,受試對象的選取違背同質性原則;②統計方法不合理,多個樣本均數比較,錯誤應用多個 t檢驗代替,誤用單因素方差分析處理多因素方差分析;③誤判資料類型,從而誤用定量資料統計分析方法,兩樣本率的檢驗錯誤用兩樣本的t檢驗來代替。
統計學;運動醫學論文;體育類核心期刊
統計學是科學研究的基礎,是研究結果科學性、可靠性的有力保障。而論文是研究成果的表達形式,通過論文可展示研究者的科研成果,也便于查閱者的了解、評價和引用。因此,在論文中要完整、準確地進行統計學內容的表述,以展示研究設計的合理性和研究結果的可靠性。但運動醫學論文中存在的統計學錯誤仍相當嚴重,其中實驗設計和統計資料的應用上最為突出。本文介紹論文中出現錯誤的部分,并對其進行了正確的統計學內容表述,以便供廣大運動醫學科研工作者參考。
1)實驗分組不合理。
例1:《有氧健身操結合飲食控制改善代謝綜合征患者胰島素抵抗、血脂、血糖的實驗研究》[1]一文中研究對象為:西安市碑林區某社區代謝綜合征患者 77人年齡 40~65(55.35±7.26)歲。按照接診順序將入選MS患者隨機分為以下2組,綜合干預組和對照組。
該文作者所選取代謝綜合征患者年齡跨度較大(40~65歲),因為年齡的不同機能的代謝水平有很大的差異性,不能認為他們來自于同一個總體。把他們隨機分入綜合干預組和對照組參加試驗,兩組之間的可比性可能很差,其結論的可信度很低;如果,按年齡段分層隨機化,組間的均衡性要高得多。
2)受試對象的選取違背同質性原則。
例2:《不同類型休閑活動對老年女性身體機能影響的差異性研究》[2]一文中對成都市老年大學、錦江區老年活動中心,隨機選取離退休5年以上,年齡65~75歲之間老年女性為研究對象。并依據她們的年齡段將活動類型分為:為棋牌隊、曲藝隊、門球隊、舞蹈隊;測量指標為:血壓及脈率,肺活量,椎體骨密度。
從一般的常識可知,經常參加體育鍛煉的人有利于其血壓及脈率,肺活量、椎體骨密度指標向好的方向發展。原作者所選取的活動類型為:棋牌、曲藝隊、門球隊、舞蹈。其中棋牌是一種智力游戲和身體運動沒有什么關系,而曲藝,門球,舞蹈主要以身體運動為主(曲藝有利于人體的肺活量的提高)。所以原作者在試驗設計時違背同質性原則[3]。
在實驗設計時一定要遵守3大原則:對照、隨機、重復。對照原則:要確定處理因素對實驗指標的影響,如無對照是不能說明問題的。實驗分組時有處理組和對照組。對照原則要求處理組和對照組除處理因素以外的其他可能影響實驗的因素應力求一致(即齊同比較或有可比性)。隨機原則:是使每個實驗對象在接受分組處理時具有相等的機會,以減少偏性,使各種因素對各組的影響保持一致(均衡性好),通過隨機化可減少分組人為誤差。這是對資料分析時進行統計推斷的前提。重復原則:是指可靠的實驗應能在相同條件下重復出來(重現性),這就要求實驗要有一定的例數(重復數)。因此,重復的含義是重現性與重復數。重現性可用統計學中顯著性檢驗的值來衡量其是否滿意[4]。
2.1 多個樣本均數比較錯誤應用多個t檢 驗
例3:《有氧運動對大鼠血糖、血脂和血液凝固功能的影響》[5]一文中,將30只大鼠隨機分為3組:對照組、小運動訓練組和大運動訓練組。對照組大鼠進行自由飲食和自由飲水;運動訓練組動物在此基礎上給予為期6周的游泳訓練。有氧運動(游泳)、運動后2周和運動后4周從眼眶后靜脈叢取血,以及實驗結束時(運動后 6周)斷頭取血,分別做血糖、血脂和有關凝血指標的測定。用 SPSS統計軟件對原始數據進行常規數理統計分析,計量資料用均數±標準差描述,顯著性檢驗用t檢驗,P<0.05表示有統計學意義。
這類錯誤是定量資料分析中最常見的錯誤,而且是原則性錯誤,會增加犯第一類錯誤的概率[6]。案例(原)表1資料為對照組、小運動組、大運動組不同有氧運動時間對大鼠血清LDL水平的影響,原作者用t檢驗分別對各組均數逐一進行比較。對照組大鼠在實驗期間血清LDL水平沒有明顯變化P>0.05。與對照組相比,小運動組大鼠隨著有氧運動時間的延長,血清LDL濃度逐漸降低,至第 6周時,差異具有統計學意義P<0.05。大強度游泳運動訓練組的大鼠血清LDL則呈逐漸升高趨勢,雖然與同期對照組大鼠相比,差異沒有統計學意義P>0.05,但與同期(第4周和第6周)小運動組大鼠血清 LDL相比,差異具有統計學意義P<0.05和P<0.01。這種檢驗方法有誤,因為該資料為多組均數間的比較,正確的方法是用單因素方差分析,只有在方差分析有顯著性的基礎上有必要再作均數間的兩兩比較,用q檢驗,而不是t檢驗,同時在表1中應該列出方差分析的統計量F值及具體的P值。
(原)表1 不同有氧運動時間對大鼠血清LDL水平的影響(mmol/L,n=10)(±s)

(原)表1 不同有氧運動時間對大鼠血清LDL水平的影響(mmol/L,n=10)(±s)
與對照組相比,1)P<0.05:與小運動組相比,2)P<0.05,3)P<0.01,“原表‥”表示原作者的表格,“表‥”表示取原作者表格的部分
組別 0周 2周 4周 6周對照組 1.01±0.18 1.00±0.16 1.07±0.19 1.03±0.19小運動組 1.06±0.20 0.95±0.17 0.85±0.15 0.72±0.181)大運動組 1.02±0.19 1.03±0.22 1.13±1.172)1.18±0.213)
在應用t檢驗和方差分析時要注意它們之間的共性與區別。t檢驗和方差分析都是對總體(樣本)均數的檢驗。當對兩個以上的總體(樣本)均數是否存在顯著性差異進行檢驗時,如果用t檢驗,4個總體(樣本)均數則需做=6次可能組合的檢驗。若在α=0.05的顯著性水平上檢驗,則將降低統計結論效度。所以,兩總體(樣本)均數的檢驗用t檢驗,兩個以上總體(樣本)均數的檢驗用方差分析。
2.2 處理多因素設計定量資料誤用單因素設計定量資料的方差分析方法
例4:《不同營養干預對運動性貧血大鼠紅細胞及鐵代謝指標的影響》[7]一文中,實驗目的為:觀察補充復方阿膠中藥與補充鐵劑營養對運動性貧血大鼠紅細胞及鐵代謝指標的影響。方法:以32只健康雄性Wistar大鼠為研究對象,每只體重約300 g,隨機分為4組,C組為安靜對照組(n=8),E組為遞增負荷跑臺運動組(n=8),ENⅠ組為遞增負荷跑臺運動+阿膠營養補充組(n=8),ENⅡ組為遞增負荷跑臺運動+鐵劑營養補充組(n=8)。然后ENⅠ組和ENⅡ組營養補充4周。實驗結束后24h內處死。結論:9周遞增負荷跑臺運動導致大鼠紅細胞相關指標的顯著性下降,引起運動性貧血,但血液鐵代謝無顯著變化;補充4周復方阿膠中藥制劑或鐵制劑,提高紅細胞相關指標,改善大鼠運動性貧血狀況。數據統計方法實驗數據用SPSS13.0軟件中one-wayANOVA處理,結果用均數±標準差表示,顯著性水平為P<0.05,非常顯著性水平為P<0.01。
原文采用單因素設計定量資料的方差分析不合適,仔細考察各處理組之間的關系有:是否遞增負荷跑臺運動,是否補阿膠營養或補鐵劑營養(兩者都能促進RBC生成,增加Hb含量的物質,在本研究中可以認為它們是同一因素),原文在固定一個因素于某個水平下觀測另一個因素的作用,這種做法割裂了實驗設計的整體性。正確的做法是,先從專業角度上分析二個實驗因素之間是否存在交互作用、是否存在二個因素有主次之分、是否存在交互作用或交互作用可以忽略不計等情況。也就說對事物的影響只考慮施加了一個條件(因素)為單因素方差分析;如果施加了 2個以上的條件(因素)為多因素方差分析。如果是多因素方差分析還要考慮施加的條件(因素)之間有沒有聯系、有沒有主次之分。具體看(原)表2資料,施加了兩個條例(因素)即遞增負荷跑臺運動和補阿膠營養或補鐵劑營養,然后考慮兩條件(因素)之間的聯系,通過分析2個因素間存在交互作用的可能性比較大,應采用交互作用多因素方差分析處理此定量資料為宜。
(原)表2 9周跑臺運動后大鼠紅細胞指標(±s)變化

(原)表2 9周跑臺運動后大鼠紅細胞指標(±s)變化
與對照組相比較,1)P<0.05,2)P<0.01;營養補充組與運動組相比較,3)P<0.05
組別 N ρ(N Hb)/(g·L-1) 10-12×RBC/L-110-2×HCT/L-1C 8 157.13±6.98 9.16±0.49 48.15±2.43 E 8 141.88±9.142)7.83±1.451)43.10±4.512)ENⅠ 8 151.50±6.483)8.68±0.37 47.24±2.323)ENⅡ 8 149.75±9.103)8.49±0.50 46.61±3.673)
2.3 統計方法不合理,每一種統計方法都有其適用條件
例5:《高脂飲食對大鼠脂肪組織脂解調節因素的影響》[8],原文中采用單因素方差分析的LSD方法對(原)表3各組FFA濃度進行分析,得出結論具有統計學意義。
(原)表3 10周高脂飲食對大鼠血清FFA和甘油濃度(±s)的影響 μmol/L

與 C組相比較,1)P<0.05,2)P<0.01;與 OR組相比較,3)P<0.05,4)P<0.01
多個總體均數比較的方差分析,要求方差齊性。方差齊性實際上是指要比較的各組數據分布是否一致,通俗的說就是各組是否適合比較,一般的經驗是如果在比較的各組中,如有一組的標準差是另一組的一倍時方差不齊性的概率較大。在做方差分析時,做方差齊性檢驗主要是確認數據的合理性(不具相關性)。對(原)表3數據進行方差齊性檢驗,可發現C組與OR組及OB組FFA濃度指標不能滿足方差齊性的要求,故不能采用單因素方差分析的LSD方法。可以先進行對數、倒數或函數的轉換,選擇適當的轉換形式,直到齊性檢驗變為不顯著(不相關)。如果還不行就只能用非參數的單因素分析。
3.1 誤判資料類型,而誤用定量資料統計分析方法
例6:題目:《傳統體育對老年知識分子原發性高血壓患者臨床癥狀影響的觀察研究》[9]原作者對原發性高血壓,癥狀療效評定標準是:頭痛、眩暈、心悸、耳鳴、失眠、煩躁。各癥狀按癥狀輕重不同采用“半定量”計分法,按程度進行分級和計分,共分為4級:(“無”0分、“輕”1分、“中”2分、“重”3分),EH(原發性高血壓)患者經6個月的傳統體育鍛煉實驗,癥狀計分情況。治療前后組內比較,除A組心悸、耳鳴、失眠癥狀外,3組均能改善老年知識分子 EH(原發性高血壓)患者臨床癥狀(P<0.05或P<0.01);實驗后與A組比較,B組眩暈、心悸,C組頭痛、眩暈、心悸、失眠、煩躁癥狀改善均優于對照組P<0.05。
統計資料常常分為定量資料和定性資料兩大類,所謂定量資料是指對每個觀察單位用計量方法測量某項指標所獲得的數值;如身高(cm)、血壓(mmHg)、脈搏(次/min)、紅細胞(104/mm-3)轉氨酶(酶活性)等,都屬于計量資料。而定性資料是指記錄每個觀察單位的某一方面的特征和性質[10]:如血型(A、B、O、AB)、職業(工人、農民、軍人、學生)、性別(男、女),等等。本資料觀察的是原發性高血壓癥狀療效,這里的0、1、2、3、4代表的是原發性高血壓患者癥狀的輕重程度,屬于定性資料中有序資料,(如:無、輕、中、重;治愈、顯效、好轉、無效、死亡),但原作者卻錯誤地將其判斷為定量資料,表的標題后括號內寫x±s的形式,表中給出也是平均數和標準差的數據。一般來說,t檢驗僅適于分析來自“單組設計、配對設計和成組設計”的定量資料,用分析定量資料的方法分析定性資料,顯然是錯誤的。正確判定統計資料的類型是選用統計分析方法的首要前提[11]。本資料屬定性資料,應根據分析目的,合理選用適合此類資料統計分析方法(如Riditi分析或者非參數檢驗秩和檢驗)。
3.2 兩樣本率的檢驗誤用兩樣本的t檢 驗來代替
例7:《健身跑運動對中年人血脂異常者血脂、身體成分的影響》[12]一文中將所有受試者隨機分成低強度組(L組)、中等強度組(M組)和對照組(C組)。數據統計數據用平均值±標準差形式表示。相關指標數據用t檢驗和多因素方差分析進行分析,P<0.05和P<0.01為顯著性差異。脂肪百分比是脂肪體重除以體重,所以表4中實驗前與實驗后的數據是構成比。實驗前后數據的統計處理方法,應采用兩個樣本率的驗檢,即u驗檢而不是t驗檢。如果處理的數據是樣本率(或構成比)時,要對它們進行假設檢驗時,則采用率的假設檢驗,即:正態近似法。當兩樣本含量n1及n2足夠大,此時兩樣本率的頻數分布近似正態分布可用正態分布的原理作 u檢驗。如果是兩個率(或兩個構成比)比較的假設檢驗或多個率(或多個構成比)比較的假設檢驗時,都可采用χ2(卡方)檢驗[13]。
(原)表4 健身跑運動前后男性身高、體重指數和脂肪百分比的變化(±s)

(原)表4 健身跑運動前后男性身高、體重指數和脂肪百分比的變化(±s)
與該組實驗前比較,1)P<0.01
指標 實驗前 實驗后… … …脂肪百分比%L 組 20.27±3.50 19.09±3.311)M 組 23.86±3.38 22.37±3.431)C 組 20.31±3.79 20.49±3.59
運動醫學研究離不開統計設計和統計學方法,如果選擇錯誤導致結果有偏倚或結果原則性的錯誤,對運動醫學的危害性較大。正確的統計分析是獲得正確的科研結論的要素之一。只有明確資料的性質、試驗設計類型、分析目的,掌握相關統計方法應用的前提條件,才能進行正確的統計分析。
[1] 郭漢,高曉華. 有氧健身操結合飲食控制改善代謝綜合征患者胰島素抵抗、血脂、血糖的實驗研究[J]. 北京體育大學學報,2009,32(2):77-82.
[2] 王科峰. 不同類型休閑活動對老年女性身體機能影響的差異性研究[J]. 成都體育學院學報,2009,35(8):70-72.
[3] 潘發明,范引光,葉冬青. 衛生統計學教學形式和內容的拓展[J]. 疾病控制,2004,8(4):1-2.
[4] 趙書祥. 實用體育統計學[M]. 北京:北京體育大學出版社,2008.
[5] 章羅庚. 有氧運動對大鼠血糖、血脂和血液凝固功能的影響[J]. 北京體育大學學報,2009,32(7):66-68.
[6] 胡良平,劉惠剛. 定量與定性資料統計分析錯誤辨析(2)[J]. 外科理論與實踐,2005,10(6):15-16.
[7] 薛統,高頎. 不同營養干預對運動性貧血大鼠紅細胞及鐵代謝指標的影響[J]. 北京體育大學學報,2009,32(8):62-64.
[8] 田吉明,汪軍,王瑞元. 高脂飲食對大鼠脂肪組織脂解調節因素的影響[J]. 成都體育學院學報,2009,35(1):60-64.
[9] 湯慶華. 傳統體育對老年知識分子原發性高血壓患者臨床癥狀影響的觀察研究[J]. 北京體育大學學報,2009,32(2):67-69.
[10] 安勝利,統計學系列講座(第8講):基于秩次的非參數檢驗[J]. 護理學報,2006,13(9):94-95.
[11] 周素華,陸云霞. t檢驗和χ2檢驗常見誤用辨析[J].公共衛生與預防醫學,2007,18(2):110-111.
[12] 鄭健榮. 健身跑運動對中年人血脂異常者血脂、身體成分的影響[J]. 北京體育大學學報,2009,32(7):56-59.
[13] 叢湖平. 體育統計學[M]. 北京:高等教育出版社,1998:122.
Analysis of statistical application errors in sports medical theses in core journals in the sport category
ZHANG Ning
(Institute of Physical Education,Ningxia University,Yinchuan 750021,China)
The author analyzed statistical application mistakes commonly seen in the writing of sports medical research theses in core journals in the sport category in recent years: 1)the division of experiment groups was irrational; the selection of testees violated the principle of homogeneity; 2)the comparison of the average of multiple samples was wrongly replaced with multiple t tests; single factor variance analysis was wrongly used for multiple factor variance analysis; statistical methods were irrational; 3)data type was wrongly judged, thus a wrong quantitative data statistical analysis method was used; the test of two sample rates was wrongly replaced with the t test of two samples.
statistics;sports medicine theses;core journals in the sport category
G80-32
A
1006-7116(2010)11-0115-04
2010-05-02
張寧(1962-),男,副教授,研究方向:體育統計,體育教育。