石玲
【摘 要】醫學統計是醫學研究中不可或缺的重要組成部分,其普遍使用于實驗設計、資料收集和數據分析中。如何合理應用統計學方法是提高醫學科技論文學術質量和保障科學研究合理開展的重要條件。本文通過分析目前常見的統計方法,對醫學論文中統計方法的合理應用進行探究。
【關鍵詞】醫學論文;統計方法;合理應用
【中圖分類號】R621 【文獻標識碼】B 【文章編號】1005-0019(2018)22--01
醫學論文中資料的類型是決定統計方法類型選擇的重要參考因素。醫學論文中定性資料的比較通常為 檢驗和Fisher精確檢驗,等級資料的比較通常為秩和檢驗或Ridit分析等非參數檢驗。定量分析的比較,假若資料原本數據或數據轉換后符合正態分布規律和方差齊性的要求,可采用t檢驗和方差分析;假若數據轉換后依舊不符合正態分布規律和方差齊性的要求,則采用配對資料的符號秩和檢驗(Wilcoxon配對法)或多個樣本比較的秩和檢驗(Wilcoxon Kruskal-Wallis檢驗)。
1 t檢驗
t檢驗始于1908年由英國統計學家W.S.Gosset根據t分布原理構建的一種建設檢驗方式,主要應用于計量資料中2個樣本數的比較。就理論而言,t檢驗的應用條件應滿足以下幾點要求:(1)樣本均源于正態分布的總體;(2)兩樣本數相同比較時,還應保證兩總體方差相同。然而,在實際應用過程中,與理論條件通常存在一定的偏差,因此,通常只需其分布呈單峰且接近正態分布即可采用。常見的t檢驗有單個樣本t檢驗、配對樣本t檢驗和兩獨立樣本t檢驗。
1.1 單個樣本t檢驗 其主要應用于判斷樣本均數代表的總體均數和已知總體均數是否具備統計學意義,當樣本例數<60例且總體標準差未知時,采用t檢驗;當樣本例數<60例或 60例且總體標準差已知時,采用u檢驗。
1.2 配對樣本t檢驗 其主要應用于配對設計的兩樣本均數的比較,在應用過程中應保證兩樣本滿足配對設計資料的要求。常見配對設計資料的類型分別有:(1)兩種同質接受試驗的對象,分別采取不同的處理方式;(2)同一接受試驗的對象或同一樣本的兩個部分,分別采用不同的處理方式;(3)同一接受試驗的對象對比經處理前后的結果。
1.3 兩獨立樣本t檢驗 該類檢驗方式又可稱為成組t檢驗,普遍應用于完全隨機設計的樣本均數的比較。與配對t檢驗相比,兩獨立樣本t檢驗在檢驗之前,還需對兩組資料進行方差齊性檢驗。如果方差齊性檢驗結果為小標本且方差齊,則采用t檢驗;如果方差齊性檢驗結果為不齊,則采用校正t檢驗。或者采用取對數、開方和倒數等方式對數據進行轉換來使兩組資料滿足方差齊性后再進行t檢驗。又或者選用非參數檢驗。此外,當兩組樣本例數>50例時,為避免t檢驗的過于繁瑣,可采用u檢驗。
2 方差分析
方差分析普遍應用于超過兩組以上計量資料均數的比較。該類檢驗方式的應用應保證各組資料均滿足正態分布和方差齊性的要求。因此,在進行方差分析之前,還應對各組資料進行正態分布和方差齊性檢驗。常見的方差分析有完全隨機設計的方差分析、隨機區組設計的方差分析和析因設計的方差分析。
2.1 完全隨機設計的方差分析
該類方差分析主要用于分析完全隨機設計的多個樣本均數所對應的總體均數之間是否存在明顯差異。完全隨機設計是將試驗對象隨機分為兩組或多組,每組所采用的處理方式相同,形成兩個或多個樣本。
2.2 隨機區組設計的方差分析
該類方差分析的設計步驟為:(1)將所有試驗對象根據種類或特征的不同分為若干區組;(2)對區組內的各個研究對象采取不同的處理方式。經以上設計后,即可判斷出處理因素和組區因素是否對試驗效應產生作用。此外,由于該類設計能盡可能的使各區組內研究對象的水平接近,降低了個體差異對研究結果產生的影響,與成組設計相比,更能檢驗出處理因素之間的差異。
2.3 析因設計的方差分析
將 2個處理因素的各種濃度水平進行排列組合、交叉分組的試驗設計。該種設計能在檢驗出各個因素各水平之間差異的同時,還能檢驗出各因素之間的作用情況,同時也能找到處理因素的各種濃度之間的最佳組合。
目前,部分醫學論文中采用t檢驗來代替方差分析的統計學計算方式是不符合規定要求的。t檢驗僅適用于判斷2個小樣本均數之間的差異性,而針對多組均數采用t檢驗進行比較,則有可能會將原本相同的2個總體均數判斷為存在差異,對結論的可信度造成嚴重影響。在對比多個樣本均數時,其正確的分析步驟應為首先對多組均數進行方差分析,在檢驗統計量具有意義時,再對多個樣本均數進行多重比較。
3 檢驗
檢驗是目前應用較為普遍的假設檢驗方法,然而在醫學論文中主要應用于分類計數資料的假設檢驗,如用于2個樣本率的比較、多個樣本率的比較、樣本內部結構的比較、樣本率與總體率的比較以及某現象的實際分布與其理論分布情況的比較。然而,在樣本符合正態分布條件時,即樣本例數n與樣本率p符合np>5和n(1-p)>5時,可通過計算假設檢驗統計量u值來進行判斷。常用的 檢驗有2×2表 檢驗、配對資料 檢驗和R×C表 檢驗。
3.1 2×2表 檢驗
該類檢驗方式適用于2個樣本率或構成比的比較,在檢驗過程中,當整個試樣樣本數n 40例且某理論評書1T 5時,需連續校正 值。由于 值與T值呈反比關系,在T值過小時, 值會增大,容易造成假陽性結論。此外,當樣本數n<40例或某個T值<1時,即使 值經校正公式計算,也會存在一定的偏差,這時則需用2×2表 檢驗的Fisher確切檢驗法。
3.2 配對資料 檢驗
該類檢驗方式適用于配對設計的2個樣本率或構成比的比較,也就是通過單一樣本的數據分析兩種處理結果是否存在明顯差異。在檢驗過程中,當一方處理結果為陽性而另一方處理結果為陰性的樣本數n1和n2的總和小于40例時,需對計算的 值進行校正。
3.3 R×C表 檢驗
該類檢驗方式適用于多個樣本率或構成比的比較。在應用時,當檢驗統計量存在明顯差異時,還應對多個樣本率或構成比進行多重比較。
4 非參數檢驗
非參數檢驗可直接對總體的分布或分布位置進行檢驗,無需考慮總體的參數和分布,主要應用于參數檢驗。非參數檢驗通常適用于:(1)總體分布為偏態或分布形式未知的計量資料;(2)等級資料;(3)個別數據偏大或數據的某一端缺乏確定的數值;(4)各組總體方差不齊。秩和檢驗是非參數檢驗中的常用方法,其主要包括有適用于配對設計的非參數檢驗的Wilcoxon配對法,適用于判斷兩樣本相應總體分布位置有無差異的兩標本比較的秩和檢驗(Wilcoxon Mann-Whitney檢驗)和適用于判斷各樣本相應總體位置有無差異的Wilcoxon Kruskal-Wallis檢驗。此外,在前兩種秩和檢驗是被U檢驗取代時,假若相同秩次數較多,則需校正計算的檢驗統計量。
5 結語
由上可知,不同的統計方法所適用的范圍和條件各不相同。醫學論文中應根據資料的類型選擇合理的統計方法,以提高論文的學術質量,有效開展科學研究,整體提升醫學論文的科學性。
參考文獻
李子建,胡良平,劉惠剛. 醫學論文中統計分析錯誤辨析與釋疑(6)--定量資料分析方法的合理選擇[J]. 中華醫學雜志,2004,84(6):519-521.
梁葆朱,穆俊霞. 醫學論文中統計方法的合理應用[J]. 山西中醫學院學報,2014(6):68-71.
張知洪,莫建坤,雷達,等. 醫學論文中常用統計分析方法的合理選擇[J]. 檢驗醫學與臨床,2011,08(11):1387-1388.
唐龍妹. 醫學論文中統計方法應用的聚類分析[D]. 河北醫科大學,2002.