吳青霞 湖南省長沙市實驗中學
計數資料統計方法常見錯誤分析
吳青霞 湖南省長沙市實驗中學
計數資料統計是統計科研工作的常用工具,對于統計學的發展有著極為重要的作用。目前,計數資料的統計已經在多個學科中得到了應用,但是由于各類人為因素、方法問題的影響,計數資料的統計方法還存在一些錯誤,本文就計數資料統計方法常見錯誤與解決對策進行分析。
計數資料 統計方法 錯誤 對策
計數資料是指先將觀察單位按照一定規律進行分組,再清點各組觀察個數所得出的資料。計數資料統計方法,是衛生統計學中,醫療科研工作的一種重要研究工具,故本文對計數資料統計法存在的常見錯誤進行分析具有現實指導意義。
相對于計量資料,計數資料又稱為無序分類變量資料、名義變量資料或定性資料,其變量定義通常用1、2來表示是或否,等級資料也利用1、2、3、4來替代表示治愈、顯效、好轉、無效幾種臨床檢驗結果。計數資料主要以率、構成比、相對比為構成指標。對于其統計方法的選擇,當比較兩個樣本的均數時,應該選用t檢驗,當比較樣本大于或等于100時,可以選用u檢驗。此外計數資料也有專門的統計方法,即卡方檢驗??ǚ綑z驗的種類比較多,根據實際應用條件的不同,可以選擇一般卡方檢驗、校正檢驗、確切概率法等統計方法。
在計數資料的統計工作中,構成比與率是兩個不同的概念,但是,一些統計工作者經常會將二者混淆起來。舉例說明:某醫師采集了120例骶骨的尾部活檢標本,依據其中44例畸形、3例腫塊、70例腫瘤的統計結果,斷定腫瘤的發病概率大于畸形的發病概率。這就是將構成比與率相互混淆的錯誤,也是衛生統計在臨床科研中比較常見的錯誤之一。該醫生的統計分析是依據病例進行的,所以,該醫生得到的是來醫院就診的患者的疾病類別構成的構成比,而不是疾病的發病率,其統計機構能夠說明的也只是來醫院就診的骶骨病癥患者中,腫瘤的發病概率大于畸形的發病概率。從另一方面來看,該醫師的統計結果并不能準確的得出骶骨病癥患者中患腫瘤和患畸形兩種情況的發病概率。在衛生統計的具體實施過程中,構成比與率混淆的錯誤會造成統計結果或結果中包含內容的極大不準確性,進而給相關的醫療臨床或科研工作帶來錯誤的發展方向和錯誤的資料支持。
在計數資料的統計過程中,如果觀察的例數相對較小,那么抽樣檢測的誤差性也會較大,同時,計數的相對數常常不穩定,導致分析結果的可靠性差。所以,當統計觀察的例數相對較小時,最好以絕對數的形式表示,如果以絕對數的形式表示,還應該給出可信的數量區間。舉例說明:在調查某地區的三位患者時,有一例死亡的情況,因此得出此疾病的死亡率為33.3%的結論。很明顯,這一結論是不正確的,其原因就是觀察的例數過小。很有可能在統計的三位患者中恰巧就有一位患者死亡,假如調查的患病案例是300位,那么統計的結果將會有極大的變動。故當統計觀察的例數過小時,統計最好使用絕對數表示,并列出絕對數的可信區間。
統計人員在對已分組的資料進行計算平均率或合計率的過程中,,應該避免簡單的由各組率單一相加或平均運算得出數據的操作方法。而是應該運用合計或平均的相關實際數字綜合進行運算。舉例:對某兩個醫院的某治療乙肝療法進行統計,在兩個醫院的乙肝患者中,甲醫院共治療150人,治愈30人,其治愈比例為20%;乙醫院共治療100人,治愈30人,治愈比率為30%。兩家醫院的合計治愈比率應該是[(30+30)÷(150+100)]×100%=24%。這個計算結果是正確的。但若計算為20%+30%=50%,或(20%+30%)÷2=25%,則是錯誤的。統計人員一旦沒有使用正確的運算方法對平均率或合計律進行計算,哪怕只是一個小小的失誤或偏差,都會造成統計結果的極大區別,由此給臨床或醫療科研的相關工作帶來極大的麻煩。
資料的可比性誤差也是造成計數資料統計失誤的常見原因之一,例如:要對甲、乙兩地開展醫療改革的情況進行調查,甲區域企業在職職工人數為6×105名,參加醫療保險的人員數量為5×105名,乙區域企業在職職工人數為106名,參加醫療保險的人員數量為7×105名,要得出甲區域的醫療制度改革是否低于乙區域的醫療改革水平。甲地的參保概率應為 5×105÷(6×105)×100%=62.5%,乙地區的參保概率應為7×105÷106×100%=70s%。通過計算,乙區域的醫改水平確實高于甲區域。在計數資料的統計過程中,只有排除了基數的影響,使觀察單位的基數相同,才能正確的對計數資料準確、科學的進行分析與描述。反之,在統計的過程中,如果觀察單位的基數數量不相同,那么,統計的結果會在準確性方面產生極大的誤差,甚至統計的結果與實際的情況完全相反,并由此造成針對統計結果所制定的研究方案或科學舉措不當或錯誤。
綜上所述,計數資料統計方法是醫療臨床和科研工作開展重要分析和研究的工具,然而如果這件工具使用不當,極有可能會給醫療工作帶來相反的效果。為此,在選擇不同統計方法前,應選擇合適的檢驗方法來驗證數據是否可行,對于常見錯誤,本文主要例舉了構成比率混淆,計算相對數時分母偏小,平均率計算偏差,資料的可比性誤差。文中結合事例對各個例舉問題進行研究分析并指出錯誤,提出解決辦法,有效減少錯誤發生概率。
[1]閔瑩.醫學期刊文獻中常見的統計學問題分析[J].天津科技.2016(01)
[2]本刊編輯部.醫學期刊論文中常見統計學錯誤[J].心肺血管病雜志.2016(03)
[3] 醫學論文中常見的統計學問題[J]. 中國繼續醫學教育. 2016(04)
[4]宿瑞俊,張保平,杜瑞軍.醫學期刊論文中常見統計學錯誤分析與方法正確選擇[J]. 中國病案. 2013(03)