張建軍 (《首都醫科大學學報》編輯部,北京 100069)
?
·醫學教育·
醫學論文寫作中常見的統計學問題及分析
張建軍(《首都醫科大學學報》編輯部,北京 100069)
【摘要】從實驗設計、數據的統計分析方法、結果分析以及統計術語的書寫等方面分析了醫學論文中常見的統計學問題或錯誤,以期對科研人員和醫學期刊的編輯人員有所幫助,盡量減少醫學論文寫作中的統計學錯誤,提高論文的學術質量.
【關鍵詞】醫學論文;統計學;科技期刊
0引言
科學研究很早就已經從簡單的定性分析深入到細致的定量分析,科研工作者要面對大量的數據分析問題,科研數據的統計分析結果直接影響著論文的結果分析. 只有通過嚴格縝密的實驗設計和數據分析,才能保證論文的科學性和可靠性;只有如實地對研究數據進行分析,才能真實反映研究內容的本質;也是通過嚴格的數據分析,才能排除偶然因素對事物內在規律的影響. 所以統計分析的前提必須可靠,要在周密設計的基礎上收集準確而完整的原始資料,遵循隨機抽樣的原則,實驗組間具有可比性并設置對照組. 不具備可靠的前提,即使進行了統計分析,也不能彌補或糾正科研設計的不足,其研究結論也缺乏可信度[1]. 因此科研人員一定要選擇正確合適的實驗設計和數據統計方法,才可能保證科研結果的正確性. 對醫學研究來說,醫學論文的研究結果可以說與人類健康息息相關,這就要求醫學研究人員在研究中盡量避免出現實驗設計和數據統計方面的錯誤,也要求醫學期刊的編輯人員具備一定的醫學統計學知識. 然而,在中國醫學論文中存在的統計學錯誤非常普遍[2],統計學的誤用率約為80%,即便是國家級基金資助的科研論文其統計學誤用率也達到50%[3-4]. 目前,一些醫學研究院、所都有專門的統計學處理機構和人員,可為本單位或外單位提供實驗數據的統計分析服務;一些有實力的醫學期刊也擁有專職或者兼職的論文統計學審稿專家,對論文的統計學問題進行把關. 這些對減少醫學論文設計和寫作過程中的統計學錯誤有很大幫助,但是一個不可避免的事實是仍有大量的醫學研究人員和編輯部缺乏相應的論文統計學幫助. 作為一門專業的知識,讓每位科研人員和編輯從業者都精通統計學,的確是一件比較困難的事情. 不過,在醫學論文的寫作中,有一些常見的統計學問題或者錯誤,卻是我們可以通過學習,容易掌握并可避免出現的. 本研究擬從實驗設計、數據的統計分析方法、結果分析以及統計術語的書寫等方面進行闡釋,以期對醫學論文乃至科研論文的寫作人員和編輯人員有所幫助和借鑒.
1實驗設計常見問題及分析
一個完整的研究設計,其基本內容應包括研究的目的、意義、研究對象、研究內容與方法,還包括研究進度及其預期結果等. 統計設計是整個研究中最重要的一環,是研究工作應遵循的依據. 實驗設計要遵循隨機、對照、重復和均衡四原則. 醫學論文中實驗設計中存在很多問題,如樣本量不足或者過多、研究對象的背景資料不清楚、樣本缺乏代表性等. 在眾多常見的問題中,以下幾點是更容易發生且可避免的:①沒有設置對照組或者對照組設置不合理;②實驗分組未采用隨機化;③樣本缺乏代表性;④樣本量達不到統計分析要求或樣本量過大.
1.1對照組缺乏或者對照組設置不合理設立對照是臨床醫學科研設計的核心問題之一,也是描述性研究和分析性研究的主要區別. 如果缺乏對照或對照設置不當,就無法正確分析實驗結果[5]. 在實驗設計中、尤其是醫學基礎研究和臨床研究中,對照組和實驗組的樣本來源背景要一致,這樣才能保證組間樣本的基礎狀況具有可比性;在一些特殊的實驗中,如配對實驗中,還需要對照組和實驗組的樣本數量盡量一致,如因取材等原因難以保證一致,也盡量不要差別太大. 在醫學論文中,很多對治療性方法進行總結的文章中,往往會忘記設置對照組,在沒有設置對照組或者有效對照組的情況下,就僅僅以本院的回顧性病例為基礎,根據治愈率得出某種藥物或治療方法有效等結論[5].
1.2實驗分組未采用隨機化隨機化原則是研究設計中必須遵循和貫徹的原則,是實驗設計中避免偏倚和混雜因素最有效的方法. 在實驗過程中其實會有許多非實驗因素(如一些人為的主觀因素)干擾實驗結果的科學性和準確性,而研究者可能對此還不知情. 為了避免這些隨機誤差的干擾,就有必要采用隨機化的辦法來抵消或者盡量減少這些干擾因素的影響. 在很多醫學論文中,往往缺乏對樣本隨機化的分組,只是簡單的隨意分組,難以保證樣本之間的可比性;也或者盡管采用了隨機化分組和隨機抽樣,但缺乏對隨機抽樣方法的具體說明,如采用的是單純隨機抽樣還是系統抽樣等. 其實,利用隨機數字表或者計算機生成隨機數字就可以簡單快捷地完成隨機抽樣.
1.3樣本缺乏代表性在很多實際研究中,由于研究對象的總體太大,或者研究對象本身的取材就很難,要得到研究對象的總體是不可能的,這就需要從總體中抽取若干個體組成集合(即樣本)進行研究,通過樣本特征來對總體進行判斷. 因此,從總體中抽取的每個個體都一定要具有代表性和普遍性,而不是一些特殊個體,否則難以反應總體特征. 對臨床研究而言,因為受人力、物力等條件限制很難直接對總體進行研究,但臨床研究的結果直接關乎人類健康,因此,樣本是否具有代表性,將直接影響研究結果的適用性[5].
1.4樣本量達不到統計要求或樣本量過大對任何研究而言,在隨機分組的前提下,如果能得到更多的樣本,即樣本量越大,組間的非處理因素的均衡性也就越好,樣本統計值也越可靠,更貼近總體特征. 但在實際研究過程中,當樣本量太大時,其實會給整個實驗和質量控制工作帶來很多不必要的困難,同時也會造成不必要的浪費. 但樣本容量過小,就無法進行有效的統計分析,或者統計效能會降低,不能得到準確和可靠的分析結果. 同時,我們還要根據不同的研究對象來確定合適的樣本量. 如對一些特殊病例的研究,總體數量本來就稀少,要得到一個大樣本的數據,也就不容易了. 一般來說,醫學統計中,樣本容量一般要求在100以上,同時對照組和實驗組樣本量還要盡可能相等或者接近.
2數據的統計方法常見問題及分析
實驗設計的方法直接決定了數據采取何種統計學方法. 因為每種統計方法都要求數據滿足一定的前提和假定,所以論文在實驗設計的時候,就要考慮到以后將采取哪種數據統計方法更可靠. 醫學統計方法的錯誤千差萬別,其中最主要的就是統計方法和實驗設計不符,造成數據統計結果不可靠. 這里列舉一些常見的可以避免的問題和錯誤.
2.1數據統計分析方法使用錯誤或不當醫學論文中,最常見的此類錯誤就是實驗設計是多組(≥3組)研究,需要對數據使用方差分析的時候,而作者都采用了兩樣本的均數檢驗.
2.2統計方法闡述不清楚在同一篇醫學論文中,不同數據要采取不同統計處理方法,這就需要作者清楚地描述出每個統計值采用的是何種統計學方法,但在許多使用一種以上數據統計分析方法的醫學論文中,作者往往只是簡單地把論文采用的數據統計方法進行了整體羅列,并沒有對每個數據結果分析分別交代具體的統計方法,這就很難讓讀者確認某一具體結果作者到底采用的是何種數據分析方法.
2.3統計表和統計圖缺失或者重復統計表或者統計圖可以直觀地讓讀者了解統計結果. 一個好的統計表或統計圖應該具有獨立性,即作者即使不看文章內容,也可從統計表或統計圖中推斷出正確的實驗結果. 而一些醫學論文只是簡單地堆砌了大量的統計數字,缺乏直觀的統計圖或表;或者雖然也列出了統計表或統計圖,但表或圖內缺項很多,讓讀者難以從中提取太多有用的信息. 另外,也有作者為了增加文章篇幅,同時列出統計表和統計圖,造成不必要的浪費和重復. 統計表的優點是詳細,便于分析研究各類問題. 統計圖(尤其是條形統計圖)的優點是能夠直觀反映變量的數量差異.
3結果分析中常見錯誤和分析
醫學論文中對數據統計結果的解釋,最常見的兩個錯誤就是過度信賴P值(結果可信程度的一個遞減指標)和回避陰性結果. 前一個錯誤的原因是因為一些作者對P值含義理解有誤,把數據的統計學意義和研究的臨床意義混淆. 比如高血壓患者的藥物降壓實驗,對照組不使用降壓藥物,實驗組使用某種降壓藥后人均降壓6 mmHg左右,如果單純地比較統計學結果,這樣的差異是非常顯著的,但不能由此得出該種降壓藥物對高血壓患者有效. 因為結合實際的臨床效果來看,高血壓患者血壓下降6 mmHg并不具備實際的臨床意義. 所以醫學研究人員一定要注意不能單純依靠統計值武斷地得出一些結論,一定要把統計結果和臨床實踐結合在一起,這樣才會避免出現類似的錯誤. 至于回避陰性結果,只提供陽性結果,是因為不少作者在研究設計時,難以擺脫的一種單向的思維定式就是主觀地先認定自己所預想的某種結果結論. 在歸納某種結果原因時,從一個方向的實驗就下完美的結論,尤其是如果這個結論可能對實際情形非常有意義時. 這樣的思維定勢過于強調統計差異的顯著性,有時會刻意回避報道差異的不顯著結果,不思考和探究差異不顯著的原因和意義,反而會因此忽視一些重大的科學發現. 當然,目前也的確存在很多醫學期刊只接受陽性研究結果,這也是需要醫學期刊界反思的. 不過一些醫學期刊已經注意到這樣的情況,比如有一些醫學期刊專門發表一些陰性結果的論文.
4統計術語書寫常見問題和分析
在醫學論文中,這方面的問題相對前面的3個問題不是那么嚴重,但卻非常瑣碎,而且是作者在書寫過程中只要認真就完全可以避免的錯誤. 下面列舉一些常見的問題和錯誤.
4.1統計符號書寫錯誤統計學符號在醫學論中被經常使用,正確使用統計學符號能夠準確、清晰地表述實驗結果,增強論文的說明力[6]. 在此類錯誤中,最常見的問題是統計學符號的大小寫混淆、正斜體混淆和統計符號的誤用. 如樣本量n寫成大寫N或者正體n;或者誤用n代替自由度df;標準差s還繼續使用非標準的符號SD表示,P值使用小寫p或者正寫P表示等.
4.2統計值不完整其實,許多國外醫學期刊中也存在此類問題,就是僅僅給出統計值P值,而不列出其他統計結果值,如F值(方差分析中F檢驗方法的一個檢驗值),df值,t值等.
4.3統計術語的用詞不準確比如,在大多數醫學論文中,在方法一項中都采用“以P<0.05或者0.01為統計具有差異性”來定義檢驗水準. 這里建議使用更專業的術語“差異顯著性水平a=0.05 或者0.01”,或更為準確的是“檢驗水準a=0.05 或者0.01”進行表達. 另外,現在也基本不再使用“結果差異顯著”或者“結果差異極顯著”來描述統計結果,而采用統計學上主張的“差異有統計學意義”或“差異有高度統計學意義”來表述.
5小結
其實,以上列舉的只是醫學論文中最常見的一些統計學問題和錯誤,在醫學論文中,還有其他很多更專業的統計學錯誤,但要求所有作者和編輯人員都能全部掌握這些知識過于困難,而以上歸納的幾點問題,卻是大部分作者和編輯通過簡單的統計學習就可以基本掌握,在寫作或編輯過程可以盡量避免的一些錯誤. 通過不斷的學習和使用,作者和編者同時提高統計學方面的知識,這對于提高期刊的學術質量也具有重要意義.
【參考文獻】
[1] 肖麗娟. 從編輯角度談醫學論文寫作中的統計學應用問題[J]. 蘇州大學學報:工科版,2006,26(5):90-92.
[2] 邱芬,曾令霞,國榮. 統計學審查在醫學論文審稿中的必要性[J]. 中國科技期刊研究,2011,22(4):574-576.
[3] 胡良平,李子健. 醫學統計學基礎與典型錯誤辨析[M]. 北京:軍事醫學科學出版社,2003:4.
[4] 胡良平,張天明. 影響我國科研成果和學術論文質量的要因分析[J]. 科學觀察,2006,1(4):9-19.
[5] 王晴,李剛. 醫學論文中常見的統計學問題分類簡析[J]. 編輯學報,2006,18(4):270-272.
[6] 李軍紀,馬艷霞,王沁萍. 醫學論文中統計學符號n的幾種錯誤書寫形式[J]. 中國科技期刊研究,2006,17(3):501.
Common statistics problems and its analysis in medical paper’s writing
ZHANGJian-Jun
Editorial Office of Journal of Capital Medical University, Beijing 100069, China
【Abstract】From the experimental design, the method of statistical analysis, the analysis of results and the writing of statistical terminology, to summarize and analysis the common statistics problems or errors in medical papers. It is hoped to help medical researchers and editorial staff of medical journals to minimize the statistics errors in medical paper’s writing or editing, so to improve the quality of academic papers.
【Keywords】medical thesis; statistics; science and technology journal
【中圖分類號】Z62
【文獻標識碼】A
作者簡介:張建軍. 副編審,副研究員. Tel:010-83911349E-mail:syxuebao@ccmu.edu.cn
收稿日期:2015-12-02;接受日期:2015-12-18
文章編號:2095-6894(2016)01-88-03