王樹陽 ,付 聰 ,孫崇睿 ,趙 華
(1.通化市衛生學校,吉林 通化 134000;2.通化市食品藥品監督管理局,吉林 通化 134001)
統計學是研究數據的收集、整理、分析和結果正確解釋與表達的一門應用性科學。廣泛應用于各個學科領域,在論文撰寫中,必須經過符合統計設計的數據收集、整理、分析,才能得到科學的結果與結論。但從一些期刊論文中發現,常出現統計學應用不當的問題,使讀者無法獲得正確、可靠的信息,影響了論文質量,為此,在論文撰寫中如何正確應用統計學,是亟待解決的問題。
統計學在論文中起到兩個作用。一是通過撰寫和發表論文,對自己研究結果的數據資料進行正確地表達和分析,報告研究成果;二是閱讀別人的論文,理解和評價別人研究成果的可信度,吸收新知識,了解學術進展[1]。只有正確掌握統計學的基本原理和方法,才能充分發揮其應有的作用。
統計設計的內容包括資料收集、整理和分析全過程總的設想與安排[2]。統計設計正確與否,直接影響到論文研究結果的可靠性。任何設計的缺陷,都不能期望事后彌補。在進行研究工作之前,必須有一個周密的統計設計。在統計設計時,需要查閱大量的文獻資料,了解研究問題的實際情況,明確研究目的,根據研究目的進行統計設計、資料收集、結果分析等;研究目的不明確,就無法進行統計設計。統計設計在明確研究目的的基礎上,進一步明確研究假說、觀察對象和觀察單位、樣本含量、資料類型和分布特征、隨機分組、對照的選擇、單變量還是多變量、統計方法的選擇、統計結果的表達以及統計圖表的應用等方面的統計問題,做好研究的統計設計,能保證研究的順利進行。
根據論文的研究目的和統計設計要求,及時、準確、完整地收集原始資料[3];要重視原始資料,對原始資料的數據不能隨意更改,確保其完整性和準確性;對于特殊數據,結合研究目的和統計要求進行處理。整理資料的任務是凈化原始數據,必須要反復檢查、核對,確保準確無誤,使其系統化、條理化,能準確計算統計指標和進行統計分析。
統計分析的目的是計算有關統計指標,反映數據的綜合特征,闡述事物的內在聯系和規律。統計分析包括統計描述和統計推斷兩個方面。統計分析方法很多,選擇何種統計分析方法取決于研究的目的、統計設計類型、觀察指標組成的資料性質和樣本含量大小等因素。一般需要考慮以下問題:(1)反映變量是單變量、雙變量還是多變量;(2)變量資料的類型;(3)影響因素是單因素還是多因素;(4)資料是單一樣本、兩組樣本還是多組樣本;(5)資料是否配對;(6)資料是否滿足檢驗方法所需的前提條件。這些問題直接關系到論文中統計分析方法的選擇。
常用的統計分析方法有以下幾種。
對于單變量正態分布數值變量資料兩樣本比較,選用均數描述其集中趨勢,選用標準差描述離散趨勢。根據統計設計選擇統計推斷,如是成組設計兩小樣本資料,選用成組設計兩小樣本均數比較的t檢驗;如是成組設計兩大樣本資料,選用成組設計兩大樣本均數比較的u檢驗;如是配對設計資料,選用配對設計差值均數比較的t檢驗。對于單變量正態分布數值變量資料多樣本比較,選用單因素方差分析的方法。對于雙變量正態分布數值變量資料兩樣本比較,選用線性直線回歸分析和線性相關分析。
對于單變量對數正態分布數值變量資料,選用幾何均數描述集中趨勢、選用對數變換后的標準差來描述離散趨勢。根據統計設計選擇統計推斷,如是成組設計兩小樣本資料,選用成組設計兩小樣本幾何均數比較的t檢驗;如是成組設計兩大樣本資料,選用成組設計兩大樣本幾何均數比較的u檢驗。
對于偏態分布數值變量資料,選用中位數描述集中趨勢、選用極差或四分位數間距描述離散趨勢;統計推斷選用秩和檢驗等非參數檢驗。
對于分類變量資料兩樣本比較,選用相對數描述其集中趨勢,選用率的標準誤描述離散趨勢。根據統計設計選擇統計推斷,如成組設計,總例數n≥40,理論頻數T≥1,選用4個表資料的卡方檢驗;如配對設計,選用配對設計4個表資料的卡方檢驗;如成組設計,總例數n≥100,且 nP和n(1-P)都大于5,選用成組設計兩樣本率比較的u檢驗或卡方檢驗。對于分類變量資料多樣本比較,選擇行×列表資料卡方檢驗。
摘要是論文實質性核心內容的濃縮,簡述研究目的、方法、結果和結論。摘要中要有表示論文研究結果的重要統計指標的數值(或),可信區間及假設檢驗結果(值)。統計表達決定了論文摘要中科技信息的含量和可信度。
在材料與方法中除了專業方面的描述以外,統計學描述包括以下兩方面:(1)清晰地描述研究設計的內容。其中包括研究類型,觀察對象類型、入選和剔除標準,觀察方法和測量技術,以及實驗、試驗或調查資料的搜集過程等。尤其應具體地描述論文研究對象的來源和選擇方法,包括研究對象基本情況、有無隨機分組、樣本含量等。若有隨機分組,說明具體隨機化分組方法。總體與樣本的描述混淆是論文常出現的統計錯誤。此部分體現了論文所有統計分析結果的可靠性、研究結論的合理性及研究成果的重復性。(2)說明所采用的統計分析方法與統計軟件。論文數據處理中用到的所有統計方法都要說明,而且,必須清楚地指出在何處用了何種統計方法。常用的統計方法只說出其統計方法的名稱即可,但特殊的統計處理除說出方法的名稱外,還需加注文獻出處。統計計算軟件一般給出名稱即可,如Excel、SPSS、SAS 等。
論文的統計結果主要用統計指標表示。統計指標較多時,可進行分組比較,利用文、表、圖三者結合來進行統計表達,三者各盡所長,互相補充。正態分布的數值變量資料兩組或多組比較,劃出三線式或四線式統計表來表達統計指標,應給出各組例數、均數和標準差,同時,寫出假設檢驗方法、相應的檢驗統計量值(t值、u值、F值)和概率值(值);分類變量資料,使用相對數時,分母(即樣本含量)要交代清楚,小樣本不宜計算相對數,列三線式或四線式統計表時,給出例數、率、標準誤,寫出假設檢驗方法、相應的檢驗統計量值(u值、值)和概率值(值);非參數統計分析方法時,數據的集中趨勢用中位數表示,離散趨勢用百分數表示,多選用秩和檢驗。
在結果項內,應專寫自己的實驗或調查結果,特別是自己的新貢獻,不加分析推理的內容,也不夾雜前人的工作。結果中,不應以“有增多(或減少)的趨勢”“有……傾向”這類含糊之詞,來掩蓋無明顯統計學意義的結果。敘述實驗、觀察結果在內容上一定要客觀,不允許用主觀偏見來歪曲事實,要有其內在邏輯性,力求做到脈絡清晰,結果嚴謹,層次分明,使人一目了然,自然而然地導出本文的結論,從而體現論文的科學性和準確性。
一篇論文學術水平的高低,與討論部分闡述有密切的關系。如果說,結果部分是利用統計結果擺事實,討論部分則是依據統計分析講道理。對假設檢驗結果進行解釋,重點闡述各種觀察結果之間的關聯與因果關系,標出概率值,論述其內在規律性,闡述本研究中所發現的新的、重要的事實,對結果做必要的綜合分析說明,揭示事物本質。
綜上所述,通過論證統計學在論文中的統計設計、資料的收集整理、統計指標的計算、統計方法的正確選擇應用,以及統計表達對論文質量的影響等方面,明確了統計學在論文中正確應用的重要性,為論文撰寫提供統計學應用經驗。