[摘 要]本文全面地介紹了估計總體標準差的7種主要統計方法:貝塞爾公式法(最為常用)、彼得斯公式法、極差法、最大誤差法、最大殘差法、較差法和最大方差法。系統地研究了各種估計總體標準差統計方法的由來和原理,嚴謹地推導出了其標準差系數的計算公式。根據標準差系數大小所反映出的測量精密度高低可分析比較出各種估計總體標準差統計方法的優劣及其適用范圍。
[關鍵詞]總體標準差;參數估計;無偏估計;系統誤差;隨機誤差;綜合誤差;測量不確定度;自由度;標準差系數
[中圖分類號]O 212 [文獻標識碼]A [文章編號]1005-6432(2013)10-0023-011
1 引 言
在科學實驗中,測量可分為常量測量和變量測量兩大類。物理量的變化量遠小于測量儀器誤差范圍的測量稱為常量測量(又稱經典測量、基礎測量),其核心理論是誤差理論[1-3],誤差理論的基本單元是誤差元(測量值減真值)。測量儀器誤差范圍遠小于物理量的變化量的測量稱為變量測量(又稱統計測量),其核心理論是數理統計理論(概率論是其理論基礎),數理統計理論的基本單元是偏差元(又稱離差元,測量值減數學期望)。標準差(standard deviation,又稱標準偏差、均方差,其英文縮寫詞為SD,此術語1893年由卡爾·皮爾遜首創)是用來衡量一組測量數據的離散程度的統計量,它反映了隨機變量的取值與其數學期望的偏離程度。經典測量學只能處理常量測量問題,而當今頻域界的頻率穩定度測量(常用阿倫方差表示)則屬于變量測量。
等精度測量(equally accurate measurement)是指在測量條件(包括測量儀器的準確度、觀測者的技術水平、環境條件影響及測量方法等)不變的情況下,對某一被測物理量所進行多次測量的一種方法。在實際測量工作中,由相同設備、相同人員、相同環境和相同方法所獲得的各測量值可視為是等精度測量值。文獻[4]介紹了流量計量中的計量學基本原則——等精度傳遞理論。
在測量實踐中,有時為了獲得準確度更高的測量結果,往往要求在不同的測量環境條件下,使用不同的測量儀器,選用不同的測量者和不同的測量次數,采用不同的測量方法進行對比測量,這種測量方法稱為不等精度測量(unequally accurate measurement)。不等精度測量的不確定度應采用加權方式計算[5-6]。
若無特別說明,本文中所涉及的測量均指等精度測量。
2 誤差的種類和應用
誤差公理認為誤差自始至終存在于一切科學實驗和測量之中,是不可避免的,即誤差無處不在,真值是不可知的。在實際應用工作中,可用約定真值或相對真值來代替理論概念中的理想真值。約定真值一般包括約定值、指定值和最佳估計值三種類型。
測量誤差最基本的表示方法有如下三種:①絕對誤差=測量值-真值,絕對誤差通常簡稱為誤差(即真誤差);②相對誤差=絕對誤差/真值≈絕對誤差/測量值;③引用誤差=示值誤差/測量范圍上限(或全量程)。殘差(又稱剩余誤差)=測量值-估計值,殘差可認為是真誤差的估計值。絕對誤差和相對誤差通常用于單值點測量誤差的表示,而對于具有連續刻度和多檔量程的測量儀器的誤差則通常采用引用誤差來表示。
按誤差的特點和性質可將其分為粗大誤差(parasitic error)、系統誤差(systematic error)和隨機誤差(random error)三大類。可消除的粗大誤差(又稱過失誤差,沒有規律可循)應予全部剔除,系統誤差(又稱規律誤差、理論誤差或方法誤差,一個定值或服從函數規律)反映測量的正確度(correctness),隨機誤差(舊稱偶然誤差、不定誤差,服從統計規律,大多數服從正態分布規律)反映測量的精密度(precision),測量的準確度(accuracy,又譯為精確度)則是用綜合誤差(即測量不確定度)來衡量的,有時也用極限誤差來衡量測量的準確度。逐項獲得測量的系統誤差和隨機誤差,采用誤差合成的方法(各系統誤差絕對值相加得系統誤差范圍,各隨機誤差均方根合成則得隨機誤差范圍。系統誤差范圍加隨機誤差范圍可得綜合誤差范圍)合成綜合誤差,它表征了測量結果與真值的不一致程度。
泛指性的“精度”一詞常被用作“精確度(即準確度)”或“精密度”的替代詞,因其并無明確和嚴格的科學定義,故在學術論文中應慎用或棄用。
下面簡要介紹一下隨機誤差所遵循的一些基本統計規律,首先需要介紹中心極限定理:
當測量次數n無限增大時,在真誤差序列中,若比某真誤差絕對值大的誤差和比其絕對值小的誤差出現的概率相等,則稱該真誤差為或然誤差(probable error,又稱概率誤差,它在衡量射擊精密度時尤其顯得重要),記作ρ。
作為精密度的評定指標,中誤差最為常用,因為它反映了真誤差分布的離散程度。
通常以2倍或3倍的中誤差作為隨機誤差的極限誤差(limit error),其置信概率分別是9544%(2σ準則)和9973%(3σ準則)。如果某個誤差超過了極限誤差,就可以認為它是粗大誤差而被剔除,其相應的測量值應舍棄不用。
對于某個測量值,通常采用相對中誤差(即中誤差和測量值之比,又稱相對標準差)配合中誤差來衡量,它能更全面地表達測量值的好壞。
英國物理學家、化學家和數學家瑞利勛爵(Lord Rayleigh,1842—1919)以嚴謹、廣博和精深而著稱,他善于利用簡單的設備做實驗而能獲得十分精確的數據。他因對氣體密度的精確研究并因此參與發現稀有氣體(舊稱惰性氣體)氬而榮獲1904年諾貝爾物理學獎。1892年瑞利在研究氮氣時發現[7]:從液態空氣中分餾出來的氮,其密度為12572 kg/m3,而用化學方法直接從亞硝酸銨中得到的氮,其密度則為12508 kg/m3(現在的最權威數據125046 kg/m3是基于0 ℃和01 MPa時),前者比后者大05117%,因實驗中已排除了粗大誤差的可能,這一差異已遠遠超出隨機誤差的正常范圍(現在通過t檢驗準則可以判定當時瑞利測得的空氣中氮的密度數據是存在系統誤差的)。英國物理化學家和放射化學家拉姆賽(Sir William Ramsay,1852—1916,1904年諾貝爾化學獎獲得者)注意到這個問題并要求與瑞利合作對此問題展開共同研究,最終他們利用光譜分析法于1894年8月13日發現了第一種稀有氣體─氬(Ar)。氬元素的發現是科學家們注意測量結果中的微小誤差(實際上是系統誤差)而取得重大科學發現的經典范例,是名副其實的“第三位小數”的勝利[8]。隨后,其他稀有氣體氦(He,1895年3月)、氪(Kr,1898年5月)、氖(Ne,1898年6月)、氙(Xe,1898年7月)、氡(Rn,1899年,繼釙Po、鐳Ra和錒Ac之后第4個被發現的天然放射性元素)陸續被拉姆賽等人所發現,稀有氣體的發現完善和發展了俄國化學家門捷列夫(1834—1907)的元素周期表(1869年)。
3 統計量的概率分布類型
離散型統計量服從的概率分布類型主要有:①退化分布(又稱單點分布);②伯努利(瑞士數學家,Jocob Bernoulli,1654—1705)分布(又稱兩點分布);③二項分布:包括超幾何分布(又衍生出負超幾何分布)、β-二項分布和離散均勻分布;④泊松分布:包括帕斯卡(法國數學家和物理學家,Blaise Pascal,1623—1662)分布(又稱負二項分布)和幾何分布;⑤對數分布等。
隨機誤差大多服從正態分布或標準正態分布,服從正態分布的隨機誤差具有單峰性、對稱性、有界性和抵償性。正態分布是隨機誤差遵循的最普遍的一種分布規律,但不是唯一的分布規律。隨機誤差服從的常見非正態分布(又稱偏態分布)主要有:①均勻分布(又稱矩形分布、等概率分布);②伽馬分布(Γ-分布):包括指數分布(兩個相互獨立且都服從指數分布的隨機變量之和服從廣義指數分布)、厄蘭(丹麥數學家和統計學家,Agner Krarup Erlang,1878—1929)分布和τ-分布(χ2-分布是其特例)等特例;③χ-分布:包括反射正態分布、瑞利分布和麥克斯韋(英國物理學家和數學家,James Clerk Maxwell,1831—1879)分布等特例,廣義瑞利分布又稱萊斯(美國通信理論專家,Stephen " Steve" Oswald Rice,1907—1986)分布(Rice distribution or Rician distribution),當v=0時萊斯分布退化為瑞利分布;④貝塔分布(B-分布);⑤F-分布:1934年美國數學家和統計學家斯內德克(George Waddel Snedecor,1881—1974)首創,為彰顯英國統計學家和遺傳學家費歇爾(Sir Ronald Aylmer Fisher,1890—1962,方差分析的發明者)的貢獻,后來以其名字命名;⑥t-分布(又稱學生氏分布):1908年由英格蘭統計學家戈塞特(William Sealy Gosset,1876—1937)首創,因他以Student為筆名發表論文而得名;⑦對數正態分布;⑧極值分布:包括重指數分布和威布爾(瑞典數學家,Ernst Hjalmar Waloddi Weibull,1887—1979)─格涅堅科分布(參見本文第73節“極差法”)等;⑨柯西(法國數學家,Augustin Louis Cauchy,1789—1857)分布;⑩辛普森(英國數學家,Tomas Simpson,1710—1761)分布(又稱三角形分布)等。此外還有反正弦分布、截尾正態分布、雙峰正態分布、梯形分布、直角分布、橢圓分布和雙三角分布等。多維概率分布則主要有:①多項分布;②均勻分布;③n(n≥2)維正態分布等。
因彼得斯公式法、極差法、最大誤差法、最大殘差法和最大方差法均只給出了正態分布下的標準差估計的系數因子,故它們一般不適用于非正態分布時的情形。
4 統計推斷
統計推斷是指根據隨機性的觀測數據(樣本)以及問題的條件和假設(模型),對未知事物作出的、以概率形式表述的推斷。統計推斷是由樣本的信息來推測總體(又稱母體)性能的一種方法,它是數理統計學的主要任務,其理論和方法構成數理統計學的主要內容。統計推斷分為參數估計和假設檢驗兩大類問題。參數估計是假設檢驗的前提,沒有參數估計,也就無法完成假設檢驗。
41 參數估計
運用從總體獨立抽取的隨機樣本對總體分布中的未知參數做出估計,稱為數理統計學上的參數估計,它是統計推斷的一種基本方法。參數估計方法主要分為點估計法(根據樣本構造一個統計量,用以對總體參數進行估計)和區間估計法(又稱范圍估計法,主要是根據置信度求置信區間)兩大類。點估計構造統計量(估計量)的常用方法有:①順序統計量法(又稱次序統計量法):主要包括最大順序統計量法和最小順序統計量法兩種。②貝葉斯法(又稱貝葉斯公式、逆概率公式、事后概率公式或原因概率公式):1763年英國統計學家貝葉斯(Thomas Bayes,1702—1761)在其遺作《論有關機遇問題的求解》一文中首先提出。③最小二乘估計法(又稱最小平方估計法):它可使殘差的平方和為最小,1795年德國數學家、天文學家和物理學家高斯(Johann Carl Friedrich Gauss,1777—1855)首先提出其方法,1806年法國數學家勒讓德(Adrien-Marie Legendre,1752—1833)首先用公式表示出最小二乘原理,1900年由俄國數學家馬爾科夫(Andrey Andreyevich Markov,1856—1922)加以發展。④矩估計法(又稱矩法估計、數字特征法):以樣本矩的某一函數代替總體矩的同一函數來構造估計量的方法稱為矩估計法,1894年英國數學家和統計學家卡爾·皮爾遜(Karl Pearson,1857—1936,被譽為“現代統計學之父”)首先提出。一個樣本可確定一個經驗分布函數,由這個經驗分布函數可確定樣本的各階矩。稱統計量S=1nni=1Xi為子樣一階原點矩(簡稱一階矩,即子樣均值);稱統計量Sk=1nni=1Xki為子樣k階矩;稱統計量S=1nni=1(Xi-)2為子樣二階中心矩(即子樣方差);稱統計量Sk=1nni=1(Xi-)k為子樣k階中心矩。⑤最小χ2法:χ2檢驗由卡爾·皮爾遜于1900年首先提出,故χ2統計量又稱皮爾遜公式。⑥最大似然估計法(maximum likelihood estimation method,又稱極大似然估計法):一種重要而普遍的統計量估計方法,其基本思想始于1821年高斯提出的誤差理論,1912—1922年英國統計學家和遺傳學家費歇爾首先將其應用于參數估計并證明了它的一些性質[9-10],其后他在工作中加以發展并使其臻于完善[11]。該估計方法在統計推斷中無須有關事前概率的信息,克服了貝葉斯法(Bayes estimation method)的致命弱點,是統計學史上的一大突破。標準差σ的最大似然估計值是=1nni=1(xi-)2=1nni=1v2i, 其中=1nni=1xi。與最大似然估計法相類似的統計估計方法還有極小極大后驗估計法、最小風險法和極小化極大熵法等。
常用于衡量點估計法是否優良的五大準則是:無偏性[12]、有效性、一致性(又稱相合性)[13]、漸近性和充分性。無偏估計和一致估計(又稱相合估計、相容估計)都屬于優良點估計法。衡量區間估計法的優良準則有一致最精確準則、一致最精確無偏性準則和平均長度最短準則等。如果把參數估計用于統計決策,還可采用統計決策理論中的優良準則(如容許性準則、最小化最大準則、貝葉斯準則和最優同變性準則等)。
標準差的現代統計估計方法通常可將其歸納為一般估計方法和穩健估計(robust estimation,又稱抗差估計)方法兩大類[14]。一般估計方法(均屬標準不確定度分量的A類評定方法)主要包括貝塞爾公式法、彼得斯公式法、極差法、最大誤差法、最大殘差法、較差法和最大方差法等,其中貝塞爾公式法最為常用,極差法、彼得斯公式法和最大殘差法次之,最大誤差法特別適用于比較特殊的場合(如一次性破壞實驗等),較差法和最大方差法的應用場合則相對較少。穩健估計方法基本上可分為三類:M估計(經典最大似然估計法的推廣,稱為廣義最大似然估計法)、L估計(即順序統計量線性組合估計)和R估計(即秩估計,來源于秩統計檢驗)。
估計量的數學期望等于被估計參數,則稱其為無偏估計,否則就是有偏估計。無偏估計的系統誤差為零,其誤差用隨機誤差來衡量;有偏估計的誤差則用系統誤差和隨機誤差的合成(即綜合誤差)來衡量。如今,隨著計算機的日益普及和各類數學統計軟件(包括專用數學統計軟件,如SPSS、SAS和BMDP等)的廣泛應用,數據計算繁瑣一些已無技術障礙可言。實驗測量數據的獲得都要付出一定的人力、物力和財力,追求其準確可靠才是其最高目標,因此有偏估計的系統誤差應盡可能地予以剔除。對于無偏估計來說,其統計量的方差越小則越好(表示其精密度和有效性越高)。
42 假設檢驗
假設檢驗(又稱顯著性經驗、統計檢驗)一般分為參數檢驗(適用于總體分布形式已知的情形)和總體分布類型檢驗(又稱分布擬合檢驗)兩大類。參數檢驗方法主要有u檢驗法(又稱z檢驗法,即正態分布檢驗法)、t檢驗法、χ2檢驗法(又稱皮爾遜檢驗法)和F檢驗法(又稱費歇爾檢驗法)等;總體分布類型檢驗方法主要有概率紙法(包括正態概率紙、對數正態概率紙、威布爾概率紙和二項概率紙等)和χ2檢驗法(適用于任意分布)等。在正態性檢驗法中,以夏皮羅(美國統計學家,Samuel Sanford Shapiro,1930—)─威爾克(加拿大統計學家,Martin Bradbury Wilk,19221218—)檢驗法(1965年,又稱W檢驗,適用于樣本數n≤50時的情形)[15]、達戈斯提諾(美國生物統計學家,Ralph BDAgostino, Jr,19290331—20010818)檢驗法(1971年,又稱D檢驗,一種比較精確的正態檢驗法)[16]和夏皮羅─弗朗西亞(Shapiro-Francia)檢驗法(1972年,又稱W′檢驗,適用于樣本數50 兩個樣本是否來自于同分布總體的假設檢驗方法主要有符號檢驗法和秩和檢驗法等。
當未知總體標準差σ時,判別粗大誤差的準則(即異常數據取舍的檢驗方法)主要有:①格拉布斯準則:1950年由美國統計學家格拉布斯(Frank Ephraim Grubbs,1913—2000)首創[18],并于1969年加以發展[19];②狄克遜準則(又稱Q檢驗準則):1950年由美國統計學家狄克遜(Wilfred Joseph Dixon,1915—2008)首創[20],并于1951年和1953年加以改進[21-23];③偏度─峰度檢驗準則:偏度檢驗法適用于單側情形,峰度檢驗法則適用于雙側情形[24];④羅曼諾夫斯基準則(又稱t檢驗準則、3S檢驗準則):前蘇聯數理統計學家、塔什干數學學派創始人羅曼諾夫斯基(Vsevelod Ivanovich Romanovsky,1879—1954)首創,其檢驗效果最好[25];⑤3σ準則:僅早期采用,只適用于大樣本數時的情形,因其理論上欠嚴謹且樣本數n<11時便失效[26-27],故現已淘汰不用;⑥肖維勒準則:1863年由美國數學家肖維勒(William Chauvenet,1820—1870)首創[28],因其理論的嚴密性有所欠缺,故現已較少采用;⑦重標極差(R/S)檢驗準則:以樣本極差R和標準差S之比作為統計量[29-30]。當已知總體標準差σ時,可采用1948年由印度學者奈爾(Keshavan Raghavan Nair,1910—1995)首創的Nair準則[31-32]。格拉布斯檢驗法、狄克遜檢驗法、偏度─峰度檢驗法和奈爾檢驗法已被列入中國國家標準GB/T 4883—2008[33]。以下5種常用檢驗法的檢驗效果優劣排序依次是:羅曼諾夫斯基檢驗法、格拉布斯檢驗法、峰度檢驗法、狄克遜檢驗法、偏度檢驗法[25]。
估計標準差s=1n-2ni=1(y-)2主要應用于回歸分析和假設檢驗中[34]。
5 測量不確定度
測量不確定度(measurement uncertainty,簡稱不確定度)是測量結果帶有的一個非負參數,用以表征合理地賦予被測量值的分散性。它是說明測量水平的主要指標,是表示測量質量的重要依據。不確定度越小,測量結果的質量就越高,使用價值就越大。“不確定度”一詞起源于1927年德國理論物理學家和哲學家海森堡(Werner Karl Heisenberg,1901—1976,1932年度諾貝爾物理學獎獲得者)在量子力學中提出的不確定度關系,即著名的測不準原理(uncertainty principle)。自國際計量委員會CIPM(法文Comité International des Poids et Mesures)授權國際計量局BIPM(法文Bureau International des Poids et Mesures)于1980年10月提出《實驗不確定度表示建議書INC-1》(1992年被納入國際標準ISO 10012,1997年和2003年分別予以修訂,中國國家標準GB/T 19022—2003等同采用ISO 10012 ∶ 2003[35])以后,經過30多年的研究和發展,現代不確定度理論現已形成較為完整的理論體系。
根據2008年版《測量不確定度表示指南》(GUM=Guide to the Expression of Uncertainty in Measurement)中的規定:不確定度可以用測量結果的標準差(即標準不確定度,它具有可傳播性。當一個測量結果用于下一個測量時,其不確定度可作為下一個測量結果不確定度的分量,這就是不確定度的可傳播性)表示,也可以用標準差的倍數或說明其置信水平區間的半寬度(即擴展不確定度expanded uncertainty,曾譯為延伸不確定度、伸展不確定度)表示。無論采用哪種方法,都需要獲得標準差的數值。
不確定度一般由若干分量組成,其中一些分量可根據一系列測量值的統計分布,按不確定度的A類評定方法進行評定(標準不確定度基于統計方法所進行的評定稱為A類評定,又稱統計不確定度),并用實驗標準差(即有限次測量時總體標準差的估計值,又稱樣本標準差、子樣標準差,主要應用于抽樣推斷和假設檢驗中)和自由度表征(必要時應給出其協方差)。而另一些分量則可根據經驗或其他信息假設的概率分布,按不確定度的B類評定方法進行評定[標準不確定度基于非統計方法(技術規范、實踐經驗和科學知識等)所進行的評定稱為B類評定,又稱非統計不確定度],也用實驗標準差表征(必要時應給出其協方差),一般情況下可以不給出其自由度。
貝塞爾公式法和極差法是兩種主要的標準不確定度分量的A類評定方法[36-43],其中文獻[39]給出的結論是:①當A類評定不確定度分量不是合成標準不確定度中唯一占優勢的分量時,則無論測量次數多少(筆者注:因合成時采用方差相加的方法),(修正前)貝塞爾公式法優于極差法。②當A類評定不確定度分量是合成標準不確定度中唯一占優勢的分量時,則兩種方法的優劣與測量次數有關:當測量次數n<10時(筆者注:參見表73-2,此處寫成“n≤10”則更為準確),極差法優于(修正前)貝塞爾公式法,當測量次數n≥10時(筆者注:參見表73-2,此處寫成“n>10”則更為準確),(修正前)貝塞爾公式法優于極差法。
標準不確定度分量的B類評定方法主要有倍數法、正態分布法、均勻分布法(修約誤差、修約前的被修約值、數字儀表的量化誤差等均服從此類分布)、反正弦分布法、二點分布法、梯形分布法、三角分布法和投影分布法等[44-46],它更多的是依賴于經驗的積累和判斷。B類評定方法常應用于計量基準標準、儀器研制和在無法對比測量的情況下。
不確定度報告應該包括測量模型、估計值、測量模型中與各個量相關聯的測量不確定度、協方差、所用的概率密度函數的類型、自由度、測量不確定度的評定類型和包含因子等。
在實際應用工作中,有效數字的正確取位十分重要,但這個問題卻往往被忽視。測量結果總是以數字形式出現的,而能準確反映測量結果的是其有效數字。有效數字的末位數總是由下一位數進位或舍去而得來的,這就是數字修約。有效數字的定義是:一個數的修約誤差不大于其末位數的半個單位,則該數的左邊第一個非零數字起至右邊最末一位數字都是其有效數字。不確定度的有效數字只能取1位或2位[47-49]。
6 自由度
自由度(degrees of freedom)的定義是:在方差的計算中,和的項數減去對和的限制數[36,50]。自由度反映了實驗標準差的可信賴程度,自由度越大,實驗標準差的可信賴程度就越高。由于不確定度是用標準差來表征的,故自由度可用于衡量不確定度評定的質量,它也是計算擴展不確定度的依據。當對標準差σ取A類評定的標準不確定度s的值時,不確定度的自由度計算公式為[46]:
式(6-1)是自由度估計值的計算公式(此估計值與理論值相比偏小,隨著樣本數n的增大,其估計值越來越接近于理論實際值),其中D(X)/E(X)為統計量X的相對標準差,u(x)為被測量x的標準不確定度,u[u(x)]為標準不確定度u(x)的標準不確定度。顯然,自由度與標準不確定度的相對標準不確定度有關,即自由度與不確定度的不確定度有關,或者說自由度是一種二階不確定度。
不確定度是測量結果的一個參數,而自由度則是不確定度的一個參數,它表征了所給不確定度的可信賴程度。算術平均值標準差的自由度和單次測量標準差的自由度是相同的。
自由度具有尺度變換下的不變性(即隨機變量乘以非零常數,其自由度不變)。對于合并樣本標準差,其自由度為各組自由度之和,即v=m(n-1)。當用測量所得的n組數據按最小二乘法擬合的校準曲線確定t個被測量值時,其自由度v=n-t;若t個被測量值之間另有r個約束條件,則其自由度v=n-t-r。
各種估計總體標準差方法的自由度如下表所示。
每個不確定度都對應著一個自由度,按A類評定的標準不確定度分量的自由度就是實驗標準差的自由度。合成標準不確定度uc(y)的自由度稱為有效自由度veff,它說明了評定uc(y)的可信賴程度,veff越大,表示評定的uc(y)越可信賴。一般情況下,按B類評定的標準不確定度分量可以不給出其自由度。但在以下情況時需要計算有效自由度veff:①當需要評定擴展不確定度Up為求得包含因子kp時;②當用戶為了解所評定的不確定度的可信賴程度而提出此要求時。
7 標準不確定度的A類評定方法
標準差是評定測量結果精密度的一個極其重要的參數,關于各種估計總體標準差統計方法的精密度分析,前人已多有研究[52-56],但都缺乏深度和廣度,其系統性和準確性也不夠(有時甚至出現一些差錯和遺漏,詳見下文中的相關描述)。下面筆者將詳細闡述各種估計總體標準差統計方法的由來和原理,嚴謹推導出其標準差系數的計算公式,力圖以科學、嚴謹和求實的態度,分別對其系統地做出全面而準確的評介、對比和分析。
71 貝塞爾公式法
貝塞爾公式法(Bessel formula method)[57-63]是一種最為常見的估計總體標準差的統計方法。根據nj, k=1j≠kδjδk=0來推導貝塞爾公式長期以來被一些學者所認同,現已證明其為偽證[64-65]。筆者現根據誤差理論、概率論和數理統計學中的基礎知識,從誤差和標準差的本質和作用入手,利用數學期望和方差公式,采用算術平均值的標準差來推導出貝塞爾公式。
n次測量值的算術平均值為:=1nni=1xi
算術平均值是μ的一致最小方差無偏估計,且不存在比它一致性更好的其他估計量。
德國天文學家和數學家貝塞爾(Friedrich Wilhelm Bessel,17840722—18460317)是天體測量學的奠基人之一,以其專著《天文學基礎》(1818年)為標志發展了實驗天文學,他重新訂正布拉德雷(英國天文學家,James Bradley,1693—1762)星表并編制基本星表(后人加以擴充后成為《波恩巡天星表》),測定恒星視差(1838年)并預言暗伴星的存在,導出修正子午環安裝誤差的貝塞爾公式[即式(71-4)],導出用于天文計算的內插法貝塞爾公式(此式中的系數被稱為貝塞爾系數),編制大氣折射表并導出大氣折射公式。首創貝塞爾歲首(又稱貝塞爾年首)、貝塞爾假年(又稱貝塞爾年)、貝塞爾日數(又稱貝塞爾星數)和貝塞爾要素等概念,沿用至今。其研究成果還有貝塞爾方程(1817—1824,一類二階常微分方程)、貝塞爾不等式(1828年)和貝塞爾地球橢球體(1841年)等。1938年2月24日發現的國際編號為1552(1938DE)號的小行星后被命名為“貝塞爾星(Bessel)”,這是對他最好的紀念和褒獎。
貝塞爾方程兩個獨立的解分別稱為第一類貝塞爾函數Jn(x)和第二類貝塞爾函數Yn(x),Hn(x)=Jn(x)±iYn(x)則稱為第三類貝塞爾函數,其中第二類貝塞爾函數又稱為諾伊曼(Carl Gottfried Neumann,1832—1925)函數或韋伯(Heinrich Martin Weber,1842—1913)函數,第三類貝塞爾函數又稱為漢克爾(Hermann Hankel,1839—1873)函數。諾伊曼、韋伯和漢克爾均為德國數學家。
在規范化的常規測量中,若在重復性條件下對被測量X作n次測量,并且有m組這樣的測量結果,由于各組之間的測量條件可能會稍有不同,因此不能直接用貝塞爾公式對總共m×n個測量值計算其實驗標準差,而必須計算其合并樣本標準差(又稱組合實驗標準差)[77],即:
上式中,xjk是第j組第k次測量值,j是第j組n個測量值的算術平均值。
當各組所包含的測量次數不完全相同時,則應采用方差的加權平均值,權重(即自由度)為(nj-1),此時的合并樣本標準差為:
上式中,nj是第j組的測量次數,s2j是第j組nj個測量值的樣本方差。
在一些常規的日常校準或檢定工作中,采用合并樣本標準差往往會取得良好的效果[79-81]。
以下選用最為常用的修正前后貝塞爾公式法作為其他各種估計總體標準差統計方法的比較基準。
參考文獻:
[1]費業泰誤差理論與數據處理[M].北京:機械工業出版社, 2000(第4版).
[2]馮師顏誤差理論與實驗數據處理[M].北京:科學出版社, 1964
[3]周秀銀誤差理論與實驗數據處理[M].北京:北京航空學院出版社, 1986
[4]賈克軍,石軍廣,賈文軒,等等精度傳遞理論在流量計量中的應用[J].工業計量, 2012,22(4):9-11
[5]魏諾,史彭,張伯乾,等非等精度測量不確定度表示兩種方法的比較[J].高校實驗室工作研究, 1999(2):35-36
[6]彭靖不等精度直接測量不確定度的評定[J].中國計量, 2003,8(3):58-59
[7]郭奕玲,沈慧君諾貝爾物理學獎(1901—2010)[M].北京:清華大學出版社, 2012
[8]楊正一氬元素發現的啟迪[J].西安石油學院學報, 1989,4(4):89-93
[9]RAFisherOn an absolute criterion for fitting frequency curves[J].Messenger of Mathematics, 1912,41∶155-160
[10]RAFisherOn the mathematical foundations of theoretical statistics[J].Philosophical Transactions of the Royal Society of London, Series A, 1922,222∶309-368
[11]RAFisherTheory of statistical estimation[J].Mathematical Proceedings of the Cambridge Philosophical Society, 1925,22(5):700-725
[12]孫翠先,步金芳正態總體方差和標準差的無偏估計[J].唐山學院學報, 2012,25(3):5-6,9
[13]盛驟,謝式千,潘承毅概率論與數理統計[M].北京:高等教育出版社, 2001(第3版).
[14]林洪樺測量誤差與不確定度評估[M].北京:機械工業出版社, 2010
[15]SSShapiro, MBWilkAn analysis of variance test for normality(complete samples)[J].Biometrika, 1965,52(3/4):591-611
[16]RBDAgostinoAn omnibus test of normality for moderate and large size samples[J].Biometrika, 1971,58(2):341-348
[17]SSShapiro, RSFranciaAn approximate analysis of variance test for normality[J].Journal of American Statistical Association, 1972,67(337):215-216
[18]Frank EGrubbsSample criteria for testing outlying observations[J].Annals of Mathematical Statistics, 1950,21(1):27-58
[19]Frank EGrubbsProcedures for detecting outlying observations in samples[J].Technometrics, 1969,11(1):1-21
[20]WJDixonAnalysis of extreme values[J].The Annals of Mathematical Statistics, 1950,21(4):488-506
[21]WJDixonRatios involving extreme values[J].The Annals of Mathematical Statistics, 1951,22(1):68-78
[22]Robert BDean, WJDixonSimplified statistics for small numbers of observations[J].Analytical Chemistry, 1951,23(4):636-638
[23]WJDixonProcessing data for outliers[J].Biometrics, 1953,9(1):74-89
[24]田禹基于偏度和峰度的正態性檢驗[D].上海:上海交通大學碩士學位論文, 2012
[25]王文周未知σ,t檢驗法剔除異常值最好[J].四川工業學院學報, 2000,19(3):84-86
[26]張敏,袁輝拉依達(РайTа)準則與異常值剔除[J].鄭州工業大學學報, 1997,18(1):84-88
[27]王承雙3σ準則與測量次數n的關系[J].長沙電力學院學報(自然科學版), 1996,11(1):73-74
[28]William ChauvenetA manual of spherical and ccd7b6ae8f34d757002496f99794b773practical astronomy VolII(Theory and use of astronomical instruments)[M].Philadelphia:JBLippincott & Co, London:Trübner & Co, 1863
[29]王璽,羅旭微機在化學分析逸出值檢驗中的應用[J].沈陽藥學院學報, 1991,8(1):52-57
[30]吳擁政重標極差法及其應用[J].統計與決策, 2004(8):23-24
[31]KRNairThe distribution of the extreme deviate from the sample mean and its studentized form[J].Biometrika, 1948,35(1/2):118-144
[32]呂恕正態樣本異常Nair檢驗統計量的近似分布[J].東北師大學報(自然科學版), 1990,22(3):41-45
[33]GB/T 4883—2008, 數據的統計處理和解釋——正態樣本離群值的判斷和處理[S].
[34]鄒傳忠關于標準差三種表現形式的應用[J].江西煤炭科技, 2004(2):66
[35]GB/T 19022—2003, 測量管理體系——測量過程和測量設備的要求[S].
[36]全國法制計量管理計量技術委員會JJF105911—2011,測量不確定度評定與表示[S].
[37]柳歷波測量不確定度的A類評定的幾個問題[J].上海計量測試, 2009,36(4):27-28
[38]林洪樺測量不確定度評定應基于誤差理論[J].自動化與信息工程, 2011,33(4):1-4,12
[39]倪育才測量不確定度理解與應用(二):極差法和貝塞爾法之間的比較[J].中國計量, 2004,9(8):78-79
[40]巫業山測量不確定度A類評定的兩種方法:貝塞爾法和極差法[J].衡器, 2011,40(4):23-24
[41]李慎安測量不確定度表達百問[M].北京:中國計量出版社, 2001
[42]耿維明測量誤差與不確定度評定[M].北京:中國質檢出版社, 2011
[43]羅剛不確定度A類評定及不確定度B類評定的探討[J].計量與測試技術, 2007,34(12):42-43
[44]劉智敏,劉風不確定度的B類評定方法[J].中國計量學院學報, 1995,6(2):51-57
[45]劉智敏不確定度原理[M].北京:中國計量出版社, 1993
[46]王中宇,劉智敏,夏新濤,等測量誤差與不確定度評定[M].北京:科學出版社, 2008
[47]張少偉有效數字的正確取位[J].電力標準化與計量, 1997(3):38,45
[48]李謙關于測量不確定度的有效位數和修約間隔[J].電力標準化與計量, 1998(1):4,19
[49]李謙數字修約間隔和修約規則[J].電力標準化與計量, 1998(2):5-7
[50]李維明測量不確定度自由度的評定方法及一般取值范圍的探討[J].工業計量, 2007,17(5):52-53
[51]山內二郎統計數値表(Statistical Tables and Formulas with Computer Applications, JSA-1972)[M].東京:日本規格協會JSA(Japanese Standards Association), 1972
[52]王正向標準偏差估值之極限分布及其應用[J].數學的實踐與認識, 1983,13(1):20-33
[53]徐揚光關于總體標準偏差σ的估計精度分析[J].中國質量管理, 1983(2):19-21,31,18
[54]黃景祥幾種標準差估計方法的精密度比較和評價[J].中國計量學院學報, 1995,6(S1):93-97
[55]周富臣,孫玉蓮總體標準差σ的五種估計及估計精密度[J].計量技術, 2006(12):60-64
[56]周富臣標準偏差的六種估計及其精密度[J].上海計量測試, 2007,34(1):10-13
[57]陳樹祥,朱洪海,杭雪珍正確認識貝塞爾公式[J].計量與測試技術, 2003,30(1)32,37
[58]莊正輝,吳先球,陳浩貝塞爾公式的推導及其物理意義探討[J].大學物理實驗, 2010,23(4):80-82
[59]林景星貝塞爾公式計算實驗標準差的探討[J].上海計量測試, 2011,38(2):44-45
[60]朱洪海關于隨機誤差標準差的幾點思考[J].鹽城工學院學報, 2001,14(4):20-21,28
[61]谷秀娥關于標準誤差和標準偏差的討論[J].大學物理實驗, 2006,19(3):66-67,101
[62]鄧永和中誤差貝塞爾公式的推導[J].大地測量與地球動力學, 2009,29(3):128-130
[63]鄧永和中誤差貝塞爾公式推導的進一步研究[J].鐵道勘察, 2009(5):8-9
[64]朱洪海對貝塞爾公式證法的探討[J].計量與測試技術, 2001,28(6):8-9
[65]馬美娟貝塞爾公式推導的再研究[J].佳木斯大學學報(自然科學版), 2011,29(2):290-291,295
[66]張本良貝塞爾公式用于估算函數誤差的論證及其使用范圍[J].武漢工學院學報, 1992,14(4):56-61
[67]朱安遠用彼得斯公式估計總體標準差的誤差分析[J].中國市場(物流版), 2012,19(19):28-31
[68][波蘭]M費史概率論及數理統計[M].王福保,譯.上海:上海科學技術出版社,1962
[69]周概容概率論與數理統計[M].北京:高等教育出版社, 1984
[70]張世英,劉智敏測量實踐的數據處理[M].北京:科學出版社, 1977
[71]何永政質量檢驗不確定度與應用數理統計[M].北京:中國計量出版社, 2009
[72]樊順厚正態分布的子樣標準差過低估計了總體標準差[J].紡織基礎科學學報, 1994,7(3):242-244
[73]樊順厚,劉樹琪子樣標準差過低估計總體標準差[J].紡織高校基礎科學學報, 1996,9(1):27-42
[74]黃景祥標準偏差的無偏估計及貝塞爾公式修正系數的簡便計算[J].計量技術, 1990(6):36-38
[75]何克明貝塞爾公式修正系數的準確簡便計算[J].計量技術, 2000(12):49
[76]王文周標準偏差的標準偏差有多大相對誤差[J].四川工業學院學報, 2002,21(1):86-88
[77]倪育才實用測量不確定度評定[M].北京:中國計量出版社, 2009(第3版).
[78]陳成仁,劉智敏,王永泉實驗標準(偏)差和平均值實驗標準(偏)差意義解析[J].中國計量, 2010,15(1):96-98
[79]朱安遠線性傳感器靜態性能指標的計算[J].冶金計量, 1990(4):32-35
[80]朱安遠線性傳感器的靜態校準及其基本性能指標的計算[A].鋼鐵工業自動化——應用電子技術改造鋼鐵工業學術會議論文集[C].北京:冶金工業出版社, 1993:821-830
[81]GB/T 19549—2001,傳感器主要靜態性能指標計算方法[S].
[作者簡介]朱安遠(1964—),男,湖南邵東人,工學學士(工業電氣自動化專業),高級工程師,高級銷售經理,現任北京金自天正智能控制股份有限公司市場營銷部副部長兼華東區區域經理,主要從事工業自動化(尤其是冶金自動化三電系統)領域的市場營銷和應用工作。近期三大研究主題:低壓變流器電流過載能力指標(關注此事始于1999年)、諾貝爾獎獲得者(喜好此事源自1981年)和總體標準差的統計估計方法(研究興趣來自筆者1987年對此事的系統性歸納和總結)。業余愛好:數學,自稱諾迷(類似于球迷、郵迷、歌迷或影迷,酷愛研究諾貝爾獎獲得者且樂此不疲),倡議在國際上創建諾學(類似于中國的紅學)。E-mail:1461877797@qqcom。