(亳州市計量檢查測試所 安徽 亳州 236800)
在計量檢測的過程中,對數據信息精準性的要求極為嚴格。在獲取了大量數據信息后,必須對其展開科學有效的整理,剔除其中潛在的異常數據,進而充分保障計量檢測工作的實效性。對于剔除異常數據的四類準則,應當根據實際情況,有針對性地選擇使用,或者也可以通過綜合利用多種準則的方式,保障異常數據剔除工作的質量。
計量檢測即在日常的各種生產實踐活動當中,鑒于對多類數據的運用需求,進而詳細評估檢測儀器的測量結果,最終借助于評估結果來判斷檢測儀器的實際是否滿足工作需要的狀態。所獲得檢測數據至關重要,唯有通過這些數據,才能夠知道被測儀器的穩定性及每項參數是否達標。如果缺乏科學有效的計量檢測工作,便無法獲取具有價值的數據,那么企業在生產過程中優化產品質量以及控制工藝過程等目標便難以實現。
在統計學領域,對一組數據進行多次測量后,倘若組中存在個別數據和其他數據存在顯著差異,那么則可推斷此數據為可疑數據[1]。此類數據最突出的特征就是和同組數據存在極為明顯的差異。換言之就是數據出現了變異,但是究竟這種變異是否正常,還需進一步展開深入研究。
計量儀器不僅精度高,而且對周遭環境要求非常嚴苛。倘若環境出現了顯著的變化,也極有可能會使得計量檢測出現誤差,進而嚴重影響檢測結果的實效性。通常情況下,致使計量設備出現誤差的原因主要有四種。首先是被檢設備受到了強烈的沖擊,通常是機械性沖擊或來自于外部的強烈震蕩。其次是電壓的波動或者是電磁干擾,致使被檢設備受到了一定的影響而難以正常運行。再次則是檢測人員自身的因素,由于其玩忽職守導致測量失誤或缺乏豐富的工作經驗,進而引發了誤差。最后則是被檢儀器本身已經出現了損壞,例如電子元件故障或內部零件松動等等。
因為異常數據和正常值之間存在極大的偏差,倘若參與到計算活動中,必定會嚴重影響結果的準確程度。所以必須對異常數據進行及時剔除,不過在剔除過程中若選擇了不合理的方式,不但無法有效消除異常數據帶來的負面影響,還會形成測試重復性極佳的假象,最終對人們的數據評判造成誤導。反之,若對異常數據的存在置之不理,則會嚴重降低測量數據的重復性,對測試儀器的等級造成負面影響[2]。
在具體的計量檢測之中,判斷異常值的準則并不是單一的,常見的主要有四種,分別為拉依達準則、格布拉斯準則、肖維勒準則以及t檢驗法等等[3]。盡管者四種準則的主要內容存在顯著差異,但是在判斷過程之中均用到了“置信概率”。這里所說的“置信概率”即隨機變量處于“置信范圍”的可能性。設置信范圍所代表的測量數據的值領為X,各項準則的表達式如下所述:
把所測得的數據帶入于此表達式當中,倘若不等式成立,則表示此數據為異常數據,必須盡快進行剔除。其所代表的意義是,可疑數據和組中其他數據的平均值差額的絕對值,超過了標準偏差的三倍,所以該數據作為異常數據必須被剔除。

在使用此公式的時候,應當綜合相互獨立所測得的數據,倘若公式滿足以上不等式時,則可以得出Xd為異常值,必須及時進行剔除。

本文通過列舉實例,對上述四種異常數據判斷準則實施判定。
例如:在實施精度測量過程中,獲得了以下一組數據,共十個,分別為10.001、10.205、10.217、10.221、10.229、10.231、10.311、10.321、10.341以及10.347。分別通過以上四種方式實施判斷,并且對異常數據展開剔除,置信概率定為95%,α=0.05。
在此實例之中,使用四類判定準則所獲取的結果相同,即10.347為異常數據。其中G(α,n)s和10.001-10.2424最靠近。這也充分表示,此時運用格拉布斯準則的效果最佳。

總的來說,在實施計量檢測的過程之中,若要有效剔除異常數據,可以綜合運用兩種甚至三種不同的判定準則,在同一時間實施判定。倘若所得到的結果一致,那么則可以毫無疑問地對可疑數據進行剔除,進而保障剔除工作的準確性。倘若所獲得結果存在差異,那么則需展開進一步的研究分析,最好是做數據保留處理。