樓平兒 杜秉華 戴美玲 毛元良 唐國慶 張和軍



摘? 要:電子測定技術是在現代育種技術需要和現代科技進步下發展起來的一種針對飼料報酬測定的新技術,不僅極大提高了測定工作效率,也提供了現代育種技術所需要的動物生長全過程的表型值信息。但電子測定工作數據也帶來了與傳統習慣認知不同的表現,主要是在工作數據的正確性表述上。
測量不確定觀點認為,測量過程中的不確定性廣泛存在于所有的測量工作中,被測量值(“真值”)是一個理想化概念,而且測量得到的量值(“測量結果”)也必定存在某些不確定的誤差。電子測定與傳統習慣的人工測定在工作數據正確性表述上不同的原因是測量不確定效應對這兩種數據的影響不同,而且電子測定工作數據到目前為止還是一個沒有測定意義的純記錄性質的觀測列數據。
在電子測定過程中,對測定過程的監測和測定數據正確程度的評估是測定管理中一個很重要的工作內容,監測是監視工作數據中的異常表現,評估計算工作數據中的異常表現對其正確性的影響程度。本文在測量不確定性觀點下,從監測和評估電子測定工作數據正確性的可行性上分析電子測定過程中可能出現的問題和評定測定工作數據質量可信度的方法。
關鍵詞:工作數據可信性;測量不確定度;種豬生產性能
中圖分類號:S813.24 文獻標志碼:A 文章編號:1001-0769(2023)05-0047-06
根據種豬生產性能電子測定工作數據的表現和性質,從測量不確定性出發,決定了不能用習慣的數據誤差的評判方法來評估電子測定工作數據的正確性,因為習慣的數據誤差概念是建立在一個被測量的真值基礎上,而電子測定工作數據在實踐中和理論上都不能得到這個基礎真值。習慣的數據誤差計算方法是建立在孤立和單獨數據基礎上的四則運算數學模型上的,而電子測定工作數據的表現是一個無法用習慣方法進行管理和處理的數據集合,顯然也需要異于習慣的分析方法和較為復雜的數學模型才能判斷測定過程中發生的問題和評估工作數據的質量問題。
電子測定工作數據在實踐運行中沒有表現出有測定意義數據屬性和大數據特征的狀況,而是引申出了在管理電子測定工作時需要改變的四個觀念:
①電子測定工作由測定的工作過程和對工作數據的正確性進行評定兩部分組成,即得到了工作數據后還要對其正確性進行評定,這才是一個完整的種豬生產性能測定行為。
②評定電子工作數據正確性的原因不以傳統影響因素分類,如各種類型的系統誤差等,但可以把測定過程中的各種影響結果所涉及到的數據、資料和經驗等信息按統計方法進行處理和分析。
③用測定不確定性觀點評定電子工作數據正確性時,關注的不是每次測定數據的“真值”,而是數據觀測列中相關數據段“表現出”的符合動物行為和測定條件下的表型值。
④人工測定數據的正確性以孤立的真值為中心,測量結果與真值的差異程度是一個數量差值。電子測定種豬生長性能數據的正確性在測量不確定性的框架下進行評定,工作數據的正確性以數據觀測列的測量結果為中心,所以測量結果與被測量值的相符程度是一個分散性區間范圍,也就是這種數據的“正確性”用一定置信范圍的可信程度來表述更合適。
電子測定工作數據需要在上述四個觀念改變的基礎上,對電子測定工作數據的可信性按測量不確定度的評定方法進行評定,用評定的結果幫助監測過程的運行和評估測定數據的質量。評定其工作數據的測量不確定度的具體工作由以下幾方面組成:分析不確定度的來源和確定不確定度分量項目;對作為不確定度來源的分量進行評定;把所有影響數據正確性的分量進行合成以得到觀測列數據的階段測定或全測定期的測定數據不確定度報告。
1? 分析不確定度來源
用測量不確定性觀點評定電子工作數據正確性影響原因不以傳統影響因素分類,而是把測定過程中的各種影響結果所涉及到的數據、資料和經驗等信息以統計方法進行處理和分析。電子測定工作數據的測量不確定度來源就是實踐工作中得到的信息和分析,不確定度分量的確定就是根據對測定監測需要和測定數據質量的要求,再在諸多影響的結果中選擇所需要的項目。
雖然在電子測定過程中反映種豬生長性能的飼料報酬是個間接被測量值,但有直接相關的三個直接被測量值:采食量、體重和身份識別,種豬生產性能報告的正確性與這三個被測量值的正確性都直接相關。影響這三個被測量值正確性的因素主要是稱重系統的穩定性和故障、飼料秤和體重秤校正值、動態投料功能故障(特指動態投料型設備)、數據缺省和設備運行狀態。我們的經驗是把稱量值的正確性、動態投料型設備的正確性(特指動態投料型設備)、數據鏈完整的正確性和系統維護信息等四類項目作為電子測定工作數據不確定度的分量。
減少各分量彼此間的相關性可以減少數學模型的復雜性,減少分量的項目有利于一線工作人員的可操作性,我們認為電子測定工作數據不確定度分量項目的設定宜為:
飼料稱量正確性;
體重稱量正確性;
動態投料正確性;
數據鏈正確性;
系統維護信息(包括飼料秤和體重秤的校正信息,工作系統的維護和保養信息)。
2? 評定輸入量的標準不確定度ui
對測量不確定度分量進行評定是評估電子工作數據可信性工作的重要組成部分,不僅是為了確定某個不確定度分量作為總不確定度的計算單元,而且是測定管理工作中監測影響數據正確性的原因的需要。
測量不確定度對其影響產生誤差的估計方法可用被測量值的分散性來表示,而分散性通常用統計概率分布的標準偏差來表示。由于電子測定的狀況和數據特點,不能以復測和復驗為基礎的統計方法來求得其相關的標準偏差,測量科學認為可以用“基于經驗或其他信息所認定的概率分布來評定”,參考JJF 1059.1-2012《測量不確定度評定與表示》。也就是說,不能使用統計方法對電子測定工作數據不確定度分量評定時,可以用我們的工作經驗和其他的非統計方法進行。
以飼料稱重正確性的不確定度分量評定為例,我們評定這個分量的信息源是從分析數據觀測列中有關負采食事件的數據狀況(負采食事件是指一次采食事件的采食量為0 g以下的有效記錄量),這個信息在很大程度上與飼料稱重常見的粘連相關,當然也包括一些其他原因,如設備的電子噪聲、動物行為等情況,然后把這個結果作為評定飼料稱重的不確定度分量,再進入下一步的總不確定度的合成。以下是評定這個分量過程的經驗介紹。
我們的材料數據來自良好管理下的32個測定站涉及250多頭測定豬全程記錄的近32萬個工作數據記錄。所用方法參照杜秉華等[1]推薦的方法。“良好管理”的概念是整個測定過程中,按操作規程管理測定工作;沒有發生過重大的運行故障和嚴重的數據異常現象;日常管理中發生問題的處置時間基本不超過24 h。
產生負采食量的原因有多種,如設備的電子噪聲、機械粘連、動物行為甚至意外故障等。其原因可分成兩類,即隨機和非隨機,兩類原因導致的負采食量事件在數據鏈結構和量值方面會有不同表現特點,這兩類性質的數據通常也是所謂的“正常”和“不正常”工作數據的特征,“隨機原因”在這里指的是只能估計但不能消除的原因,如設備性能和操作方法帶來的原因;“非隨機原因”在這里是指可以分析出并采取措施能減少影響程度的原因,如故障等。這里要指出的是,上述的“正常”工作數據表述只用于在良好管理下的數據表現情況,而在不良好管理下的工作數據表現基本是無意義和無法分析的。
圖1顯示的情況是以上述引用的材料數據中所有負采食量事件的情況分析,并基于產生負采食量的原因把其大致分成4個量值段,觀察藍色曲線的概況。
圖1顯示的情況表現如下:
①在現在科技支持下的電子測定運行時不屏蔽這類“出錯”信息情況下,出現負采食量事件的記錄是一定有的。
②表示負采食量事件比例數的粗黑曲線在右起第三個量值段內有轉折的變化,表示轉折變化“拐點”的右面曲線呈急劇上升狀況,而左面顯示平緩并趨于零的狀態。在系統正常運行狀態下的連續平滑的粗黑曲線在某處出現一個明顯的斜率變化,這表示引起“拐點”兩邊的比例變化很可能是由不同的原因造成的,是屬于可控和不可控的原因。設備運行的可控因素通常是外界因素引起的故障等,不可控因素是設備本身的性能如噪聲等。
③我們認為,拐點左面出現的小概率并趨于零的負采食事件數是因為在良好管理下各類運行“出錯”被控制,拐點右面出現的大概率負采食事件數很可能是即使在良好管理下還不可控的設備性能“噪聲”而致。
再細化圖1中顯示“拐點”的情況,對分析這個拐點的意義有幫助。為此在-20 g位置左右檢查了幾個量值段之后,發現拐點發生的準確范圍應是-5 g~-20 g量值段。? ?見圖2。
圖2顯示的情況表現如下:
①負采食量事件數比例從-5 g~-20 g的量值段急劇降低。圖2顯示的情況是這個“拐點”經過放大后實際上的一個范圍,可以看到這個基本范圍為-5 g~-14 g。
②關于系統主要部件稱重傳感器的電子噪聲問題。畜牧設備通用的飼料稱重傳感器規格是C3級20 kg量程,該傳感器的設計和制造稱量精度是6.7 g,參考GB/T 7551-2008《稱重傳感器》。稱量精度體現在幾個因素上,如非線性、重復性、穩定性等在時間和空間上的影響。這就是說傳感器帶來的電子噪聲可能產生6.7 g的稱量誤差。
③關于電子測定設備的示值精度和反映不確定度分量信息的分辨率問題。測定站現場和終端電腦的現場顯示1 g通常是單位的示值精度,所以當測定設備的系統噪聲幅度遠超1 g時,沒有必要考慮用0.1 g作為單位示值精度,這里用0 g~-19 g量值段來分析拐點位置是合適的。
④系統噪聲的表現特點是低幅度和呈統計規律的分布,這是隨機性質的數據表現。從圖2的觀測列數據記錄來看:粗黑曲線拐點右側的負采食量事件數顯示了這些數據的低幅度和統計規律的隨機性,而這些表現與電子測定設備系統性能的噪聲特點有很高的吻合性,由此可認為拐點右側的負采食量事件是由系統噪聲引起的。選定0 g~-19 g量值段的另一個理由:這是最大限度避免測定豬實際采食的時刻,是顯示設備噪聲的合適窗口。
⑤隨機性質的數據特點是平衡性和抵償性,也就是說負采食量事件發生的飼料量對總采食量的影響在大數據情況下是可以被平衡抵償的。
⑥拐點右側的量值是系統噪聲在負方向上的半寬值,這個“拐點”可以被認為飼料稱重粘連“出錯”的量值段起點。
隨機性質的數據特點是平衡性和抵償性,而其隨機產生的“誤差”表現則是一個數據隨機波動的范圍。這個以某個參考值為中心的范圍,在數軸上表示就是一個寬度,以該參考值為中心的右邊是正方向的半寬值,左邊則是負方向的半寬值。我們在分析電子測定系統的噪聲時,選擇了零采食量作為中心原點,在這里幾個數據圖表中顯示的都是零采食量事件記錄表現出來的負方向的隨機性質數據的半寬值。
圖1和圖2的分析顯示了這類事件數據的表現態勢,為確定飼料稱重粘連的“出錯”值起點,我們把材料數據中32個測定站在0 g~? -19 g量值段內從各自的實際狀況再做一個統計分析,見圖3。
圖3顯示的情況表現如下:
①圖3最右端測定站的負采食量事件數比例高達6.9%,而采食量影響只有0.05%;右側第2~7測定站的負采食量事件數比例平均為3.2%,而其平均采食量影響為0.07%。所以這些測定站的實際結果還是采食量低幅度變化的狀況,其總負采食量對總采食量的影響很小,這表示這些測定站發生的事件還是隨機性質的。
②圖3顯示0 g~-19 g量值段的負采食量事件數比例超過平均值2.67%的測定站數有9個,比例達28.1%。所以就圖3右端的7個測定站在設備噪聲影響范圍內的實際狀況,“拐點”的左側終點可以擴展到-20 g。
③從整體上的理解實際發生的記錄:整個稱重系統是一個除傳感器外還有其他電子、電器和機械元器件等構成的總成,各零部件的性能特性和遲滯效應等產生的噪聲都會加持到合成的總稱量精度上。因此,系統的實際噪聲幅度超過6.7 g是可能的,也是符合實際的。故“拐點”的左側終點設定在-20 g處更合適些。
以上操作設定了-20 g為評定稱重粘連原因引起觀測值變化的起點;同樣的原則再評定該量值段的終點位置,得到的結果是-200 g左右。這樣確定了評定飼料稱重粘連原因的量值段。
對評定飼料稱重粘連原因的下一步是輸入需要分析數據觀測列相應的數據鏈段內的負采食量事件數與總采食量事件數的比值作為分散度,以這個結果作為該不確定度分量進入不確定度合成評定。
3? 計算合成標準不確定度uc
把評定后的各相關不確定度分量進行合成計算,得到數據觀測列的總測量不確定度。由于在評定不確定度分量來源時考慮了相關各分量彼此間的相互獨立性,所以在合成過程中得以簡化了合成公式。
不確定度uc的合成公式如下:
按照前文確定的不確定度來源和幾個分量,電子測定工作數據的不確定度合成公式如下:
4? 報告測量結果
測量報告結果包括兩個部分:測量不確定度分量評定結果和合成不確定度結果。
測量不確定度分量評定結果:各個分量是對應各相關影響工作數據因素的正確性而制定的,這個報告的內容是測定過程中的影響數據的相關原因和及其影響的程度,所以該報告不僅是合成不確定度的計算單元,也是測定過程的監測以及維護工作需要的工作報告。
合成不確定度結果:測量的目的是為得到測量數據的可信程度,為此需要把各個相關的測量不確定度分量進行合成評定。評定測量不確定度報告既反映了該批次測量數據的質量水平,又顯示了該批次測量管理的工作水平。
5? 小結
種豬生產性能人工測定與電子測定在工作數據的正確性概念和管理方法上是不同的,將人工測定的數據正確性概念和管理方法用在電子測定工作上是不合適的。
我們曾經將測定不確定觀點用于一個原種場的電子測定管理中,用評定測量不確定度分量的方法對一些主要影響數據正確性信息源進行監測。工作中有3個項目是與本文提到過的飼料稱重正確性、動態投料正確性和數據鏈完整正確性有關的數據表現,這3個項目的內容和量值與美國的一篇有關研究電子測定出錯問題的文獻所介紹的情況相似[2],這些數據是美國國家豬肉委員會在明尼蘇達州豬業協會測定站進行3個科研項目所采信的實驗數據。對美國和我們的同類數據進行比較后發現,我們的工作數據在這3項的“出錯”率比美國文獻數據均降低了2個數量級[3],這也意味著我們的工作數據在這3項因素導致的數據誤差范圍方面縮小了2個數量級,雖然這不是不確定度評定的結果,也不是與美國全部數據比較的結果,但從場內測定的實踐來講,把測量不確定度觀點和方法用于場內電子測定工作的管理是可行的,對提高工作數據的可信度也是有實際效果的。
在探討此方法的過程中還有相當多的工作需要深入:如APP的問題,因為現代機電一體技術下的工作數據形成受到其APP的影響很大,而不同原則思想指導編制的APP運行下的工作數據對影響原因的反映表現會有不同,所以對不同設備產生的工作數據進行不確定分量評定可能會獲得不同的結果。如對什么測量不確定度分量的來源更有代表性和多少個來源更合理,以及對不確定度合成后的分散性是否需要指定相應的定性標準等,也會因目標和要求不同而不同。
參考文獻
[1] 杜秉華,戴美玲,樓平兒,等.種豬自動測定設備數據中的單次最大采食量和單次最小采食量的監控閾值探討[J].豬業科學,2019,36(3):76-79.
[2] CASEY D,STERN H S,DEKKERS J.Identification of errors and factors associated with errors in data from electronic swine feeders[J].Journal of Animal Science,2005,83:969-982.
[3] 雷勝輝,樓平兒,杜秉華,等.種豬生產性能電子測管理的監測方法探討[J].今日養豬業,2022(2):97-101.