申 創 姚 毅 王勁柏 羅 毅
(1.四川理工學院自動化與電氣工程學院,西川 自貢 643000;2.成都海蘭天澄科技有限公司,成都 610000)
隨著我國工業化程度的提高和產業結構的轉型,對環保的監控越來越嚴格,許多在線監測儀器得到推廣和應用。然而,此類儀器受到環境變量和自身耦合變量的雙重干擾,再加上在線類監測儀器工程上涉及到技術集成、操作性、安全冗余及成本控制等限制,該類儀器(如化學需氧量、氨氮、煙氣、乳酸及微生物等在線監測設備)在控制精度和故障排查上不甚理想。對儀器的故障診斷,多憑借工程經驗。因此,對儀器設備開發的工程經驗、質量控制、開發效率以及工程優化問題的研究將更有迫切性和現實需要,其中,數據特征挖掘對質量控制和設備開發效率的提高意義重大。
采用特征選擇和過濾匹配的方法快速分析儀器的故障原因[1],先要建立變量的初始特征集,這樣就必須明確可能引起故障的輸入變量對應的節點或分類節點,再用COD在線監測儀進行的故障診斷研究來引出,其分析思路也可用于其他儀器系統。
COD在線監測儀是眾多環保監控儀器中的一種,其核心測試方法有重鉻酸鹽法、高錳酸鉀法、庫侖法、臭氧法、電極法及羥基法等[2],其中重鉻酸鹽和高錳酸鉀法是國標方法[3],用得較為普遍。
圖1是某公司的COD在線監測儀后側圖。整個測試過程按采樣、定容、消解、比色的過程串聯進行,工作前有試管清洗、系統復位及光度計調零等操作,采用重鉻酸鹽法消解,光度計法比色。監測儀的主要構件包括試劑瓶、導管、繼電器、蠕動泵、消解池、加熱棒、比色池、光度計、PLC、嵌入式顯示和控制組件。

圖1 COD在線監測儀后側圖
任何影響儀器工況的因素都可以作為輸入變量特征集的元素,但是,為了降低特征子集之間的相關性,理清故障因素是關鍵。該儀器的測試范圍是5~1 000mg/L,而數據多分布在200mg/L以內,因此可以說,任何節點的故障振動或漂移都可能影響測試結果的穩定性,這給逐點排查儀器故障帶來了麻煩。假設樣本數據不存在大量干擾(如Cl-),可從3個主要過程來分析故障因素。
定容階段。主要是借助于蠕動泵的兩次固定時間內的正反轉抽取樣本到消解池中。蠕動泵的不穩定,可能導致無法準確定容,影響實驗結果,此類故障可以通過肉眼觀察發現;放置在試管中的吸管由于端子不規則,或電磁閥的吸附,都會造成不確定的殘留試劑。
消解階段。從消解條件考慮,即催化劑和溫度。難點在于溫度的控制,主要是加熱器和溫控儀部分是可能的故障點,數據所反映出的明顯特征就是測試結果普遍偏低。
采樣階段。涉及到光度計部分、比色皿部分和硬件電路部分,如光源的“單色性”太差、檢測器漂移及比色皿中有大量氣泡或不均勻等。從朗伯比爾定律的前提條件入手去分析采樣階段的可能故障點是完備的。
根據評價準則,特征選擇可以分為過濾器、封裝器和嵌入式3類基本模型[4],在此按過濾器模型進行特征選擇,需要首先對初始特征集進行定義。
按照儀器的動作過程逐級分類,可以使特征間的分類間距最大化,減少無效特征或冗余特征,并且由于是按流程操作的,所以在發生故障的條件下,采樣、定容、消解、比色之間引起故障的相關系數為零。圖2所示為雙特征變量的匹配流程,首先要理清所有引起儀器故障的外部變量和內部變量,并注意變量之間是否存在關聯性,隨后把變量屬性符號化得到特征子集,然后可以用矩陣的形式表示出特征。對于數據特征的挖掘,除了常見的統計特征,還應結合儀器的自身特點挖掘出與之對應的數據特性,如數據穩定的滯后效應、數據偏離均值的正負值及最值分散度等。

圖2 雙特征變量的匹配流程
儀器故障的完備事件容易找到,如溫度、濕度、光度計電源及加熱棒等。若隨意劃分特征子集,將不利于故障的快速映射。如將溫度看成是一個特征元素或集合,而溫度對多個構件和環節都會產生影響,和數據特征進行匹配時,無法建立有說服力的聯系。因此,特征集合的搜索和分類很關鍵。


圖3 系統的故障樹
有效提高特征選擇算法穩定性的方法主要有基于經典特征選擇算法的集成特征選擇、基于樣本加權的算法[5]和特征組群的方法。數據特征這部分包括如何進行選擇數據和對數據的特征挖掘。從圖4所示的測試數據可以看出,50mg/L的標樣測試數據表明該儀器工作不正常,但并不一定用此組數據更有利于反映儀器固有的問題,因為有可能是故障點的次生干擾和故障本身干擾的結果。因此,在儀器穩定運行的情況下,需要選擇合適的測試數據作為評估的原始特征集。假設關注以下幾類數據特征:均值、方差、數據穩定的滯后效應、數據偏離均值的正負值、最值分散度。理論上5個特征有31種數據組合。接下來就要采用各種手段建立數據特征集合與變量特征集的聯系。

圖4 故障儀器的測試數據(50mg/L標樣)
對同一儀器的數天數據進行采樣分析,低(50mg/L)、高(200mg/L)濃度標樣測試值的分布分別如圖5、6所示。低濃度測試結果表明,均值偏離大,且測試穩定性較差。高濃度的測試結果均值接近標樣,但少數采樣值漂移比較大,這說明儀器不存在原理性故障,系統整體運行比較穩定,受環境的干擾或穩定運行的條件不足。在做進一步的數據特征挖掘時,需要盡可能排除誤差因素的干擾,突顯故障因素對數據的作用,因此選擇高濃度采樣數據進一步分析。

圖5 低濃度標樣測試值的分布

圖6 高濃度標樣測試值的分布
圖7是溫度基本恒定或變化趨勢相同的條件下,同一儀器對不同標樣的測試結果,可以斷定:幾乎首次采樣的結果都會比標樣值低??梢酝ㄟ^此特征和相關經驗,鎖定幾種可能故障,優先用其他數據特征驗證這些故障。圖8是溫度基本恒定(8℃),不同儀器對同一標樣的測試結果,依然有首次測量低于標樣值的特征。



圖7 同一儀器不同標樣的測試值

圖8 不同儀器對同一標樣的測試
表1是200mg/L(高濃度)的標樣測試結果,其均值和方差分別為199.87和39.07,均值接近200mg/L,方差較大,說明數據波動較明顯。圖9為測試數據的波動和均值特質,可以看出,測試數據幾乎是負波動,即在中心線(CL)以下波動,且數據存在偶發的不穩定現象。綜上所述,可以得出如下結論:
a. 系統不存在原理性故障,一天內測量儀器穩定性較差;
b. 儀器魯棒性能較差;
c. 儀器系統并沒有完全得到響應;
d. 系統穩定運行前需要1~3個測試周期。

表1 200mg/L標樣的測試值

圖9 測試數據的波動和均值特征
按照構建模型的思路去分析和排查,很快就找到了該儀器的故障原因,即加熱棒沒能完全包裹整個液位面(圖10),由于熱傳遞和熱損耗的影響,使消解池的上液位面的液體不能持續10min保持175℃,從而導致消解不完全。

圖10 消解池和加熱裝置(故障點)
4.1原始數據選取根據經驗和特征選擇的要求,才能盡可能減少誤差因素,突顯故障因素,對于該儀器而言,選擇高濃度的標樣更有利于儀器分析。
4.2按儀器操作流程對故障特征變量進行劃分,有利于增大類別距離,減少特征冗余;數據特征和故障變量的匹配可以根據經驗來減少算法。
4.3雖然該儀器的采樣周期為30min,若將整天的測試看成一次集中采樣,仍然可以從系統的快速響應性、穩定性和魯棒性的角度分析,并得到比較滿意的結果。