王如濤,郭寶靈,李國榮,張 莉
(新疆油田公司,新疆 克拉瑪依 834000)
石西油田作業區SCADA系統自建成以來已運行20年,實現了油區井站3萬多點工況數據的集中監控與管理,在生產監控管理方面積累了豐富的經驗,并有效總結了傳統報警管理存在的不足。目前生產監控系統采用以數據點為基礎的閾值報警機制,利用系統采集的實時數據與設置的閾值進行實時比對,超出閾值范圍即時推出相應類型的報警信息并基于相應提醒。然而,同一個數據點在數據未恢復到閾值正常范圍內時會根據持續進行重復報警,大幅增加報警數量、提高報警處理工作量及復雜度,且有效報警、重要報警容易被冗余報警淹沒,生產異常處理及時率大幅降低。而隨著監控參數點位的日益增加,硬件系統老化以及軟件系統限制,不斷出現系統運行緩慢、運行錯誤、服務器頻繁死機、閾值推薦算法讀取速度慢、寫入報警限值長等問題,導致報警處理效率較低,影響生產監控及預警判斷,已不能滿足監控報警需求。
報警管理是一個過程,通過這一過程實現報警的監測、管理和工程化,從而保證安全、可靠的操作。科學合理的報警管理可以確保報警系統發揮應有的保護功能,防止嚴重事件的發生,提高生產安全性。工程設備與材料用戶協會(EEMUA)與1999年發布了EEMUA191關于報警管理的行業指南,美國儀表自動化協會(ISA)和國際電工協會(IEC)先后與2009年和2014年發布了ANSI/ISA18.2和IEC62682關于流程工業的報警系統管理標準。國內很多工業行業已經重視報警管理策略和實施方法,并在實際中取得了一定的經驗和成效。在油氣生產行業,目前主流的報警管理模式是以數據點為基礎的閾值報警模式(設置低低報、低報、高報、高高報四個界限值),生產監控系統采集的實時數據與設置閾值進行對比,超出閾值范圍推出相應的報警提醒。由于同一參數(點位)在連續采集周期內會形成的多條重復報警,監控人員需定時反復分析確認,同時大量合理工況由于閾值設置不合理存在誤報現象,導致報警處理效率較低,影響生產安全。報警雜多的幾種情況如表現所示。

表1 雜多報警分類統計
石西油田基于多年的生產監控經驗,不斷探索報警合理性管理方法,提出“報警事件閉環管理”模式,核心是為了通過降低誤報警和重復報警數量來不斷提升報警管理可用性,以達到如下預期:
● 在工藝過程波動時幫助監控操作員操作,讓監控操作員有更多的精力關注生產過程;
● 減少生產工藝過程故障停工,有效延長生產運行時長,提高生產潛力,降低生產運維成本;
● 在工藝過程波動時避免生產監控系統超載運行,確保生產監控系統能夠長期穩定運行、不宕機;
● 幫助及時發現問題,準確定位生產異常;
● 識別出可以改進的工藝,為下步工藝改造及技術措施調整指引方向;
● 及時發現需要維護的儀表,提高儀表健康度,延長儀表壽命,提升數據質量;
● 識別出在工藝過程、控制和操作方面需要改進的地方。
“報警事件閉環管理”模式主要包括如下內容:
1)報警的解析與歸檔。以“事件”為核心的報警規則,“事件”是指對應的現場工藝生產上出現異常而產生的提示信息。這種異常信息的全生命周期包括產生、發展、處理、關閉四個階段,最終回歸正常。提出以“事件”為核心的理念,就是對報警進行解析歸類,將所有與該事件有關的報警全部進行匯聚,系統不再反復彈出報警信息,用戶可以集中處理一個問題。這樣的歸類方法,將上百條報警匯總成一條報警事件,有利于監控人員進行查看與處理有利于事后記錄,進行復盤總結。

表2 接續歸類原則描述
2)實時報警管理。報警管理與報警解析規則緊密相關,以往報警量特別大的時候,監控人員無法從大量的報警中快速定位有效報警,從而導致報警管理功能不可用。而為了避免生產現場出現嚴重異常情況,只能花費極大的精力對重點對象的重要參數進行定時曲線翻閱,試圖通過分析重點參數的變化趨勢分析生產異常,但收效甚微。而提出以“事件”為核心的報警管理機制后,報警必須滿足消警條件(數據回歸到正常范圍內)才會消除,避免監控人員單純為了降低報警量而隨意關閉、刪除報警信息導致有效報警的漏報問題。同時,為了區分報警的重要性及處理狀態,對報警進行了多維度的分類管理:一方面,按報警生命周期劃分為活動報警、確認報警、已消報警三種狀態,不同的狀態采用不同的頁面進行分類管理;另一方面,根據生產工藝特征劃分參數重要性級別,通過緊急、重要、一般三個層級實現活動報警重要性的劃分,能夠及時區分報警的重要性,提高報警處理及時性,降低生產風險。例如,監控人員對于儀表異常導致的數據偏差(如落零問題),可以通過“已確認”的方式進行分類,方便將核心問題展示在“活動的報警”窗口,提醒監控與管理人員進行關注;而在“活動的報警”窗口,利用不同顏色區分報警的嚴重級別進行標注提醒,針對不同參數進行分類和優先級別處理。

表3 實時報警管理機制
3)報警事件閉環管理系統處理流程(圖1)。將同一參數(點位)在連續采集周期內形成的多條閾值報警記錄進行分析歸并成一條報警事件在活動報警中提示處理,監控人員根據“活動報警”提醒逐一對事件進行分析,判斷報警原因(現場工藝異常、閾值設置不合理、誤報),當工藝異常時及時通知相關人員現場處理,閾值設置不合理通過報警閾值智能推薦功能設置合理閾值,誤報時通過人工確認將報警信息歸入“已確認報警”界面,若出現報警類型(低低報、低報、高報、高高報)變更后重新觸發至“活動報警”界面,再次按報警處理流程進行分析處理,整個流程遵循自動關閉報警機制,在流程中的任一環節,實時監控采集數據一旦符合報警關閉規則,自動關閉報警。(“活動報警”和“已確認報警”界面中的事件恢復正常后自動跳轉至“已關閉報警”界面中,方便后期查詢。)

圖1 報警事件閉環管理系統處理流程
石西油田將“以數據點為基礎的報警機制”改進為“以事件為基礎的報警機制”,邁出了油田報警管理的新步伐,極大地提高了報警處理工作的效率。主要效果體現在如下幾個方面:
1)報警數量指數級下降,減少行動決策花費的時間。報警的解析歸類,杜絕了事件重復報警,使監控人員由“不斷處理閾值報警”轉變為“集中處理事件報警”的模式,工作量得到大幅度下降,漏報嚴重生產異常的概率進一步降低。據統計,每天的報警數量由以前每天的1萬多條下降在100-300條之間,分區塊處理之后,每個監控人員面對的報警數量不超過50條/天。通過大幅降低報警數量,以保證監控操作員集中注意力在有效的、重要的報警,及時作出正確的響應。

圖2 報警信息管理
2)誤報警數量得到有效控制。事件報警機制在活動報警中引入邏輯判斷,當報警事件通過人工落實確認為誤報時,將其歸入確認報警中,在當前報警類型下不再出現報警提示。同時,標記的誤報警信息會推送至相關技術人員,督促其盡快修改閾值,確保報警及時恢復正常。而通過誤報警信息的逐漸積累,能夠成為報警閾值修正改進的有力參考,為下步閾值自動推薦模型的近一步優化提供數據服務。
3)引入自動消警機制,能夠利用實時采集的數據自動甄別監測對象實時狀態,當數據恢復至合理運行范圍內時可實現已產生報警的自動處置,大幅降低監控人員處置因為生產波動產生的偶發性異常問題處置時間,提升報警管理效率。同時基于自動消警機制,可有效識別出頻繁抖動的報警,對于頻繁抖動的報警需要多加注意,分析報警抖動是屬于工藝運行不穩定還是閾值設置不合理造成導致的數據頻繁抖動報警,針對不同的原因要及時采取相應的管理措施。
4)閾值設置快速準確。報警閾值智能推薦功能,模仿專家對故障的判斷過程,依據歷史數據的波動規律推薦報警值,讓規則的設置與調整有據可依,更加符合實際生產工藝規律。截止到目前為止,石西油田建議與優化了50%以上的參數報警范圍,成功地將以往注水壓力、注水流量、油井載荷等參數設定了合理的報警值,將原來掛起的參數重新進入報警流程,提高了監控的全面性、有效性與安全性。

表4 傳統報警與事件報警處理效果對比
1)建立了以事件為中心的閉環報警管理機制,監控報警數量與質量得到有效控制,同時報警事件是基于關閉規則進行消警,避免了人為干預和誤操作,提高了整體的安全系數,監控操作員的報警管理滿意度大幅提升。報警管理的核心就是通過報警提醒監控操作員響應,在第一時間將問題進行處置,避免處理不及時帶來的生產潛在隱患,但如果監控操作員對現行的報警管理機制不敏感,則所有的設計將毫無意義。
2)通過生產過程實時監測經驗積累與歸納總結,進一步探索生產監控運行模式,優化監控崗位操作規程,大幅提高分析判斷問題準確率,有效輔助決策下達到位,動態指揮,使油田精細化管理水平進一步提高。
3)報警事件閉環管理機制在石西油田已進行推廣深化應用,并取得了良好的實際效果,在行業內具有廣泛的推廣價值,為后續基于參數趨勢、聯動分析等復雜模型分析相關的智能報警管理機制的發展奠定良好基礎。同時,隨著近年來大數據挖掘、分布式計算、云平臺等技術的快速提升,順應兩化融合的發展趨勢,積極探索智能理論和技術在石油行業的應用潛力,逐步實現智能化報警管理,實現報警信息的自動智能全生命周期管理,做到更高層級的無人化值守。