侯士超(昆侖數智科技有限責任公司,北京 102206)
在大數據時代背景中,數字化正在改變著流程工業對業務和技術的傳統認知,數據即資產。基于大數據在工業裝置上的應用是石化企業未來生存和發展的根基,一切生產活動都將依賴于數據應用和服務。未來誰能做到“有據可依”“智能分析”,掌握“數據變現”,才能真正實現工業應用的智能分析。基于數據的智慧分析應用將是發展實現“數據變現”的有力手段。
利用不同的大數據分析方法,應用到實際生產中去,通過數據挖掘與探索分析,發現數據特征及規律,作為數據建模輸入的依據。常見的數據特征分析方法有數據特征描述、相關性分析、主成分分析等。數據首先要轉換成適合于挖掘的形式,即統一數據的量綱及數量級,稱為數據標準化。常用的方法有數據泛化、標準化、屬性構造等。
數據轉換主要包括以下幾種方法:
(1)基期標準化法
選擇數據系列的第一個時期作為參照,各期標準化數據=各期數據/基期數據。
(2)直線法
①極值法:

②z-score法:

(3)折線法

(4)曲線法
①Log函數法:x′=log(xi)/log(max(xi));
②Arctan函數法:x′=arctan(xi)×2/π。
綜上所述,在起搏器間歇性感知功能字符異常的臨床診斷中采用動態心電圖檢測展示良好效果,存在比較高的檢出幾率,檢出準確性比較好。
通過以上幾種方法進行數據標準化轉換,實現數據分析的基礎。下一步進行數據分析,建立分析模型,形成解決工業裝置實際問題的方案,在分析中主要有以下幾種方法:
(1)回歸分析(趨勢研判)
進行回歸分析之前有兩個準備工作,第一確定變量的數量。第二確定自變量和因變量。只有一個變量X與因變量Y有關,使用一元回歸;分析多個變量與因變量Y的關系,使用多元回歸。
(2)聚類分析(發生概率)
K-Means聚類算法。主要思想是:首先將各個聚類子集內的所有數據樣本的均值作為該聚類的代表點,然后把每個數據點劃分到最近的類別中,使得評價聚類性能的準則函數達到最優,從而使同一個類中的對象相似度較高,而不同類之間的對象的相似度較小[1]。
(3) EM算法(關聯關系)
通過EM算法建立關鍵性參數與大量操作數據、原料性質數據、裝置數據等工業數據之間的關聯關系網。最大期望算法經過兩個步驟交替進行計算,第一步是計算期望(E);第二步是最大化(M)。M步上找到的參數估計值被用于下一個E步計算中,這個過程不斷交替進行,也就是迭代使用EM步驟,直至收斂。
本文通過嘗試,各方法都有缺點,在方法選擇中根據數據特征確定分析方法,如:聚類分析、關聯分析等常用直線法;而綜合評價則折線和曲線方法用得較多。
在分析方法的選擇上,本文主要用到的算法如表1所示。

表1 大數據分析算法
催化裂化裝置作為煉油廠生產汽、柴油的主要裝置,其加工工藝最復雜、操作控制難度大,在各類主裝置非計劃停工中占比最高[2]。目前,大部分煉化企業裝置運行周期只有3年,裝置運行周期還有很大的提升空間。在大多數煉廠中,催化裝置主要存在以下三個問題:一是報警占比高,運行不平穩等;二是催化裝置非計劃停工占停工總數的大部分,其中結焦是主要原因,結焦問題表現在結焦量難以預測;三是運行工況的不同造成汽油收率高低差異較大[3]。因此,催化裂化裝置生產中出現的問題需要重點解決。本文是基于海量的運行數據和分析化驗數據,通過對催化裂化裝置進行大數據分析研究,嘗試對報警、結焦和收率建立算法模型,提出提高裝置運行的“安穩長滿優”、優化產品結構、提升裝置經濟效益的建議方案。
造成非計劃停車經過統計,催化裝置報警占比高,運行不平穩。通過大數據分析得到的關鍵報警位點的根原因,與專家經驗分析的結果存在很大程度的重合性,表明大數據分析結果可信度高。發現新的報警根原因,以再生滑閥壓降為例,如圖1所示,利用大數據分析發現了其根原因“待生斜管滑閥閥位”。經過工業驗證,證明待生斜管滑閥閥位對再生滑閥壓降存在反向影響,分析結果正確,這是僅憑以往經驗發現不了的。

圖1 大數據報警原因分析
通過分析挖掘催化裂化裝置報警規律,基于大量歷史數據計算各位點間的相關性,形成因果鏈路圖,暴露引發報警的源頭,進行重點監測和控制,以因果鏈路知識庫為基礎,建立預警模型,形成對關鍵報警位點的預警機制,以輔助操作人員及時做出判斷和調整。從實際案例分析,如圖2所示,曲線為過程數據,黑粗線為預測值,生產過程中利用大數據分析建立預警算法,在報警發生前提前預警,預警模型判斷2 min后“二再密相溫度”將出現報警,預警發出時,技術人員可以收到反饋,及時采取工藝調整等措施,為裝置非停爭取到寶貴時間。

圖2 大數據報警預測
基于大數據分析回歸方法,建設生焦率的預測模型,采集有效樣本數萬組,測算了催化長時間的結焦量,并進行了現場的工業驗證。模型的預測值較為準確,解決了結焦這個不可測變量的定量化問題。每天估算沉降器內的結焦總量,為操作提供參考,為催化裝置的長周期運行提供支持。如圖3所示,每天估算沉降器中關鍵部位的結焦量。

圖3 結焦累計分析
依據相關性分析篩選出來的影響因素,從大量生產數據中分析對汽油收率影響較大的工藝因素。如圖4所示,結合裝置現場條件確定可調操作變量,并以汽油收率最大化為目標尋優可調操作變量。建立大數據分析模型,采用神經網絡技術建立的汽油收率模型,從而實現實時提供汽油收率最大化的生產操作方案。

圖4 汽油收率最大優化方案
隨著本次大數據應用的研究,可以得出:通過大數據分析報警應用,可有效減少裝置報警次數,提高裝置平穩運行率;通過本次研究可以有效減少報警次數50%以上;通過對催化裝置結焦大數據分析應用,有效延緩裝置結焦,提高裝置運行周期,實現催化裝置結焦狀況的即時評估,減少催化裝置因結焦造成的非計劃停工次數;通過裝置汽油收率研究,有效提高催化裝置目的產品收率,催化裝置汽油收率提升1個百分點左右。
對于煉化企業來說,以真實的運行數據預測未來趨勢,以便做出正確的生產或經營決策,如何對生產運行安全性預測預警落實到裝置粒度等,生產及經營數據如何有效關聯和挖掘,提升認知,深化應用,成為企業迫切需求。因此,對數據的分析方向在流程工業的應用,應該以信息化和智能化手段,通過大數據分析技術,從統計分析向預測分析轉變,從被動分析向主動分析轉變,真正解決企業業務痛點,為企業創造經濟效益。