999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于開源技術的FCC裝置產品收率預測BP神經網絡模型

2021-03-23 06:28:08苑丹丹高雪穎
石油煉制與化工 2021年3期
關鍵詞:特征產品模型

劉 洋,苑丹丹,李 浩,高雪穎

(中國石化工程建設有限公司,北京 100101)

石化項目設計前期階段是從項目的立項到確認項目可行性并得到批準所做的工作。前期階段主要由工廠設計、技術經濟、市場分析等專業的專家對業主提出的工程項目進行研究,根據進展深度可以分為機會研究、方案研究和可行性研究等,對裝置收率的估算是其中重要的一環。裝置收率估算需要專家的經驗和專業科室的配合,但這種靠人工計算和經驗推斷的傳統方法難以應對信息時代石化項目設計前期階段越來越快的工作節奏和對方案變化、多方案比選、快速反應、快速決策等越來越高的工作要求[1]。研究表明,在相對穩定的情況下基于機器學習的數學模型對裝置收率的預測準確度超過人的經驗推算[2]。因此,為了應對時代發展的要求,項目設計前期階段可以利用BP神經網絡模型等機器學習技術實現對裝置收率的快速估算,以便設計人員能夠快速地制定或修改方案,提高工作效率和工作質量。本研究使用開源語言Python和PHP構建一個適用于石化設計前期階段的BS架構神經網絡系統,并開發針對MIP工藝流化床催化裂化裝置收率預測的組合BP模型。

1 BP神經網絡

BP神經網絡是由Rumelhar和McClelland[3-4]于1986年提出的以網絡誤差平方為目標函數,并采用梯度下降法對目標函數進行優化的多層前饋神經網絡。因其具有自學習性、自組織性和推理能力強的特點,同時具備良好的非線性映射能力和柔性網絡結構,因而被廣泛應用[5-6]。而在石化設計領域,BP神經網絡與徑向基函數(RBF)、支持向量機(SVM)等機器學習模型也已被證明確實可以提高設計的效率和準確度[7-12]。

BP算法在神經網絡學習算法中具有十分重要的作用。BP神經網絡由輸入層、隱藏層和輸出層3部分組成,每層由一個或多個神經元構成,其中輸入層神經元個數與樣本數據中的特征變量個數一致,輸出層神經元個數與預測目標個數一致。以流化床催化裂化(FCC)裝置為例,本研究使用中國石油化工股份有限公司(簡稱中國石化)2007—2019年MIP工藝裝置的193組工業匯編數據,按照6∶2∶2分為訓練數據集、交叉驗證數據集(調整和選擇模型參數)和測試數據集(模型性能評估)[8],經過綜合考慮歐陽福生和趙媛媛等學者的研究中對FCC裝置主要特征變量的劃分[8-10]、中國石化內部專家意見以及現階段所能取得的數據樣本的實際情況后,將與FCC裝置6個主要產品收率(干氣、液化氣、汽油、柴油、油漿、焦炭)相關的13個主要特征變量定為:4個原料性質(密度、殘炭、Ni含量、V含量)、再生劑的微反應活性指數、沉降器頂部壓力、提升管溫度、原料預熱溫度、預提升蒸汽量、汽提蒸汽量、再生器頂部壓力、密相段溫度、再生劑定碳。則FCC裝置產品收率模型中的特征變量個數為13,目標個數為6,即BP多層前饋神經網絡結構由13個輸入神經元、6個輸出神經元、q個隱藏層神經元構成,如圖1所示。

圖1 BP神經網絡結構

(1)

式中:bh表示隱藏層中第h個神經元的輸出。由于石化裝置收率預測屬于回歸預測問題,本研究激活函數f使用ReLU分段線性函數,ReLU函數屬于半線性、半非線性函數,有助于網絡訓練,同時模型收斂較快,ReLU計算如式(2)所示。

ReLU(x)=max(x,0)

(2)

進而計算網絡在(xk,yk)上的均方誤差(MSEk),如式(3)所示。

(3)

之后將誤差逆向傳播回到隱藏層,根據誤差調整隱藏層神經元的連接權重和閾值。BP算法屬于迭代算法,直到達到預先設置的迭代次數或是最小誤差,模型停止訓練,得到訓練好的FCC裝置產品收率BP神經網絡預測模型。

2 開發技術選擇和系統架構

2.1 開發技術選擇

目前用于神經網絡開發的主流工具包括MATLAB(矩陣實驗室)和以Python為代表的開源工具[13-18]。MATLAB是由美國Mathworks公司發布的針對科學計算、數據可視化、系統仿真,和交互程序設計的集成計算環境[19]。Python是誕生于20世紀90年代的開源腳本語言,多年來被廣泛應用于機器學習等人工智能相關領域,已有Scikit-learn,Theano,TensorFlow,Keras等機器學習框架,為機器學習系統的開發提供了便利[20-22]。

目前國內石油化工領域利用神經網絡進行裝置收率預測的研究主要采用MATLAB來實現[23-30],但工程公司在進行前期項目設計時需要考慮更多的客觀因素來選擇神經網絡的實現工具。相對于裝置模擬等以研究為主導的開發,前期項目的裝置產品收率預測更重視操作的簡便性,對后臺程序的高度封裝性,以及能夠快速地得到一組能夠直接用于輔助方案設計、可行性研究等前期工作的產品收率數值。因此使用MATLAB作為神經網絡模塊的主要實現工具在前期項目裝置產品收率預測上會有一些不便之處[31-32]:①MATLAB軟件較大,而且較昂貴;②運行MATLAB模型必須安裝MATLAB運行環境,運行環境為免費,但如果服務器端僅安裝運行環境的話,則無法在服務器端進行模型修改后的重新生成和調試,增加了開發流程的步驟和復雜性;③MATLAB功能較為定項化,在應用開發上不如Python等通用型語言靈活。

基于以上原因,本研究選擇使用Python語言作為實現神經網絡預測單元的主要實現工具。與MATLAB相比,Python可操作性更強,能夠靈活地調用模型并能與服務器端其他模塊實現快捷的數據交互傳輸,且開源免費,在服務器端部署開發環境較為方便,開發人員可以在同一開發語言環境內完成模型的創建、修改和測試的全部流程。

需要指出的是,利用Python語言可節約開發時間,具備一定的編程基礎和開發經驗的開發人員可快速上手;而對于無編程背景者,使用Python或是R等純編程語言的開發成本可能會比使用MATLAB更高。

2.2 整體平臺構架

基于兼顧方便性和易用性,本研究選擇使用Web開發領域的主流開源語言PHP搭建服務器端的系統平臺構架,使用Python作為服務器端神經網絡模塊的開發語言,充分發揮兩種語言各自的優勢,節約配置及調試等步驟上所花費的時間。圖2為系統實現框架。

圖2 系統實現架構

開發使用Python的Scikit-learn開源工具包[22],主要是基于Scikit-learn的以下特點:①涵蓋絕大部分主流機器學習算法,包括BP(MLP),RBF,Lasso等常用回歸算法;②為所有算法提供一致化的調用接口,便于開發;③文檔齊全且更新及時。

3 模型構建

3.1 整體設計思路

BP神經網絡在理論研究和技術實現上均較成熟,并有較強的非線性映射能力,而對于MIP工藝裝置收率預測,由于各特征變量與各主要產品收率的關聯度不同,部分特征變量對產品收率預測結果的影響存在著模糊界限,所以本研究通過對特定產品收率組(每個產品收率組包括6個主要產品收率中的一個到多個)所對應的特征變量中進行特征選取和特征組合來獲得更理想的預測結果。同時,對于指定類型的裝置,與全廠設計相關的主要產品收率和與主要產品收率相關的特征變量經過分析確認后就是相對固定的,變化的只是輸入的特征變量和輸出的裝置產品收率數值。基于以上條件,可以認為對于已確定主要產品收率的特定煉化裝置,對其確定的特征變量在理論上存在著最優組合方案。

3.2 網絡結構及參數設置

構建BP神經網絡模型的關鍵是隱藏層的層數以及神經元個數的設置。隱藏層用于提取數據抽象特征,不與外界發生直接數據傳輸。隱藏層層數或神經元個數多,訓練時間會長,同時容易出現過擬合現象;隱藏層層數或神經元個數少,訓練時間短,但容易出現欠擬合、學習效果不佳等問題。本研究為找到最佳的隱藏層層數以及神經元個數進行了多次試驗,比較網絡結構含有單一隱藏層和兩層隱藏層以及不同隱藏層神經元個數下的學習效果。對兩層隱藏層網絡中每層神經元個數分別選擇(6,2),(7,2),(8,2)進行均方誤差(MSE)比較,結果見圖3(1)。單一隱藏層神經元個數范圍為20~120,每次按照遞增10個神經元進行試驗并比較MSE,結果見圖3(2)。從圖3可知:兩層隱藏層(7,2)的MSE較小;單層隱藏層神經元個數為100時的MSE較小,且優于兩層隱藏層情況。因此,本研究BP神經網絡結構按照13-100-6結構進行搭建。

圖3 隱藏層與MSE的關系

BP網絡結構中激活函數‘Identity’,‘Logistic’,‘Tanh’,‘ReLU’的MSE分別為1.43,1.39,1.31,0.68。根據測試結果,本研究選擇MSE最小的激活函數‘ReLU’。其他參數設置為:最大迭代次數5 000,學習率0.001,動量0.9。

3.3 組合模型

利用全部13個特征變量進行BP神經網絡訓練生成的模型在此稱為原始BP模型。根據不同產品收率與各特征變量的相關性不同,針對每個產品收率,對特征變量進行選擇,分別對每個產品收率進行BP建模,并對這些對應單項產品收率的BP模型進行組合得到組合BP模型[33]。研究表明[33-39],通過組合多個預測模型確實可以達到提高預測精度,取得比單一模型更好預測效果的目的。所以,本研究嘗試將FCC裝置的13個主要特征變量分為不同的特征組,構建分別以這些特征組為輸入變量的神經網絡模型,并根據這些模型的預測結果統計出針對具體產品收率的最佳特征模型。

BP模型對特征縮放敏感,所以對輸入的特征變量進行了歸一化處理,采用離差標準化處理方式,將特征變量歸一化到0~1之間。歸一化采用式(4)計算。

(4)

式中:max表示某個特征變量最大值;min表示某個特征變量最小值;x表示原始特征變量值;x*表示歸一化后的特征變量值。

利用Pyohon語言Scikit-learn模塊自帶的Preprocessing.minmax_scale方法對所有樣本中的特征數據進行歸一化。結果表明,歸一化后,神經網絡模型的MSE、整體平均絕對值誤差、整體平均可釋方差、整體中值絕對誤差均有所降低,見表1。

表1 特征歸一化前后誤差對比

分析特征變量與收率之間的關系以及特征變量之間的關系,并由此對特征-目標收率進行分組,首先計算特征變量之間的Pearson相關系數[40-41],計算見式(5)。

(5)

式中:n表示樣本數;xi和yi為樣本值;x′和y′為樣本均值。觀察計算結果,得到Ni含量和V含量的Pearson相關系數為0.626 2。

根據Cohen的相關性強度判別規范[42],Ni含量和V含量之間的Pearson系數大于0.5屬于強相關屬性,存在多重共線性。如果Ni含量、V含量是否與預測目標的一個或幾個產品收率存在較強的關聯性,則Ni含量、V含量可能對構建這幾個特定產品收率的預測模型有較大的作用,而對于組合模型中其他產品收率對應的預測模型,Ni含量和V含量可以根據具體情況作出取舍和保留。

對于特征變量與產品收率之間的關系,本研究采用Scikit-learn minepy包的最大信息系數(MIC)[43]表示。MIC采用尋找最優離散化的方法,將最大互信息轉化為0~1的度量值,MIC比Person相關系數法更適合尋找變量間的非線性關系。以Ni含量、V含量為例,通過分析結果可以得到兩者在FCC裝置13個特征變量中對于每個特定產品收率的最大信息系數排名,結果見表2。

表2 Ni含量、V含量對應FCC裝置各主要產品收率的MIC排名

基于多次試驗的結果篩選出每個輸出目標的特征變量如表3所示。由于干氣收率、油漿收率和焦炭收率對應的特征變量相同,液化氣收率和柴油收率對應的特征變量也相同,因此,本研究僅需訓練3個BP模型,并將模型進行組合實現對6個輸出目標的預測。表3為對應每個輸出目標根據篩選出的特征變量需要建立的BP模型。組合模型 = [干氣(模型1),液化氣(模型2),汽油(模型3),柴油(模型2),油漿(模型3),焦炭(模型3)]。

表3 特征篩選后輸出目標與特征變量對應關系

4 模型預測效果

為了衡量模型的預測效果,分別比較了原始BP模型和組合BP模型的測試數據集預測結果的MSE,結果見表4。由表4可知,組合BP模型的整體MSE比原始BP模型小,說明組合BP模型預測的FCC裝置產品收率與真實值的偏差更小,預測結果更準確。

表4 原始BP模型和組合BP模型的MSE對比

雖然組合模型預測速率比獨立模型略低,但對于前期設計階段的決策支持而言這種速度上的差異(2 s以內)可以忽略不計。

5 結論和建議

使用神經網絡模型等機器學習技術進行裝置產品收率預測具有成本低、反應速度快的特點,對工程公司進行項目前期設計實現快速反應、快速決策具有很強的現實意義。在操作條件基本不變的情況下,神經網絡模型對裝置產品收率的預測準確度高于人為的經驗判斷。同時,裝置產品收率預測機器學習模型的開發,對于以業務為先導的設計機構而言可以用相對較少的投入實現自主開發,指導生產實踐,提高工程設計特別是項目前期設計人員的工作效率。

通過計算特征變量之間Pearson相關系數、以及特征變量與主要產品收率間的最大信息系數,可以對特征變量之間的關聯性及特征變量與收率之間的非線性關系進行統計分析,并以此為基礎構建組合BP模型。測試結果表明,組合BP模型的預測效果優于原始BP模型。

機器學習模型的基礎是數據的積累,將預測模型部署在內網服務器上可以保證模型的安全性、保密性和穩定性,也便于對模型進行統一升級和更新。

Python語言在人工智能領域有長期的發展歷史,對于機器學習的相關開發有各種已成型的方法庫;同時,相對于MATLAB而言,Python開源免費,而且更加靈活,更易于開發與系統其他模塊的相關接口,適合于迅捷的開發部署。

后續研究將對RBF等更多的機器學習技術應用于FCC裝置產品收率預測進行進一步的探索,并對其他煉化裝置進行產品收率預測研究,構建以裝置為單元的模塊化全煉油廠裝置產品收率預測分析系統。

猜你喜歡
特征產品模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
2015產品LOOKBOOK直擊
Coco薇(2015年1期)2015-08-13 02:23:50
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
新產品
玩具(2009年10期)2009-11-04 02:33:14
主站蜘蛛池模板: 色婷婷成人| 日韩色图区| 欧美视频在线播放观看免费福利资源 | 国产真实二区一区在线亚洲| 99热国产这里只有精品9九 | 四虎永久免费地址| 99免费在线观看视频| 欧美伦理一区| 国产精品综合色区在线观看| 无码中文字幕加勒比高清| 这里只有精品国产| 亚洲国产天堂久久综合226114| 中国国产高清免费AV片| 欧美一区二区啪啪| 97超爽成人免费视频在线播放| 国产白浆一区二区三区视频在线| 91午夜福利在线观看| 日本欧美一二三区色视频| 精品国产成人国产在线| 国产精品欧美激情| 天堂网亚洲综合在线| 亚洲欧洲日韩久久狠狠爱| 91在线国内在线播放老师| 2019国产在线| 亚洲午夜久久久精品电影院| 亚洲高清日韩heyzo| 成年女人a毛片免费视频| av手机版在线播放| 无码免费的亚洲视频| 国产 在线视频无码| 国产高清在线精品一区二区三区 | 三上悠亚精品二区在线观看| 国产成人精品免费av| 99久久精品无码专区免费| 日本伊人色综合网| 国模粉嫩小泬视频在线观看| 在线日韩日本国产亚洲| 手机看片1024久久精品你懂的| 精品久久综合1区2区3区激情| 秋霞国产在线| 久草视频中文| 亚洲男人天堂网址| 91亚洲精选| 亚洲午夜综合网| 一本无码在线观看| 国产毛片不卡| 亚洲中字无码AV电影在线观看| 任我操在线视频| 国产H片无码不卡在线视频| 午夜a级毛片| 欧美激情首页| 人人爱天天做夜夜爽| 成人精品午夜福利在线播放| 欧美中文字幕在线视频| 欧美精品一二三区| 亚洲人成网址| 日本高清视频在线www色| 欧美不卡二区| 日韩在线永久免费播放| 在线观看国产精品一区| 国产精女同一区二区三区久| 色哟哟精品无码网站在线播放视频| 日本不卡在线视频| 亚洲综合专区| 国产人在线成免费视频| 嫩草国产在线| 国产精品男人的天堂| 欧美日韩国产高清一区二区三区| 国产呦视频免费视频在线观看| 亚洲欧美一区二区三区蜜芽| 欧美精品v| 特黄日韩免费一区二区三区| 欧美成人免费午夜全| 99草精品视频| 日韩一区精品视频一区二区| 久综合日韩| 无码福利日韩神码福利片| 精品無碼一區在線觀看 | 亚洲动漫h| 日韩经典精品无码一区二区| 色综合激情网| 亚洲人成色在线观看|