999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據技術在過程工業中的應用研究進展

2016-03-14 21:53:12蘇鑫吳迎亞裴華健藍興英高金森
化工進展 2016年6期
關鍵詞:數據分析大數據

蘇鑫,吳迎亞,裴華健,藍興英,高金森

(中國石油大學(北京)重質油國家重點實驗室,北京 102249)

?

大數據技術在過程工業中的應用研究進展

蘇鑫,吳迎亞,裴華健,藍興英,高金森

(中國石油大學(北京)重質油國家重點實驗室,北京 102249)

摘要:近些年,大數據技術在金融、貿易和醫療健康等行業也得到了較好的應用,但大數據技術在過程工業中的應用還處于起步階段。本文分別從過程工業大數據的特點、分析方法以及應用現狀3個方面進行介紹,簡述了過程工業數據除了具有一般大數據海量性、多樣性、高速性和易變性的4V特點外,還具有高維度、強非線性、樣本分布不均和低信噪比的特點。基于過程工業數據的分析方法,按照功能劃分可以分為降維分析、聚類和分類分析、相關性分析和預測分析四大類。在此基礎上,綜述了近些年大數據技術在過程工業上的應用,分別從過程工業優化、過程監測與故障診斷以及產品性能和產率預測3個方面介紹了其在過程工業中的應用情況,并指出未來應該將企業內部的生產數據和原料與產品的市場數據等相結合進行分析和挖掘,這樣能夠更大程度地發揮大數據的價值。

關鍵詞:大數據;過程工業;數據分析;過程系統

第一作者:蘇鑫(1989—),男,碩士研究生。聯系人:高金森,博士,教授,研究方向為重質油加工及計算化學工程。E-mail jsgao@cup.edu.cn。

近年來,隨著計算機技術以及數據存儲手段的不斷發展,各行各業都積累了大量的數據,如何利用這些大量的數據從中發現一些有價值的信息,已經成為了目前的一個研究熱點。隨著互聯網、物聯網以及云計算等技術的廣泛應用,大數據(big data)時代已經到來[1]。2001年,Gartner公司的一份研究報告首次出現“大數據”概念的提法,2008年《Nature》雜志第一次推出了《Big Data》專刊[2]。2011年2月《Science》也推出了名為《Dealing with Data》的專刊[3],圍繞科學研究中大數據的相關問題展開了一系列的討論。2013年被稱為“大數據元年”,此后,大數據一詞越來越多地被提及,人們用它來描述和定義信息爆炸時代產生的海量數據,并命名與之相關的技術發展與創新。同時,越來越多的政府、企業等機構也開始意識到數據正在成為機構最重要的資產,數據分析能力正在成為它們的核心競爭力。大數據在物理學、生物學、環境生態學等學科以及軍事、金融、通訊等行業存在已有時日,近年來互聯網和信息行業應用大數據取得了十分顯著的效果。大數據技術在我國也呈現了快速發展的趨勢,國內金融業、互聯網、通訊、電子商務等行業應用大數據技術都取得了良好的效果。近些年,O’DRISCOLL等[4]嘗試將云計算和Apache Hadoop等大數據技術應用到大數據分析中;HERODOTOU 等[5]又在Hadoop的基礎上,提出了大數據分析的自動校正系統Starfish,該系統可以使用戶更容易達到自己需求。

近兩年,隨著工業4.0和中國制造2025的提出,利用數據分析技術得到智能信息并創造和發現新的知識和價值成為了第四次工業革命的最終目標之一[6-7]。工業大數據是一個新的概念,泛指工業領域的大數據,既包括企業內部制造系統所產生的大量數據,也包括企業外部的大數據。傳統意義上的大數據主要指商業和互聯網等行業的大數據,這些數據多為離散相對獨立的數據,因此采集這些數據的難度和工作量都很大,對所收集的數據進行簡單的關聯分析就可以獲取一些價值。恰恰相反,隨著測量技術和DCS等管理系統的廣泛普及,過程工業中的數據采集相對比較容易,但由于其各個參數之間還會存在著內在的機理關系,因此其分析難度較大,而且工業生產過程對分析精度的要求也比較高[8-9]。針對海量數據的分析方法目前有很多種,按照功能可以大概分為降維分析、聚類與分類分析、相關性分析和預測分析四大類。每類分析方法中又包含眾多不同的算法,目前適合海量數據的分析方法尤其是針對工業大數據分析的方法仍處于初步發展階段,各個方法都有其特有的優勢,但同時也存在一定的限制條件。

商業和互聯網行業上的數據分析思路主要是從海量的數據中找到各變量之間的關系,根據得到的結果發掘人們沒有認識到的問題,這種思路對于分析商業和互聯網等方面的問題比較適用,并且已經取得了較好的應用。但對于過程工業大數據來說按照上述數據分析的思路,很可能會忽略數據與數據之間的機理關系。因此,過程工業大數據分析其實是計算機科學、統計學和工程學等多學科交叉的科學,需要研究者具有全面而系統的知識[10-11]。

1 大數據特點

1.1 大數據的共同特點

2011年,HOPKINS和EVELSON等[12]發布的名為“expand your digital horizon with big data”中提到了大數據的4個典型特點(4V),即海量性(volume)、多樣性(variety)、高速性(velocity)和易變性(variability)。

(1)海量性 海量性是大數據的最重要的特點之一,也是大數據與以往存儲的數據最直觀的區別。隨著計算機存儲技術的發展,數據量正成指數倍增長,如2013年我國產生的數據總量已經超過了0.8ZB(相當于8億TB),這個數值相當于2012年數據總量的2倍,相當于2009年全球的數據總量。有研究表明,預計到2020年,中國產生的數據總量將是2013年的10倍,超過8.5ZB。

(2)多樣性 傳統的數據存儲和記錄方式決定了只能記錄生產過程中直接的數據,但隨著材料科學、檢測技術、圖像處理和各類傳感技術的發展,重要的圖像、聲音等被記錄下來,這些非結構化的數據也為以后的分析提供了較大的價值。

(3)高速性 現代工業生產規模不斷擴大,工藝流程也逐漸復雜,各種測量和控制手段不斷更新,大型工業生產裝置中都有數以萬計的測量設備,它們每秒鐘都會記錄幾千甚至上萬MB的數據。如某企業一套生產裝置上就有500個測量點,每個測量點每5秒鐘就會記錄一次數據,那么每分鐘就可以產生6000組的數據。

(4)易變性 由于生產過程是多層次的結構,存在穩態和動態兩種工況,設備出現故障時也會改變多個參數的數據,這些因素都導致了大數據的易變性。

1.2 過程工業大數據的特點

隨著企業信息管理系統的不斷普及以及裝備物聯網和企業外部互聯網的不斷發展,工業也已經進入了“大數據”時代,過程工業就是其中的一個典型的代表。目前,各個企業所管理和存儲的數據的規模、種類以及復雜程度都在不斷地增長[13-14]。根據麥克西全球研究院的統計,制造業的數據存儲量高于其他行業。但由于工業本身具有設備大型化,工藝連續程度高,各參數之間存在復雜的機理關系等特點,工業大數據除了具有以上的4V特性外,還具有以下其自身的特點[15]。

(1)高維度 在工業生產過程中,常常伴隨著多種物理和化學變化,而且各參數之間高度耦合,它們共同構成了一個復雜多變的系統,對這些過程的描述是高維度的,這些因素也決定了工業大數據高維度的特點。

(2)強非線性 過程工業中各類參數之間的關系都是非線性的,例如在熱力學中的壓力、溫度與熵值和焓值之間以及反應溫度和反應速度之間都是典型的非線性關系,這種強烈的非線性關系給數據的理解和知識的挖掘帶來了很大的挑戰。

(3)樣本數據分布不均 在生產過程中各種設備和參數應盡可能地運行在理想狀態下,但由于各種原因,各參數會發生一定的波動。例如化工生產裝置中在開工期間與正常運行時操作工況會存在一些差異;另外,由于原料的性質不是固定不變的,所以操作條件也一直處于波動狀態。

(4)低信噪比 雖然現如今測量和傳感技術已經達到了較高的水平,但由于某些客觀原因,比如裝置測量儀表損壞,數據信號傳輸過程中失真等因素,所采集到的數據都會存在大量的噪聲。另外,測量環境也會給測量結果造成一定的影響,當測量壞境突變時也會產生大量的噪聲。過程工業大數據的低信噪比也給數據的分析帶來了一定的難度。

總之,過程工業大數據除了具有各類大數據所共有的海量性、多樣性、高速性和易變性的4V特點外,還具有高維度、強非線性、樣本分布不均和低信噪比的特點。正是因為過程工業大數據這些獨有的特點,對于過程工業大數據的分析和挖掘與傳統的大數據分析方法也有一定的差異。

2 大數據的分析方法

目前,關于大數據的分析方法的研究還處于探索階段,存在多種分析方法,每種分析方法都具有其自身的特點和優勢,但同時也存在一定的局限性,由于不同行業的工業數據特點和結構存在著較大的差異,目前還沒有一種普適性的方法能夠適應所有行業的大數據分析。按照數據分析的功能劃分,大數據分析方法可以大致分為降維分析、分類與聚類分析、相關性分析和預測分析。

2.1 降維分析

降維是將數據從高維度約減到低維度的過程,可以有效地克服過程工業大數據高維度的特點和所謂的“維數災難”[16]。有研究學者認為,降維分析是聚類分析或分類分析的一種[17],但由于目前所需要處理的數據均為高維度的數據,常常將其作為數據的前處理過程,所以本文將降維分析作為單獨的一種分析方法進行介紹。降維分析的算法可以分為兩大類:線性降維算法和非線性降維算法[18]。線性降維方法主要有主成分分析(PCA)[19-20]、投影尋蹤(PP)[21]、局部學習投影(LLP)[22]以及核特征映射法[23];非線性降維方法主要有多維尺度法(MDS)[24]、等距映射法(ISOMAP)[25]、局部線性嵌入法(LLE)[26]以及拉普拉斯特征映射法(LE)[27]等。

2.2 聚類與分類分析

首先,需要明確的是聚類分析和分類分析的定義、聯系與區別。所謂聚類分析就是指將數據區分為不同的自然群體,每個群體之間具有不同的特征,同時也可以獲得每個群體的特征描述[28]。它是數據挖掘算法中的一種非常重要的算法,是一種基于無監督的學習方案,可以用來探索數據。同時,經過聚類分析后的數據可以更進一步進行數據的預測和內容檢索等,提高數據挖掘的效率和準確性[29]。聚類算法通常可以分為基于劃分的聚類、基于層次的聚類、基于密度的聚類、基于網格的聚類以及基于模型的聚類五大類[30]。

分類分析是指根據數據集的特點構造一個分類器,再根據這個分類器對需要分類的樣本賦予其類別[31]。與聚類分析最大的不同的就是分類分析在對數據進行歸類之前已經規定了分類的規則,而聚類分析在歸類之前沒有任何規則,在歸類之后才得到每個類別的特點。目前分類算法也存在很多種,按照各算法的技術特點可以分為決策樹分類法、Bayes分類法、基于關聯規則的分類法和基于數據庫技術的分類法等。每類分類方法又存在多種算法,例如決策樹分類法中較早使用的是C4.5算法[32],后來為了適應數據量的不斷擴大,又在其基礎上開發了SLIQ(supervised learning in quest)算法[33]和SPRINT(scalable parallelizable induction of decision trees)算法[34];Bayes分類法中應用比較普遍的是NB(naive bayes)算法和TAN(tree augmented bayes network)算法[35];基于關聯規則的分類法中CBA (classification based on association)算法[36]應用最為普遍;GAC-RDB(grouping and counting-relational database)算法[37]是基于數據庫技術分類法的典型代表。

2.3 相關性分析

相關性分析就是研究數據與數據之間的關聯程度。該分析方法一直是統計學中研究的熱點,已經在金融、心理和氣象學中得到了廣泛的應用。相關性主要用來表述兩個變量之間的關系,是兩變量之間密切程度的度量[38]。在分析兩個變量的相關性方面最傳統的方法就是使用Pearson相關系數,但該方法只能表示兩個變量之間的線性相關程度,對于非線性的關系偏差較大,很明顯這種相關性分析方法無法對強非線性關系的過程工業數據進行處理分析。目前常使用的多變量相關性分析方法有Granger因果關系分析、典型相關分析、灰色關聯分析、Copula分析和互信息分析等,但是各種分析方法都存在一定的不足和缺陷,例如:Granger因果關系分析不能給出定量的描述;典型相關性分析不適用于分析時間序列的問題;Copula分析對數據分布的規則度要求很高;灰色關聯分析的理論基礎研究還有待進一步完善;互信息分析計算復雜度較高,但隨著計算手段和計算速度的不斷提高,目前互信息分析手段應用十分廣泛[39-43]。

2.4 預測分析

基于數據的預測分析是一種從功能上定義的廣義概念,在工業生產中包括很大的范疇,例如過程工業中產品質量和產率的預測、生產操作中的優化、預警和裝置的故障診斷都可以歸屬于數據分析中的預測范疇。最常使用的預測分析方法就是應用各種神經網絡算法以及其與各種優化算法的結合。目前,應用相對成熟的神經網絡有BP神經網絡[44]、GRNN神經網絡[45]、RBF網絡[46]等。神經網絡具有以下優點:①理論上能夠逼近任意非線性映射;②善于處理多輸入輸出問題;③能夠進行并行分布式處理;④自學習與自適應性強;⑤可同時處理多種定性和定量的數據[47]。

對于大數據分析方法的研究還不是十分成熟,現階段大部分的數據分析方法還是源于統計學中的基本概念和原理,其主要功能包括:對數據進行降維處理、聚類和分類;相關性分析以及用于預測未來的事件;實現各種功能的算法眾多并且各有特點。目前,在過程工業中得到應用的實例都是將大數據分析方法中的多種功能和多種算法相結合而進行綜合應用的。

3 大數據技術在過程工業中的應用現狀

目前,大數據分析技術在過程工業中的應用還處于起步階段,所采用的方法與核心分析手段還是圍繞數據挖掘技術的基本算法展開的,只是將該基本算法借助先進的計算機技術應用到更大量的數據范圍內,從而發現更有價值的知識,獲得更有意義的信息。由于工業上已經普及了各類控制管理軟件,因此與商業和互聯網行業不同的是工業數據的采集已經沒有了難度,而對過程工業數據的分析和挖掘的重點和難點就是對海量數據的降噪處理以及應用各種智能算法對其進行分析和挖掘。

3.1 在過程工業優化方面的應用

當今世界各類工業過程都面臨著巨大的挑戰,尤其是過程工業,隨著社會生產力的發展促使了企業不但要提高裝置的生產效率,提高產品的質量,而且還需要將其對環境的危害降到最低。面對如此嚴峻的生產形勢,工業過程優化則體現出極大的優勢,因為過程優化可以有效地跟蹤整個裝置或企業生產經濟利益最優的途徑,還可以有效地克服工業過程的干擾和設備性能變化所產生的影響,可以實現經濟利益和生產目標的雙重最大化[48-49]。工業過程優化分為動態優化和穩態優化兩類情況。而進行過程優化的方法也有很多,其中基于數據分析技術的過程工業優化成為了一個新的研究思路[50]。

鋼鐵工業是國民經濟的支柱產業之一,是我國推動工業化進程的重要基礎。21世紀以來,我國鋼鐵生產已經接近或基本達到了國際先進水平[51]。在煉鋼生產過程中溫度是其中重要的工藝參數,溫度控制被認為是煉鋼系統運行平穩性的“晴雨表”[52]。但在現場生產過程中采集的溫度數據量巨大、噪聲多,給基于這些數據進行優化生產操作帶來一定的難度。宋輝[53]針對以上問題,提出了自組織映射神經網絡和模糊C均值聚類分析算法對工業數據進行處理,分別將兩種算法應用到某鋼廠煉鋼過程中的爐內目標溫度、鋼液的溫度、目標出鋼溫度等重要溫度監控點的數據中,結果顯示兩種算法均能夠有效地發現數據中的噪聲或異常數據,同時將兩種算法的聚類結果進行對比,發現模糊C均值聚類算法比自組織映射神經網絡算法的精度略差,但處理速度快。該研究為構造數據模型,再利用所構造的模型對現在甚至未來的同種數據研究,進而改進生產工藝,提高生產效率,奠定了堅實的基礎。

石化行業是我國國民經濟的另一個支柱產業之一,新世紀對石化行業的發展提出了新的要求,國內的煉油工業面臨著嚴峻的挑戰[54-55]。常減壓蒸餾、催化裂化、焦化、催化重整、催化加氫等工藝是煉油過程的主要生產工藝[56]。常減壓蒸餾是煉油廠的龍頭裝置,是石油加工的第一道工序,而在進入該工序之前需要采用電脫鹽的方法對原油進行預處理[57-58],但目前各生產企業電脫鹽效果普遍偏低。因此,郭超[59]創造性地提出了運用決策樹的方法來提高煉油生產過程中原油電脫鹽效率的研究方案,基于原油電脫鹽的數據采用C4.5決策樹算法建立了決策樹模型,根據該模型對數據進行聚類并提取分類規則,進而找到影響工業上原油電脫鹽效果的關鍵性影響因素,該結果對改進電脫鹽裝置的操作提供了有效可行的指導方案。

常減壓蒸餾屬于原油的一次加工過程,而隨著石油資源的不斷枯竭,則需要通過原油的二次加工來提高原油的利用率和產品的質量。催化裂化就是其中一個重要的生產工藝[60]。隨著原油重質化和劣質化程度的不斷加深,為提高催化裂化產品的質量,我國各煉油企業的催化裂化裝置多采用MIP工藝[61-62]。該工藝是將傳統的催化裂化提升管反應器分成了兩個反應區,在第一反應區和第二反應區之間常加入急冷介質來降低第二反應區的溫度,因此在整個提升管上溫度變化較大,溫度監控點較多,操作難度大[63-64]。藍興英教授團隊將互信息的概念應用到某煉油企業提升管反應器的溫度監測點分析中,研究了提升管上催化劑溫度、原料油溫度、第一反應區中部溫度、第一反應區出口溫度、第二反應區入口溫度以及第二反應區出口溫度6個溫度點40天的生產數據,得到兩兩溫度點之間的互信息熵并分析其數值,發現提升管反應器的熱量主要來源于催化劑所攜帶的熱量,在提升管反應器的操作過程中需要重點關注的溫度點是第一反應區中部溫度和第二反應區的入口溫度,極大地降低了提升管反應器的操作難度,為工業生產提供了重要的指導意見。

3.2 在過程監測和故障診斷方面的應用

過程監測和故障診斷源于20世紀60年代美國的航天和軍工方面[65]。當代過程工業生產不斷向大型化、連續化、高速化、智能化和精細化的方向發展,其工業過程和設備日益復雜,因此,過程監測和故障診斷已經成為了工業發展的必然趨勢。過程監測和故障診斷一般分為信號采集、特征提取、狀態識別和診斷決策4個主要步驟,這4個步驟是一個循環的過程,對于復雜的故障通常需要多個循環過程才能提高診斷的準確度,進而解決問題[66]。現今故障發生的原因和機理復雜程度的不斷加深,傳統的方法已經很難解決這些新的問題[67-68]。隨著數據庫的發展以及數據挖掘技術在商業、銀行等行業的成功應用,該技術也開始向其他行業滲透,對大數據分析技術的降維處理、分類與聚類分析,相關性分析和預測分析方法充分體現了該技術在處理海量數據方面的優勢。因此,將該技術與過程監測和故障診斷相結合,有利于突破傳統方法在過程監測和故障診斷方面的瓶頸。

鋼鐵產品是人類社會最主要的結構材料,高爐煉鐵工藝是一個典型的復雜工業系統[69]。控制好高爐煉鐵工藝過程對裝置的運行效率十分重要,但隨著工藝的逐漸復雜,控制難度也隨著增加,經過長期的發展歷程,專家系統在高爐煉鐵過程控制中普遍應用,并表現中極大的價值[70-74]。專家系統是工程師從領域專家那里獲取經驗知識,通過歸納和整理再結合一定的算法開發的應用系統,但高爐煉鐵過程中每套高爐都具有其自身的特點,一個高爐特定的專家系統是不能直接將其應用到其他高爐中的。因此,任盛怡[75]將數據挖掘的概念和方法引入到了高爐的專家系統中,在一定程度上解決了專家系統獲取知識時按照人為經驗的技術瓶頸。她利用基于卡爾曼濾波的BP神經網絡對高爐行程向涼、向熱進行分類來輔助專家系統,識別的準確率得到很大的提高;再結合K-Means算法對高爐的狀態參數進行聚類分析,可以確定每個參數運行的理想參數值,在此基礎上確定其最優閾值,從而可以有效準確地判斷高爐的運行狀態。

目前,各類化工原料和合成材料大部分均來自石油化工工業,其中乙烯生產裝置是石油石化工業的龍頭裝置,裂解爐是乙烯生產裝置的核心[76]。但隨著社會需求的不斷增加,乙烯裂解爐的單爐處理能力也隨之增加,設備大型化程度和復雜程度大幅增加,操作難度逐漸復雜,設備故障頻發,一直沒有找到有效的故障診斷和分析方法。張曉丹[77]提出了將大數據分析方法應用到乙烯裂解爐故障診斷中的新思路。她將免疫克隆算法和LVQ神經網絡相結合建立的故障診斷模型具有很好的分類性能,結果表明使用經免疫克隆算法優化的LVQ神經網絡診斷模型分類速度和準確度要遠高于未經優化的診斷模型,該模型可以準確地診斷乙烯裂解爐運行故障,提高了裝置運行的安全性和可靠性,同時也為乙烯收率和后續工段的操作穩定性提供有效的保障。

聚丙烯是一種性能優良的合成樹脂,占世界合成樹脂總產量的18%左右,而我國則可以達到30%,廣泛應用在電子、汽車、建筑材料、產品包裝等各個領域[78-79]。在聚丙烯生產過程中通常使用多尺度主元分析的方法進行丙烯聚合過程的監測和設備故障診斷,但該方法還不是很成熟經常出現錯報和漏報。夏陸岳等[80]使用小波變換閾值對生產數據進行去噪處理,再結合多尺度主元分析方法得到了改進的多尺度主元分析方法,并將其應用到聚丙烯生產過程監測和故障診斷過程中。應用結果表明,使用改進的多尺度主元分析故障診斷模型能夠極大地降低傳統診斷方法的誤報率和漏報率,可以達到工業生產的要求,減少因設備突發故障造成的經濟損失。

3.3 在產品預測方面的應用

過程工業中產品的產率和質量由裝置的操作過程所決定,但產品產率和產品質量數據的測量具有嚴重的時間滯后性,不能及時地將該結果反饋到生產操作過程中,因此能夠快速準確及時地預測產品的產率和產品的質量對提高裝置的運行效率具有重要意義。注塑成型是一種重要的塑料加工方法,可以在短時間內生產出結構復雜、尺寸精確的產品,其產品廣泛應用于電子、醫療、建材等生活中的方方面面[81]。但在生產過程中一般都是每批生產結束后通過抽樣檢測的方法對產品的質量進行檢測,存在嚴重的時間滯后性。趙斐等[82]針對這個問題,提出了利用拉普拉斯特征映射的方法對注塑過程的高維數據進行降維處理,再使用Mean Shift聚類方法對操作工況進行聚類分析,同時得到產品的分類規則,最后應用基于粒子群算法參數尋優的偏最小二乘支持向量機的方法建立了注塑過程的產品質量軟測量模型。實驗結果顯示,該模型不但大幅提高了傳統的偏最小二乘支持向量機的方法預測產品質量的精度和預測模型的泛化性能,同時還為企業生產提供了一種多工況下產品質量在線預測方法。

催化裂化是重質油輕質化的重要手段,通過分子篩催化劑的作用將重質餾分油和渣油在適宜的溫度和壓力的作用下轉化為干氣、液化氣、汽油和柴油,同時副產焦炭。焦炭作為催化裂化的主要副產物,不僅影響催化裂化裝置的輕質油收率同時還直接影響裝置的熱平衡,而目前大部分企業計算催化裂化焦炭產率的方法還是利用煙氣的組成進行粗略的估算,而且結果嚴重滯后[83]。為提高催化裂化裝置焦炭產率的預測準確程度并實現在線預測,蘇鑫等[47]通過分析催化裂化裝置反應-再生系統篩選出了影響催化裂化焦炭產率的28個主要參數,并將遺傳算法和BP神經網絡相結合,建立了催化裂化裝置焦炭產率預測模型,并將該模型應用到某煉廠的生產數據中,其結果表明該預測模型能夠準確地預測催化裂化裝置的焦炭產率,為優化催化裂化裝置操作,提高催化裂化輕質油收率提供了有效的保障。

辛烷值是汽油的一個重要的評價參數,它代表了汽油的抗暴性能。而傳統測定汽油辛烷值方法費時,測試設備龐大,操作難度大。周小偉等[84]針對該問題,將集總思想與數據分析技術相結合,他把汽油的辛烷值看成是汽油鏈烷烴、環烷烴、芳烴和烯烴的集總,在此基礎上使用BP神經網絡建立了清潔汽油的研究法辛烷值預測模型,經過實例計算驗證和對比分析發現該模型可以很好地反映汽油研究法辛烷值和各集總組分之間的復雜的非線性關系,可以十分準確地預測汽油的研究法辛烷值,為測定汽油的辛烷值提供了一種新的思路。

大數據技術已經在過程工業中得到了初步應用,為解決過程工業中存在的問題提供了一種新的思路。目前該技術已在過程操作優化,過程監測與故障診斷以及產品質量和產率的預測等方面得到了一定的應用并取得了較好的效果。相信隨著大數據技術的不斷發展,未來該技術的應用領域將會越來越廣泛,應用效果將會越來越明顯。

4 結 語

綜上所述,大數據技術在分析過程工業中已經有了初步應用,同時取得了較好的效果。然而,這些大數據技術基本上還源于原有數據挖掘技術的原理和方法,沒有充分發揮出大數據的特點和潛在的價值。也就是說,目前已經應用的大數據技術,其本質還是數據挖掘技術,雖然所處理的數據維度和數據量有所增加,但還沒有充分利用現有的數據量,在一定程度上不利于工業技術的發展和進步。

此外,已有大數據技術的應用基礎只涵蓋了一臺設備、一套裝置最多也只是一個車間的數據范圍,還沒有有效地將整個企業內部生產制造系統的全部數據和企業外部的數據相結合。因此,如果能夠將原料和產品的市場價格以及供需情況等數據與企業內部的生產數據相結合,根據市場需求調整企業的生產方案,使企業生產能夠達到利潤最大化,這樣就可以更加充分地發揮大數據的價值。

參 考 文 獻

[1] 韓晶.大數據服務若干關鍵技術研究[D].北京:北京郵電大學,2013.

[2] CRASSO M,ZUNINO A,CAMPO M.Easy web service discovery:a query-by-example approach[J].Science of Computer Programming,2008,71(2):144-164.

[3] CHIRITA P A,NEJDL W.13th International Conference, SPIRE 2006, Glasgow, UK, October 11-13, 2006 [C].Berlin:Springer, 2006:86-97.

[4] O’DRISCOLL J,DAUGELAITE,SLEATOR R D.‘Big data’,Hadoop and cloud computing in genomics[J].Journal of Biomedical Informatics,2013,46(5):774-781.

[5] HERODOTOU H,LIM H,LUO G,et al.5th Biennial Conference on Innovative Data Systems Research (CIDR), January 9-12, 2011[C].California:ACM Press,2011.

[6] 李杰,劉宗長.中國制造2025的核心競爭力——挖掘使用數據[J].博鰲觀察,2015(4):52-55.

[7] 彭訓文.工業4.0:從自動生產到智能制造[J].大飛機,2014(7):40-42.

[8] 王寧玲,付鵬,陳德剛,等.大數據分析方法在廠級負荷分配中的應用[J].中國電機工程學報,2015,35(1):68-73.

[9] 孔憲光,章雄,馬洪波,等.面向復雜工業大數據的實時特征提取方法研究[J].西安電子科技大學學報,2016,43(5):78-83.

[10] HAND D J.Data mining:statistics and more?[J].The American Statistician,1998,52(2):112-118.

[11] HAND D J.Statistics and data mining:intersecting disciplines[J].ACM SIGKDD Explorations Newsletter,1999,1(1):16-19.

[12] HOPKINS B,EVELSON B,LEAVER S,et al.Expand your digital horizon with big data[R].Forrester,2011.

[13] 王建民.探索走出符合國情的工業大數據自主之路——工業大數據的范疇、關鍵問題與實踐[J].中國設備工程,2015(9):36-37.

[14] 高嬰勱.工業大數據價值挖掘路徑[J].中國工業評論,2015(s1):21-27.

[15] 劉繼偉.基于大數據的多尺度狀態監測方法及應用[D].北京:華北電力大學,2013.

[16] DERMAN C.Adaptive control processes,a guided tour[J].Management Science,1961,7(4):450.

[17] 畢達天,邱長波,張晗.數據降維技術研究現狀及其進展[J].情報理論與實踐,2013,36(2):125-128.

[18] 譚璐.高維數據的降維理論及應用[D].長沙:國防科學技術大學,2005.

[19] JACKSON,E J.A user’s guide to principal components[M].New York:Wiley-Interscience [Imprint];John Wiley & Sons,Incorporated,2005.

[20] 李榮雨.基于PCA的統計過程監控研究[D].杭州:浙江大學,2007.

[21] 成平,李國英.投影尋蹤——一類新興的統計方法[J].應用概率統計,1986,2(3):267-276.

[22] 曾群芳.基于拓撲結構保持的線性降維方法研究及其應用[D].廣州:華南理工大學,2012.

[23] BRAND M.18th International Joint Conference on Artificial Intelligence, 2003[C].San Francisco:Morgan Kaufmann Publishers,2003:547-552.

[24] GRIFFITHS T L,KALISH M L.A multidimensional scaling approach to mental multiplication[J].Memory & Cognition,2002,30(1):97-106.

[25] ZHA H Y,ZHANG Z Y.Twentieth International Conference on Machine Learning. 2003[C].Menlo Park, California:AAAI Press,2003.

[26] SAUL L K,ROWEIS S T.Think globally,fit locally:unsupervised learning of nonlinear manifolds[J].Journal of Machine Learning Research,2003,4(2):119-155.

[27] GRIGOR’YAN A.Estimates of heat kernels on Riemannian manifolds[M]// DAVIES E B,SAFAROW Y. Spectral theory and geometry. Cambridge:Cambridge Universty Press,1999:140–225.

[28] 許麗利.聚類分析的算法及應用[D].長春:吉林大學,2010.

[29] 戴濤.聚類分析算法研究[D].北京:清華大學,2005.

[30] 郭軍華.數據挖掘中聚類分析的研究[D].武漢:武漢理工大學,2003.

[31] 劉紅巖,陳劍,陳國青.數據挖掘中的數據分類算法綜述[J].清華大學學報(自然科學版),2002,42(6):727-730.

[32] QUINLAN J R.C4.5:Programs for machine learning[M].San Mateo:Califomia Morgan Kaufmann,1993.

[33] 欒麗華,吉根林.決策樹分類技術研究[J]. 計算機工程,2004,30(9):94-96,105.

[34] RISSANEN J,AGRAWAL R,MEHTA M.International Conference on Very Large Data Bases[C].San Francisco:Morgan Kaufmann Publishers,1996.

[35] FRIEDMAN N,GEIGER D,GOLDSZMIDT M.Bayesian network classifiers[J].Machine Learning,1997,29(1):131-163.

[36] LIU B,HSU W,MA Y.The Fourth International Conference on Knowledge Discovery and Data Mining [C].Menlo Park, California:AAAI Press,1998.

[37] 李偉衛,李梅,張陽,等.基于分布式數據倉庫的分類分析研究[J].計算機應用研究,2013,30(10):2936-2939,2943.

[38] 劉曉欣.互信息多元時間序列相關分析與變量選擇[D].大連:大連理工大學,2013.

[39] 何寬,陳森發.基于一類因果關系圖的綜合評價方法及應用[J].控制與決策,2010,25(10):1513-1518.

[40] YAMAMOTO H,YAMAJI H,FUKUSAKI E,et al.Canonical correlation analysis for multivariate regression and its application to metabolic fingerprinting[J].Biochemical Engineering Journal,2008,40(2):199-204.

[41] SUNGUR Engin A.An introduction to copulas[J].Journal of the American Statistical Association,2000,95(449):334-335.

[42] TSENG F M,YU H C,TZENG G H.Applied hybrid grey model to forecast seasonal time series[J].Technological Forecasting and Social Change,2001,67(2):291-302.

[43] KWAK N,CHOI C H.Input feature selection by mutual information based on parzen window[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(12):1667-1671.

[44] 丁云,于靜江,周春暉.原油蒸餾塔的質量估計和優化管理[J].石油煉制與化工,1994,25(5):23-28.

[45] 郭斌,孟令啟,杜勇,等.基于GRNN神經網絡的中厚板軋機厚度預測[J].中南大學學報(自然科學版),2011,42(4):960-965.

[46] 王文新,潘立登,李榮,等.常減壓蒸餾裝置雙模型結構RBF神經網絡建模與應用[J].北京化工大學學報,2004,31(5):23-28.

[47] 蘇鑫,裴華健,吳迎亞,等.經遺傳算法優化的BP神經網絡預測催化裂化裝置焦炭產率應用[J].化工進展,2016,35(2):389-396.

[48] 張健,陳丙珍,胡山鷹,等.復雜流程工業系統的優化操作[J].計算機與應用化學,2000,17(6):481-488.

[49] 柴天佑,丁進良,王宏,等.復雜工業過程運行的混合智能優化控制方法[J].自動化學報,2008,34(5):505-515.

[50] 牟盛靜.石化工業過程建模與優化若干問題研究[D].杭州:浙江大學,2004.

[51] 殷瑞鈺.新世紀煉鋼科技進步回顧與“十二五”展望[J].煉鋼,2012,28(5):1-7.

[52] 薛見新.煉鋼連鑄過程溫度流優化的設計與分析[D].沈陽:東北大學,2010.

[53] 宋輝.聚類分析系統的設計與實現及在工業中的應用[D].天津:天津科技大學,2004.

[54] 王基銘.21世紀我國煉油工業面臨的挑戰和對策[J].石油煉制與化工,1999,30(5):3-6.

[55] 侯芙生.創新煉油技術推動21世紀我國煉油工業的發展[J].石油煉制與化工,2002,33(1):1-9.

[56] 徐春明,楊朝合.石油煉制工程[M].4版.北京:石油工業出版社,2009.

[57] 殷衛兵,羅雄麟,史偉.原油常減壓蒸餾塔的流程模擬[J].化工自動化及儀表,2010,37(5):88-93.

[58] 梁志勇,孫甲,劉政,等.原油電脫鹽脫水技術的研究現狀及進展[J].石油和化工設備,2012,15(8):26-29.

[59] 郭超.決策樹方法在提高電脫鹽效果中的應用[J].計算機工程與設計,2010,31(10):2372-2375.

[60] 侯祥麟.中國煉油技術[M].2版.北京:中國石化出版社,2001.

[61] 許友好.我國催化裂化工藝技術進展[J].中國科學(化學),2014,44(1):13-24.

[62] 閆平祥,劉植昌,高金森,等.重油催化裂化工藝的新進展[J].當代化工,2004,33(3):136-140.

[63] 許友好,張久順,龍軍.生產清潔汽油組分的催化裂化新工藝MIP[J].石油煉制與化工,2001,32(8):1-5.

[64] 許友好,張久順,馬建國,等.生產清潔汽油組分并增產丙烯的催化裂化工藝[J].石油煉制與化工,2004(9);1-4.

[65] 伍星,陳進,李如強,等.基于數據挖掘的設備狀態監測和故障診斷[J].振動與沖擊,2004,23(4):72-76.

[66] FAYYAD U,STOLORZ P.Data mining and KDD:promise and challenges[J].Future Generation Computer Systems,1997,13(2):99-115.

[67] 周德澤.計算機智能監測控制系統的設計及應用[M].北京:清華大學出版社,2002.

[68] 郭明.基于數據驅動的流程工業性能監控與故障診斷研究[D].杭州:浙江大學,2004.

[69] 張殿偉,郭培民,趙沛.現代煉鐵技術進展[J].鋼鐵釩鈦,2006,27(2):26-32.

[70] 劉祥官,曾九孫,郝志忠,等.多模型集成的高爐煉鐵智能控制專家系統[J].浙江大學學報(工學版),2007,41(10):1637-1642.

[71] LIAO S H.Expert system methodologies and applications—a decade review from 1995 to 2004[J].Expert Systems with Applications,2005,28(1):93-103.

[72] 周傳典.高爐煉鐵生產技術手冊[M].北京:冶金工業出版社,2002.

[73] 劉祥官,劉芳.高爐過程優化與智能控制模型[J].高校應用數學學報A輯(中文版),2001,16(4):462-470.

[74] BETTINGER D,SCHURZ B,STOHL K,et al.Expert system control of blast furnaces-the next step[J].Steel Times International,2005,29(7):14.

[75] 任盛怡.基于數據挖掘的高爐異常爐況分析[D].重慶:重慶大學,2009.

[76] 何細藕.乙烯裂解爐技術進展[J].現代化工,2001,21(9):13-17.

[77] 張曉丹.基于免疫克隆算法的LVQ神經網絡研究及其在化工工業故障診斷過程中的應用[D].上海:華東理工大學,2014.

[78] 于文秀.聚丙烯技術新進展[J].石油化工,2003,32(10):913-917.

[79] 趙文明.對我國聚丙烯技術及市場發展的認識和思考[J].化學工業,2009,27(12):10-16.

[80] 夏陸岳,潘海天,周猛飛,等.基于改進多尺度主元分析的丙烯聚合過程監測與故障診斷[J].化工學報,2011,62(8):2312-2317.

[81] 李躍文.塑料注塑成型技術新進展[J].塑料工業,2011,39(4):6-9.

[82] 趙斐,陸寧云,楊毅.基于工況識別的注塑過程產品質量預測方法[J].化工學報,2013,64(7):2526-2534.

[83] 曹漢昌,郝希仁,張韓.催化裂化工藝計算與技術分析[M].北京:石油工業出版社,2000.

[84] 周小偉,袁俊,楊伯倫.應用BP神經網絡的二次反應清潔汽油辛烷值預測[J].西安交通大學學報,2010,44(12):82-86.

Recent development of the application of big data technology in process industries

SU Xin,WU Yingya,PEI Huajian,LAN Xingying,GAO Jinsen
(State Key Laboratory of Heavy Oil Processing,China University of Petroleum-Beijing,Beijing 102249,China)

Abstract:Recently,the big data technology has been applied in many field widely,such as finance,trade and medical healthy. But the applications in process industries are only in the beginning stages. In this paper,the characteristics,analyzing methods and applications of the data in process industries are introduced. The data obtained by the process industry have the characteristics of high dimension,strong nonlinearity,uneven sample distribution and low signal-to-noise ratio except from the characteristics of volume,variety,velocity and variability. The big data technology has emerged and developed to be available in analyzing data from the process industries. The analyzing methods based on the industrial data include dimension reduction analysis,cluster and classification analysis,correlation analysis and prediction analysis according to their functions. In this paper,the applications of the big data technology in process industries are summarized from three aspects including process optimization,process monitoring and fault diagnosis and prediction of product properties and yield. It is found that the big data will play a more important role if the production data in the process industries can be combined with the market data of raw material and product. Key words:big data;process industry;data analysis;process systems

中圖分類號:TQ 063

文獻標志碼:A

文章編號:1000–6613(2016)06–1652–08

DOI:10.16085/j.issn.1000-6613.2016.06.006

收稿日期:2016-02-01;修改稿日期:2016-02-29。

猜你喜歡
數據分析大數據
我校如何利用體育大課間活動解決男生引體向上這個薄弱環節
體育時空(2016年8期)2016-10-25 18:02:39
Excel電子表格在財務日常工作中的應用
淺析大數據時代背景下的市場營銷策略
新常態下集團公司內部審計工作研究
中國市場(2016年36期)2016-10-19 04:31:23
淺析大數據時代對企業營銷模式的影響
基于讀者到館行為數據分析的高校圖書館服務優化建議
科技視界(2016年22期)2016-10-18 14:37:36
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 丁香婷婷激情综合激情| 国产尤物在线播放| 久久久精品无码一二三区| 99热精品久久| 就去色综合| 亚洲精品无码人妻无码| 欧美a√在线| 亚洲成AV人手机在线观看网站| 国产日韩欧美一区二区三区在线| 天天综合天天综合| 不卡视频国产| 国产精品视频3p| 国产激爽大片高清在线观看| 色综合久久88| 国产精品片在线观看手机版| 国产精品人人做人人爽人人添| 精品综合久久久久久97超人该| 自慰网址在线观看| 一本大道无码日韩精品影视| 日本在线免费网站| 91精品啪在线观看国产91| 欧美日韩一区二区三区在线视频| 国产精品亚洲а∨天堂免下载| 高清精品美女在线播放| 很黄的网站在线观看| 国产一国产一有一级毛片视频| 亚洲精品第一页不卡| 亚洲A∨无码精品午夜在线观看| 亚洲精品视频网| 久久久久亚洲精品成人网| 国产丝袜啪啪| 美女免费黄网站| 91久久青青草原精品国产| 国产精品网址你懂的| 亚洲三级色| 欧美福利在线| 国产成人免费| 99视频国产精品| 激情午夜婷婷| 国产精品亚洲专区一区| 精品一区二区三区波多野结衣| 男女性午夜福利网站| 亚洲第一色网站| 国产成人综合网在线观看| 日本在线欧美在线| 国产男人的天堂| 欧美成人A视频| 国产一线在线| 一级毛片视频免费| 亚洲水蜜桃久久综合网站| 狠狠久久综合伊人不卡| 欧洲免费精品视频在线| 国产白浆一区二区三区视频在线| 国产黄网永久免费| 色成人亚洲| 国产噜噜噜视频在线观看| 狠狠综合久久| 91精品视频在线播放| 亚洲天堂视频网站| 毛片免费在线| 国产精品妖精视频| 免费国产黄线在线观看| 青青草原偷拍视频| 亚洲三级视频在线观看| 呦系列视频一区二区三区| 精品国产免费人成在线观看| 亚洲人成色77777在线观看| A级毛片高清免费视频就| 国产亚洲视频在线观看| 欧美一级特黄aaaaaa在线看片| 91亚洲精品第一| 日本高清在线看免费观看| 亚洲国产AV无码综合原创| 国产一级α片| 成人欧美在线观看| 日本精品αv中文字幕| 国内精品免费| 久久精品无码一区二区国产区| 日本妇乱子伦视频| 亚洲精品成人片在线观看| 日韩国产高清无码| 国产精品亚洲αv天堂无码|