999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于K近鄰算法的外采成品油溯源方法

2020-03-12 05:49:02
石油庫與加油站 2020年6期
關鍵詞:模型

鄭 斌

〔中國石化銷售股份有限公司 北京 100728〕

外采油品作為中國石化銷售企業(yè)重要的資源補充,對于穩(wěn)定市場供應具有重要的作用。然而外采油品來源復雜,非法調和油品常?;祀s其中,社會上由此導致的質量事故頻發(fā),給企業(yè)帶來巨大風險。中國石化強化外采油品源頭管理,建立了供應商和可采生產企業(yè)目錄,并設立了“三不采”原則,即無法確定油品生產企業(yè)的不采;油源向上追溯三級,生產企業(yè)不在規(guī)定目錄范圍內的不采;供應商未提供合格質量檢測報告的不采。然而在利益的驅動之下,部分供應商為了將調和油品或源頭不明的油品賣入石化銷售企業(yè),偽造油品真實來源。因此,識別和追溯外采油品的來源,對于成品油銷售企業(yè)采購和質量管理具有十分重要的現(xiàn)實意義。

目前,質量管理人員核實外采油品來源的方法,一是查驗供應商提供的生產商報告單,二是比對入庫質檢數(shù)據(jù)與出廠報告單數(shù)據(jù)的一致性。其中,查驗生產商報告單受人員主觀影響較大,而且隨著造假手段不斷發(fā)展,報告單樣式的差異越來越細微,人工識別的難度越來越大。比對質檢報告數(shù)據(jù)一致性對人員能力要求很高,成品油質量指標眾多,而且可采生產企業(yè)多達上百家,即使出現(xiàn)檢測數(shù)據(jù)比對不一致的情況,管理人員也很難追溯油品的真實來源。

K近鄰算法(K Nearest Neighbors,KNN)是一種比較成熟的分類算法,也是最簡單的機器學習算法之一[1]。由于該法操作簡單,目前已經廣泛且有效地應用于各種領域的識別、溯源和預測等問題上[2-6]。例如文獻[2]將其與氣相色譜-質譜分析法相結合應用于動物油鑒別區(qū)分,文獻[3]將其應用于犯罪工具圖片快速溯源,文獻[4]將其應用于網(wǎng)絡輿情中的新話題熱度預測,文獻[5]將其應用于城市道路短時交通預測。為了解決外采油人工溯源難的問題,本文以K近鄰算法為基礎,探索性提出了一種外采油品溯源方法,建立了外采油生產商匹配模型。應用結果證明,該方法具有良好的可行性,能夠有效輔助管理人員識別和追溯外采油的來源。

1 K近鄰算法簡介

K近鄰算法是基于統(tǒng)計的分類方法,是數(shù)據(jù)挖掘分類算法中比較常用的一種方法。所謂K最近鄰,就是K個最近的鄰居的意思,即每個樣本都可用它最接近的K個鄰居來代表。其核心思想是[1]:如果一個樣本在特征空間中的K個最相鄰的樣本中的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。K近鄰算法中,所選擇的鄰居都是已經正確分類的對象。該方法在確定分類決策上只依據(jù)最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。K近鄰算法是一種基于實例的學習方法[5],不需要對機器進行已知樣本的訓練,具有很好的魯棒性,簡單易用,分類準確率較高,對

大規(guī)模數(shù)據(jù)非常有效[6]。K近鄰算法見圖1。

圖1 K近鄰算法示意圖

K近鄰算法流程如下:第一步:構建一個已分好類的數(shù)據(jù)集;第二步:計算新近樣本與數(shù)據(jù)集中所有數(shù)據(jù)的距離;第三步:按照距離大小進行遞增排序;第四步:選取距離最小的K個樣本;第五步:確定前K個樣本所在類別出現(xiàn)的頻率,并輸出出現(xiàn)頻率最高的類別。

2 基于K近鄰的生產商匹配模型

2.1 生產商匹配模型思路

生產工藝穩(wěn)定的煉油企業(yè)生產的油品質量是相對穩(wěn)定的,出自同一生產企業(yè)的油品具有相似的質量特征。中國石化銷售企業(yè)LIMS數(shù)據(jù)庫中積累了海量的外采油樣本,基本涵蓋了國內所有的煉油生產企業(yè),每一個外采油樣本都具有明確的類別信息(供應商和生產商信息)?;贙近鄰算法實現(xiàn)油品溯源的基本思路是:如能從歷史數(shù)據(jù)中找到與待溯源樣本質量特征相似的油品,據(jù)相近相似原理,則可根據(jù)相似樣本的來源推斷該油品來源。據(jù)此構建生產商匹配模型:利用K近鄰算法,在歷史數(shù)據(jù)庫中找出與該樣本最相似的K個樣本,將該樣本與K個最近鄰樣本的生產商信息進行匹配識別,據(jù)匹配結果判斷油品來源是否準確。當與其中一個或多個樣本匹配成功時,判斷該樣本所述生產商為真;否則,判斷該樣本所述生產商為假,該樣本來源存疑。

2.2 生產商匹配模型的實現(xiàn)

(1)確定比對數(shù)據(jù)集。由于K近鄰算法需要計算待溯源樣本與比對數(shù)據(jù)集中每一個樣本的距離,當比對數(shù)據(jù)集較大時,特別是特征數(shù)量比較大時,計算量相當大,時間復雜度高。為了提高溯源的準確性和模型運算效率,本研究中選擇待溯源樣本之前6個月的所有外采油歷史樣本作為比對數(shù)據(jù)集。

(2)確定特征向量。本研究中,結合業(yè)務意義與指標重要性,選擇汽油的常規(guī)理化指標中研究法辛烷值、硫含量、烯烴含量、芳烴含量、氧含量、苯含量、餾程和密度作為計算樣本間距離的特征向量。

(3)樣本預處理。在某些情況下用于計算樣本距離的指標可能為空缺值,對于指標為空的情況,在計算距離前需要對空缺值進行填充。本研究采用平均值填充法,即采用與該樣本同類型、同牌號的樣本中指標的平均值進行填充。

(4)相似度計算。歐式距離是一種常用的衡量m維空間中兩點距離的度量。本研究采用歐氏距離計算待溯源樣本與比對數(shù)據(jù)集中樣本的相似度,計算公式如公式(1)所示。

(1)

式中:xk為樣本x在k維向量上的坐標;yk為樣本y在k維向量上的坐標;n為空間維數(shù)(特征向量數(shù));d(x,y)為樣本x與樣本y的歐式距離。

(5)結果匹配與判斷。根據(jù)計算結果,按照距離大小對樣本進行遞增排序。模型構建中選取K值為5,即選取距離最近的5個樣本,判斷待溯源樣本與這5個最近鄰樣本的生產商是否一致,當與5個樣本中一個或多個樣本一致時,定義為匹配成功;當與5個樣本都不一致時,定義為匹配不成功,判定該樣本油源存疑,并給出預警。

3 模型應用效果

供應商根據(jù)性質不同可以分為生產型供應商和貿易型供應商。生產型供應商本身既是供應商又是生產商,其油品來源一般是清晰準確的;貿易型供應商其油品來源復雜,其提供的油源(生產商)信息往往存在疑問,是溯源管理的重點。

為驗證該方法的可行性,選取了2018年12月1日至12月10日某公司入庫的160個外采油樣本(其中,80個生產型供應商樣本和80個貿易型供應商樣本)作為驗證樣本,驗證模型的識別、預警和溯源效果。生產型供應商樣本和貿易型供應商樣本典型的模型匹配結果如表1和表2所示。對模型匹配結果進行統(tǒng)計分析,結果如表3所示。對模型輸出的5個最近鄰樣本的匹配結果進行統(tǒng)計,結果如表4所示。

表1 生產型供應商樣本的典型匹配結果

表2 貿易型供應商樣本的典型匹配結果

表3 驗證樣本模型匹配結果統(tǒng)計

表4 5個最近鄰中匹配成功的樣本個數(shù)

由表3和表4可以看出,生產型供應商樣本的模型匹配成功率很高,達到95%,即95%的樣本通過模型匹配準確找到其生產商來源。在生產型供應商樣本中,模型輸出的5個最近鄰樣本與待溯源樣本全部匹配成功的有51個,占總樣本數(shù)的63%,顯示模型匹配的精度很高。貿易型供應商樣本的模型匹配成功率較低,預警率達到34%,即34%的樣本通過模型匹配進行了預警,提示油源存疑。其中,Z石油串換樣本的匹配成功率相對較高,達到81%,社會供應商樣本的匹配成功率較低,63%的樣本來源存疑進行了預警。由表4可見,Z石油串換樣本的匹配精度高于社會供應商樣本的匹配精度,社會供應商樣本的匹配精度明顯較低,絕大多數(shù)樣本只能與5個最近鄰中的1~2個樣本匹配成功。這與實際情況是一致的,反映了社會供應商提供的油源信息的可靠性較低。

對于未匹配成功的樣本,除了預警之外,根據(jù)模型匹配結果還可以提示油品可能的真正來源。如表2中:樣本(2125874)的模型匹配結果顯示5個最近鄰樣本中有3個樣本為同一個生產商(F石化分公司),指示樣本的油源有可能來自該生產商。經核實,該樣本的油品真實來源為F石化分公司,是操作人員在LIMS系統(tǒng)錄入生產商信息時出現(xiàn)了差錯;樣本(2123293)的5個最近鄰樣本中有3個樣本為同一生產商(L股份公司),指示該批油品可能來源于此生產商;樣本(2121049)的5個最近鄰樣本中,與第一個樣本的相似度顯著高于其余4個樣本,指示這兩批次油品可能來自同一來源,這為管理人員進一步溯源指示了方向。

對給出預警的貿易型供應商樣本所述的生產商信息進行核實,結果如表5所示,發(fā)現(xiàn)其中有10個樣本的生產商信息存在人為錄入差錯(即在LIMS系統(tǒng)錄入信息時生產商選擇錯誤),17個樣本存在供應商偽造報告、供應商油品混存、來源不清等情況。樣本信息失真嚴重影響油品溯源的準確性,因此,提高LIMS系統(tǒng)樣本信息錄入的準確性,將有助于提升模型匹配準確性和溯源結果可靠性。

表5 預警樣本油源核實情況

4 結束語

提出了一種基于K緊鄰算法的外采成品油溯源方法,建立了外采油生產商匹配模型。通過計算待溯源樣本與LIMS系統(tǒng)歷史樣本的相似度,給出5個目標生產商。通過與目標生產商的匹配識別,實現(xiàn)外采油生產商識別、預警和溯源。將該方法已應用于中國石化銷售企業(yè)外采油的溯源管理。實踐證明,該方法可行有效,模型的適用性較好,能夠為管理人員追溯油品來源提供可靠依據(jù),大大提高溯源的成功率和效率。K近鄰算法中,模型溯源結果的準確性依賴于樣本信息的準確性,提高樣本錄入信息的準確性將有助于進一步提高模型的溯源準確性。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數(shù)模型及應用
p150Glued在帕金森病模型中的表達及分布
函數(shù)模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲成av人无码综合在线观看| 91在线中文| 2021国产乱人伦在线播放| 99久久无色码中文字幕| 日本一本在线视频| 日韩在线观看网站| 亚洲一区黄色| a国产精品| 人妻丰满熟妇av五码区| 亚洲人妖在线| 亚洲综合九九| 99久久精品视香蕉蕉| 97综合久久| 亚州AV秘 一区二区三区| 中文字幕无码电影| 91青青草视频在线观看的| 2024av在线无码中文最新| 中国国产高清免费AV片| 成人福利视频网| 午夜啪啪网| 国产夜色视频| 青青青国产精品国产精品美女| 国产91导航| 就去吻亚洲精品国产欧美| 久久久久亚洲AV成人人电影软件| 亚洲精品爱草草视频在线| 欧美三級片黃色三級片黃色1| 国产精品视频猛进猛出| 亚洲一区波多野结衣二区三区| 国产Av无码精品色午夜| 国产成人一二三| 欧美三級片黃色三級片黃色1| 亚洲一级毛片免费观看| 在线观看的黄网| 亚洲日韩精品无码专区| 久久黄色小视频| 欧美中文一区| 日韩高清一区 | 国产青青操| 91最新精品视频发布页| 免费看美女自慰的网站| 国产欧美日韩综合在线第一| 97国产在线视频| 久久中文无码精品| 啪啪国产视频| 伦精品一区二区三区视频| 日韩欧美国产另类| 色综合天天综合中文网| 久久永久免费人妻精品| 日本精品一在线观看视频| 91精品国产情侣高潮露脸| 狠狠色噜噜狠狠狠狠色综合久| 亚洲精品国产精品乱码不卞| 亚洲永久色| 无码精油按摩潮喷在线播放| 婷婷六月综合网| 亚洲综合色婷婷中文字幕| 亚洲无码精品在线播放| 亚洲婷婷在线视频| 成·人免费午夜无码视频在线观看| 亚洲午夜福利在线| 国产区免费精品视频| 97se亚洲综合在线| 狠狠色丁婷婷综合久久| 四虎成人精品在永久免费| 亚洲系列无码专区偷窥无码| 成人福利在线视频| 亚洲精品色AV无码看| 欧美三级不卡在线观看视频| 亚洲一欧洲中文字幕在线| 性喷潮久久久久久久久| 亚洲开心婷婷中文字幕| 天天躁夜夜躁狠狠躁图片| 亚洲国产成人麻豆精品| 88av在线播放| 亚洲无限乱码一二三四区| 天堂岛国av无码免费无禁网站| 国产精品美女自慰喷水| 久久一本日韩精品中文字幕屁孩| 国产最爽的乱婬视频国语对白| 国产一级一级毛片永久| 欧美不卡视频在线|