999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

石油鉆井行業安全監督大數據分析及應用方法探究

2021-12-20 06:32:14張麟豪王浩多周宇煒周彤彤
廣州化工 2021年23期
關鍵詞:監督文本分析

唐 桃,張麟豪,王浩多,周宇煒,周彤彤

(川慶鉆探工程有限公司安全環保質量監督檢測研究院,四川 廣漢 618300)

1 石油鉆井行業安全監督大數據的研究意義

目前對監督日常運行過程中產生的海量、多樣的現場數據的利用,還停留在基本的數據統計分析上,對其初步進行篩選的方法也較為單一,未能充分考慮作業點數量變化等數據與分析結果的相關性,對于作業現場實際情況的評價深度仍有待提高。

一套能深度結合安全監督站海量歷史數據量化各類變量相關性的安全監督數據分析方法對解決鉆(修)井作業現場安全生產管理的實際需求極為關鍵。探究石油鉆井行業大數據的分析和應用方法將逐步平衡大數據處理和人力消耗的平衡,進一步豐富數據分析層次和維度。

2 安全監督行業大數據分析與運用的實際問題及研究現狀

2.1 石油鉆井行業安全監督大數據存在的實際問題

現有數據分析層次和維度不夠豐富。就目前安全監督站編制數據分析報告所使用的方法及工作思路來看,側重分析的角度較為單一,僅僅停留在數據初篩和基本走勢上,沒有更多具有針對性的分析對比,數據分析程度較低。

其次,待處理數據量與人力消耗不成比例。一方面,在數據量劇增和累積的大背景下,人工處理耗時耗力且標準難以完全統一的問題愈加突出。另一方面,人員精力耗費在數據的基礎處理上,不利于數據的深度分析和進一步應用。面對監督站多年來庫存的近百萬條歷史數據存量及與日俱增的數據增量,監督站急需一種全新的數據處理方法以提高工作質量及效率,減輕數據分析人員的工作負荷,集中人員精力于分析和應用深度的提高上。

2.2 大數據分析及應用在安全管理領域的研究現狀

煤礦安全領域[1]較早地啟動了安全生產管理的信息化建設,行業開始興建以“數據管理、安全預警”[2]為目的的安全預警系統,雖然以數據為管理依據的改變一定程度地減輕了經驗主義帶來的主觀誤判,但現場影響因子眾多(如工齡、工況、季節、物資儲備、設備狀態等),分支專業交叉性復雜(如搬安、鉆進、復雜處理等),架構和核心算法都過于簡陋的“安全預警系統”[3]僅僅起到了數據存裝和篩查的作用,并未在安全評價、預防性監督、過程管理、事故預測、應急救援、制度完善等方面給出量化的評測結果和針對性運行方案。既未針對煤礦領域的安全管理對現有成熟的大數據分析和應用方法進行專業化改良,更未自成體系地形成基于大數據分析和應用目的的核心方法理論。

基于現有的安全監督數據庫,標準化處理、自動化分析“隱患違章”、“運行數據”和“事故信息”是后續過程管理、事故預測和應急救援的應用基礎,因此實現安全評價和預防性監督是本次研究的側重點。

數據預處理[4]領域中常見的文本預處理數據源多為完整的段落或文章,而安全監督站所收集文本源多為單一語句或詞匯(隱患、違章、事故事件匯報等)。前者雖然文本結構復雜、信息冗雜、風格化嚴重,但文本信息也較為豐富,語言邏輯完整,但通過現有成熟的停用詞表、jieba詞庫[5]漏篩、斷詞,再利用聚類分析和tfidf向量算法[6]便能較為完美地解決上述問題完成文本預處理,在后期數據的挖掘和應用中具有明顯優勢;而后者看似文本短小精干,但通常為人工輸入或錄入,用詞多樣、描述簡潔,信息素不全的現象較為嚴重,去停用詞處理、分詞、特征文本提取、詞頻統計困難較大,因此還必須結合“場所”“工序”等其他信息進行綜合判斷,數據預處理的綜合成本明顯增加。

3 安全監督數據庫數據標準化

基于以上難點和現狀,安全監督數據庫文本數據的標準化流程仍然是數據篩查分析、應用預測的重點工作。

3.1 文本數據清洗

隱患欄中涉及的“作業項目”“施工單位”“區域”“整改情況”,違章欄中涉及的“二級單位”“人員崗位”“用工性質”“所屬公司”都存在以上問題,對于每周動輒4000多項隱患(五萬多欄單元格內容)和300余項違章(六千余欄單元格內容),一方面人工處理成本極高,同時還會侵占壓榨完成其他價值工作的人力資源。

文本數據的清洗流程大致分以下三步,如圖1所示:

圖1 文本數據清洗流程圖

(1)安全監督數據庫數據來自于三大管理部及各巡檢督查組,利用機器語言的讀寫查模塊對各文件的同類內容進行合并,并自然導出為標準的excel表格。

(2)對數據錄入、輸入的常見問題進行匯總建庫(例如符號混用、二級單位描述缺字、隱患區域描述過細、違章人員崗位套用等)。

(3)結合上述常見問題庫,嵌套使用excel自帶的文本處理函數對原始數據文本內容進行替換、修正,實現描述的標準化處理。

3.2 文本數據集成

在最終大數據分析報告的成果展示部分,現場作業點、監督派駐、隱患違章及事故事件等綜合信息需要匯總分析,因此需要將分布在不同位置的數據源合并存放,按時間先后統一管理。

3.3 文本數據規約

安全監督大數據原始文件多為文本格式,相比數字化數據,在進行復雜的數據分析和挖掘時空間和時間的占用和耗費更為明顯。對文本數據進行規約處理后,將能在保證數據功能性和完整性的基礎上,降低無效、錯誤數據對分析過程和結果的影響。

文本數據的規約中常使用屬性規約,即是對內容冗雜又對部分分析影響較小的列進行不相關刪除或數字化替代,融合屬性類似或存在邏輯或包含關系的列(例如二級單位與所屬公司)創建新屬性維度,進而減少總體維數。一方面可以減少文件占用的存儲空間進而減輕分析難度,另一方面亦可在后續子集合并和分布概率的計算上提升分析的準確率和適用范圍。

4 安全監督大數據分析方法

安全監督大數據的類型大致包括隱患、違章、事故事件信息及其他運行管理資料四部分。

4.1 隱患各維度子集相關性求解方法的研究

4.1.1 詞頻統計

只要當累計周期足夠長、數據量足夠大時,各維度子集即可全面完整地展示出現場問題的客觀規律。

若以隱患為例對所有隱患信息的維度進行相關性分析,首先就需要了解鉆井專業隱患在形成中的影響因子及其因果關系。隱患的產生通常受時間(周期性的使用維保或季節性氣候等)、工況(搬安、鉆進等)、所處位置(鉆臺、泵房、循環罐等)等誘因的影響,而隱患在檢查發現后則需要根據其具體情況對其分類分級。因此,時間、工況、位置等因素與隱患描述,隱患描述與類別、級別都存在一定的相關性,若要量化它們(各信息維度下各子集)之間的相互關系,首先便需要采取高效便捷的方法求出固定維度單一變量的情況下其他維度子集詞匯的真實頻次。對于標準化后的數據,excel表格即可清晰地展示每個信息維度下的所有子集。

4.1.2 相關性計算

為方便兩兩維度之間各子集相關性的量化,可使用對各維度子集進行數字化表征的方法進一步規約簡化。基于兩兩維度之間各子集的出現頻率(詞頻)以及在原始數據中的對應關系,并使用excel的“correl”函數、數據分析或通過python調用pandas進行批量處理得到多組成對維度之間子集的相關系數矩陣。相關矩陣及矩陣系列圖的建立對運行安全的管理都具有較強的預見性、指導性和針對性,例如臨近某個季節或特殊時段哪部分區域更容易產生哪些隱患,哪幾個崗位更容易出現何種違章,哪幾種工況更易發生人身傷害都將一目了然,現場巡查的重點、安全提示的要點和專項檢查的切入點在思路上都將發生新的轉變。

4.2 精增事故數據分析維度,規范子集描述

耗時長且處理復雜的事故事件后續信息難以準確跟蹤閉環,對每一條原始信息依次標記時間邏輯,并使用次序標簽,以保證閉環管理時能對同一事故事件準確定位。

實際生產運行的管理要精細于國家標準和上級公司要求,因此僅以以上標準要求僅能作為一級分類標簽。而現場事故事件復雜多樣,二級標簽乃至三級標簽是否全面精簡在高效管理和數據輸出時尤為關鍵。梳理歷史事故數據時發現,相比細致的事故描述,事故事件在致因和結果上有更多的共通之處,便于歸納合并,在梳理管理時也更有邏輯。為進一步提升分析的精細程度,在初步分析的基礎上尋找更多的可能性,在事故事件統計表中增加了事故致因和結果兩個維度。

5 分析模板現場應用成效

通過對現場數據的標準化處理,在現場安全領域需求范疇內分析維度的增加后,作業現場問題背后的產生邏輯和管理原因能夠更為明顯地暴露,更為準確地聚類,也更為直觀地展示。以上分析結果便能對現場管理室在監督履職管理側重、專項排查主題選擇、事故事件統計上提供新的思路,節省人力,同時也能對現場監督的隱患違章查找、安全提示、現場風險把控有所助益。自分析模板投入使用后,現場違章處罰及專項檢查效果上有了明顯的提升,如圖2所示。

圖2 分析模板投入使用后生產數據變化趨勢柱狀圖

參考分析模板而制定的月度專項檢查計劃更具有針對性,在查患糾違上能更好地反映出作業現場該時段存在的真實問題。

6 下步研究方向

6.1 對各數據庫配合進行關聯性分析的思考

安全監督運行數據內容龐大,類型多樣,各維度之間都存在深刻的并行、遞進和因果關系,但現行的各數據資料管理庫都相互獨立存在,例如派駐信息、隱患數據、違章數據、事故事件統計、監督能力評估報告等。人員的違章行為既可能給事物狀態埋下安全隱患,又可能直接導致事故事件的發生。無論是從特定的周期(季節、特定時段)、固定的人員(崗位、工齡或確切的某個人)還是確定的場所(石油片區或井場區域)某處隱患、某個違章和某起事故都存在較為突出的產生概率,因此運行的現狀分析和管理的后期預測都不能忽視各個數據庫之間的密切關聯而獨立分析,各庫的持續優化和規約關聯也可作為安全管理和預警的下步計劃。

6.2 對數據錄入規范化的思考

在企業傳統的安全管理中,數據的采集一般采用手動輸入,人工匯總的方式,對于規模較大、人數眾多的安全監督隊伍而言,這種方式不僅效率不高,而且容易因周期順延、人為錯誤和描述多樣導致數據在及時性、真實性和準確性上無法得到保證。數據采集作為前端管理的重要環節,如何利用信息化手段為監督開展和管理減負、提質、增效也會是后續安全監督大數據分析和板塊里重點研究和推廣的方向。建立嚴格對標、內容全面的隱患違章五級目錄,利用直接選擇的信息采集方式替代當前的手動輸入,派駐打卡、培訓簽到、測試結果等運行資料采用請求使用的方式一步入庫都能在規范數據內容、優化數據結構上有所助力。

6.3 對建立安全監督數據系統的思路

為更為及時準確地獲取現場監督的派駐動態、更為全面詳盡地了解現場監督履職信息,并在實時獲取、顯示現場真實情況的同時減少信息上報、收集、統計過程中人力的浪費,為管理下放和人員減負提供新的可能,安全監督站將著手建立集信息填報、動態顯示、實時分析為一體的安全監督數據管理系統。

猜你喜歡
監督文本分析
隱蔽失效適航要求符合性驗證分析
突出“四個注重” 預算監督顯實效
人大建設(2020年4期)2020-09-21 03:39:12
在808DA上文本顯示的改善
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
監督見成效 舊貌換新顏
人大建設(2017年2期)2017-07-21 10:59:25
夯實監督之基
人大建設(2017年9期)2017-02-03 02:53:31
電力系統及其自動化發展趨勢分析
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
監督宜“補”不宜“比”
浙江人大(2014年4期)2014-03-20 16:20:16
主站蜘蛛池模板: 国产高清自拍视频| 99久久精品免费观看国产| 99视频在线看| 亚洲成a∧人片在线观看无码| 亚洲综合色婷婷中文字幕| 免费看美女毛片| 天天爽免费视频| 黄片在线永久| 免费AV在线播放观看18禁强制| 亚洲天堂精品在线观看| 成人免费黄色小视频| 自拍偷拍一区| 亚洲人在线| 亚洲人成网站在线播放2019| 欧美精品v欧洲精品| 91精品福利自产拍在线观看| 国产精品55夜色66夜色| 国产精品视频观看裸模| 成年片色大黄全免费网站久久 | 亚洲视屏在线观看| 26uuu国产精品视频| 无码电影在线观看| 天堂av综合网| 午夜性刺激在线观看免费| 国产亚洲高清在线精品99| av在线手机播放| 日本91视频| 91精品国产自产在线老师啪l| 免费又爽又刺激高潮网址| 免费不卡视频| 人妻无码一区二区视频| 伦精品一区二区三区视频| 亚洲一区二区成人| 日本手机在线视频| 久久久国产精品无码专区| 青青操视频免费观看| 欧美无专区| 国产午夜看片| 国产无人区一区二区三区| 国产av无码日韩av无码网站| 午夜啪啪网| 欧美性爱精品一区二区三区| 国产菊爆视频在线观看| 四虎永久在线精品影院| AV不卡在线永久免费观看| 91视频99| 欧美成人第一页| 性欧美久久| 在线色综合| 热久久综合这里只有精品电影| 9cao视频精品| 黄色网站在线观看无码| 2021国产乱人伦在线播放| 亚洲婷婷六月| 毛片免费网址| 久996视频精品免费观看| 亚洲无码37.| 天天躁夜夜躁狠狠躁图片| 91视频免费观看网站| 青青草原国产一区二区| 国产第八页| 毛片在线看网站| 午夜无码一区二区三区| 91欧美亚洲国产五月天| 国产精品极品美女自在线网站| 网友自拍视频精品区| a网站在线观看| 亚洲精品桃花岛av在线| 激情影院内射美女| 欧美综合区自拍亚洲综合天堂| 99热亚洲精品6码| 亚洲国模精品一区| 欧美国产成人在线| 九色在线观看视频| 国产靠逼视频| 国产激爽大片高清在线观看| 国产精品9| 日本免费一区视频| 久久美女精品国产精品亚洲| 国产亚洲欧美在线人成aaaa| 综合久久五月天| 99这里精品|