閆燕 張洪濤 李偉波 丁建群 劉書艷
(中國石油集團東方地球物理公司 河北省涿州市 072751)
近年來,隨著超高效地震勘探混疊采集技術的發展,野外采集的日產量從原來的一萬多炮增加到現在的三萬多炮,單日及總體采集數據量成倍增加,其對地震數據的存儲及質控等提出了更高的要求和挑戰。采集地震數據在海量數據條件下面臨的主要問題:
(1)傳統的磁帶存儲數據的方式,使得數據的查找費時費力。
(2)對海量數據進行質控,單純依靠儀器或者操作員自己編寫的一些針對某個功能的小程序等不能及時進行系統高效的統計并查找問題。
(3)對海量數據的分析,不具有針對性和全面性,沒有全面深入進行數據挖掘的軟件。
基于網絡的B/S 架構的軟件開發技術已經在各個行業得到迅速推廣應用,東方公司的生產指揮系統做了對生產過程的實時監控,得到很好的應用效果,但對于小隊內部的質控和生產數據分析等方面的內容沒有涉及。
本文主要針對野外返回的生產數據管理、質控及數據分析方面,結合小隊的生產實際,有針對性的進行了相關研究,總結出了一套適用于混采的室內質控流程并結合信息化手段,實現了海量數據的智能化管理,減少了人工處理帶來的風險。本系統在實際生產數據的管理、分析的應用,初步取得了較好的效果。
如圖1 所示,本系統由數據層、業務層和應用層三部分組成。
數據層:數據庫的訪問即對非原始數據的操作,為業務層和應用層提供數據服務。資源訪問控制實現對具體原始數據的分類管理與調用。
業務層:包括系統的主要功能模塊,實現系統的統計、計算、分析等邏輯處理。
應用層:通過Web 界面,跟用戶進行交互,實現質量分析與監控的可視化。通過Web API 接口,可接外部應用程序,實現數據的傳輸與相關應用。
性能監控、日志:對系統運行情況進行整體監視,并進行匯總,實時生成結果報表,供系統管理人員進行參考、分析。
本系統采用了Pivotal 團隊的Spring Boot。該框架使用了特定的方式來進行配置,從而使開發人員不再需要定義樣板化的配置,能夠大幅度提高Spring 應用的開發效率。
持久化層采用了一個半自動化的持久層框架MyBatis,它通過直接將SQL 語句寫在映射配置文件中來操作數據并支持動態SQL,更加靈活可控,簡單易用,SQL 調優也更加容易。
關系型數據庫管理系統MySQL 所使用的SQL 語言是用于訪問數據庫的常用標準化語言,體積小、速度快,開源成本低,雖然與其他大型數據庫如Oracle、SQL Server 等相比,有其不足之處,但考慮到目前的業務需求已經能得到滿足,因此本系統采用了MySQL 作為本地數據庫。

圖1:系統架構

圖2:系統功能圖

圖3:數據表
針對數據存儲的問題,本文設計了數據自動讀取功能和數據整理上交功能,針對海量數據存取速度和安全性的考慮,本系統采用了redis 集群部署的分布式數據庫系統實現;針對海量數據質控高效、全面的問題,本系統將數據智能分析功能、數據動態管理和節點工作狀態功能,整合到一個系統,將需要進行監控的參數以及對比結果進行了統計并輸出。如圖2 所示。
本系統設計了以下幾個功能模塊:
2.3.1 數據自動讀取

圖4:節點電量展示
數據自動讀取功能包含:
數據上傳:通過網絡將生產數據文件傳輸到盤陣指定目錄;
數據入庫:系統按數據類型分別自動讀取指定目錄采集數據文件,對異常文件進行識別與過濾,實時顯示數據上傳進度,剔除重復數據信息,建立生產管理數據庫;
數據查看:查看存儲目錄下的數據文件,提供界面讓用戶存儲目錄中根據文件內部時間查找對應的存儲文件夾;
信息提?。河脩艨梢宰远x選擇提取顯示和導出數據庫中的信息。
2.3.2 數據動態管理
數據動態管理的功能包括:
文件檢查:
(1)匹配力文件和擴展QC 文件的數量,做出丟失統計并圖形化展示;
(2)匹配力文件和VP Report 文件,做出丟失統計并圖形化展示;
(3)檢查力信號文件和擴展QC 文件的返回率,以及最大連續丟失的個數。
震源狀態監控包括:震源屬性分析(平均相位、峰值相位、平均畸變、峰值畸變、平均出力、峰值出力)、剛性和粘度、震源狀態碼、過載、警告信息、HDOP、其它信息檢查、力信號檢查。
采集進度監控:監控炮點的施工順序和施工位置,動態回放震源施工路線;線束完整性檢查:應用配置文件,將當天的炮點按照線束號進行劃分,統計產量與重復的炮點,計算出實際產量。
炮點偏移距質控:統計分析炮點的偏移情況。
TD 規則檢查:統計不符合設置中設定的TD 規則的炮點。
空點檢查:檢查所有線束中的炮點是否放完。
2.3.3 節點工作狀態
展示節點最近的一次狀態信息,根據不同的狀態,使用不同的顏色在圖上給出不同的標識,狀態有:傾斜度、噪音、阻值、GPS狀態、電量、剩余存儲空間、24 小時未返回、節點收放圖、節點收放列表。
2.3.4 數據智能分析
數據智能分析包括:風速和溫度統計、停炮時間統計、震源工作效率統計、施工地形統計、廢文件統計、震源施工臺數統計、震源搬點時間統計、Pad Down 時間統計、Wait to shoot 時間統計等功能。智能分析功能主要是將儀器返回的數據和班報數據等經過一系列的統計分析,用圖表或表格的形式更清晰明了的展示出來,利于發現施工中存在的問題以及時調整施工。
2.3.5 數據整理上交
讀取數據庫內部的信息,系統根據甲方給定的格式自動整理出SPS 文件。
歸檔上交資料:將GF、ExtendQC、Windlog、SPS 等文件提交保存。
根據功能模塊設計對應需求的數據表,設計了如圖3 的數據庫表。
為了驗證本系統的有效性,本文采用了阿曼的地震施工數據作為測試數據,包括groundforce、vpreport、fleetreport、windLog、timeLog、地形文件、節點野外狀態、spsConfig、RlineCofig、日報等數據文件。
通過散點圖,很清楚的能看到具體某臺震源的異常值的范圍。
圖4 展示了節點的電量情況,綠色為電量充足,藍色為電量為50%-79%;黃色電量為20%-49%;紅色為電量小于20%報警。
通過折線圖的形式將2020-04-24 00:00:00 到2020-04-24 23:59:59 時間段的風速和溫度展示出來,能夠直觀的判斷風速和溫度的值是否異常。
以柱狀圖的形式展示了2020-04-24 每小時每臺震源的總炮數,同時可以選擇要查看的震源。
以柱狀圖的形式展示了2020-04-24 每臺震源每種地形的施工總炮數,可以選擇要查看的震源,同時以表格的形式統計出了每種地形的總炮數。
實際數據的測試顯示,文中根據混采的室內質控流程實現的生產數據管理系統,能夠滿足野外生產對數據管理的需要,方便了數據管理,提高了質控的精度和效率,減少了人為的干預和主觀因素的影響,非常適合海量數據下的生產數據管理。該系統充分利用了物探生產與信息化手段的緊密結合,為大規模的應用到生產數據管理中提供了可能性。目前該系統的功能尚不完善,需要結合野外生產需要,進一步完善并開發新的應用,另外正在轉型采用微服務的形式來繼續后續的開發工作。