馬策軍 孫一男 鄧曉果
(中國鄭州450003 中國地震局地球物理勘探中心)
大數據(big data,mega data)或稱海量數據,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產(維克托· 邁爾· 舍恩伯格,2013)。進入“大數據”時代,數據成為服務國家、服務社會的基礎,是國家決策的戰略資源。大數據和數據共享已成為時代的洪流。
地震科學數據是防震減災工作的重要信息源,也是重要的戰略資源(馬斌等,2014)。隨著信息時代的來臨,全球地震數據量飛速增長,地震科學數據網站和平臺應運而生,如美國地質調查局下的國家地震信息中心(NEIC)、美國地震學研究聯合會(IRIS)、國際地震中心(ISC)等機構或組織,為全球提供全面、快速的地震數據服務,促進了地震學領域科學數據的開放共享。其中,NEIC 為全球提供完整的地震數據信息,數據源主要來自美國國家地震臺網和全球地震臺網,產出用于地震應急服務的地震報警數據、地震目錄、地震報告、地震活動圖像以及地震波形數據等數據信息。IRIS 是國際主要地震數據共享中心之一,其管理的全球地震網絡(GSN)是世界上先進的數字化地震臺網。ISC 主要收集和計算包括震源位置、數據振幅、震源機制解等在內的數據及參數,通過與其他地震數據中心和地震機構合作,為科研人員提供數據服務。其他如歐洲—地中海地震中心(EMSC)、瑞士地震服務中心(SED)、日本氣象廳(JMA)、UNAVCO 等機構或組織,主要負責本國及周邊地區的地震監測和數據收集,同時提供數據共享服務。
隨著科學技術的不斷發展,數據庫建設技術越來越成熟,對數據的保護和管理也日益完善,可以提供更加方便、快捷、穩定的支持(馬斌等,2014)。國外各個單位和科研機構也在積極建立數據庫來完善地震資料,如:美國PEER 提供的NGA-West2 數據庫及USGS 和COSMOS 的CESMD 數據庫,日本的K-NET 和KIK-NET,意大利的ITACA,土耳其的TR-NSMN,新西蘭GNSD 的GeoNnet 數據庫。自20 世紀90 年代起,隨著計算機技術的發展和存儲設備等硬件的更新換代,深地測深數據庫建設不斷與時俱進,現以地震科學數據共享平臺為依托,收錄中國地震局地球物理勘探中心成立至2016 年的人工地震剖面資料(2017 年及以后的數據正在整理中,完成后會予以收錄),為地球深部構造研究工作提供有效的基礎數據,為防震減災應急救援工作提供有力的數據支持。數據服務系統網址:http:// http://www.gecseis.org/。
本文從深地測深數據庫功能定位和需求分析,對數據庫架構進行了剖析,并依據數據服務對象的需求,對入庫基礎信息進行了分析、整理,并介紹了該數據庫的功能和應用前景。
中國地震局地球物理勘探中心(下文簡稱物探中心)擁有配套齊全的深、淺地球物理探測儀器設備和數據處理軟、硬件系統。物探中心自主研發了具有國際先進水平的輕便數字地震儀,建立了人工地震測深數據庫,開發了地震數據一維、二維、三維的構造成像和層析成像的綜合數據處理解釋系統。幾十年來,承擔并完成了一批國家重大科研項目,如:聯合國開發計劃署與中國合作的京、津、唐地震預報實驗場項目,國際地學大斷面中的中國地學大斷面項目,國家高技術項目(863 計劃),國家重點基礎研究發展規劃項目(973 計劃),國家科技攻關項目,國家自然科學基金項目以及中國地震局重點科研項目,取得一批具有國際水平且國內領先的科學研究成果,獲得多項國家科技進步獎、中國地震局科技進步獎,并在國際及國內核心期刊上發表千余篇高水平科研論文(林吉焱等,2017)。
對于人工地震測深,物探中心從未間斷研究。自1956 年以來,物探中心布設人工地震測線150 多條,爆破1 200 多次,爆炸當量過千噸,測點達60 000 多個,完成的深地震測深寬角反射/折射剖面近5 萬千米(圖1)。
一個項目從設計開發,到現場施工,再到完成,所產生的項目設計書、項目施工信息、剖面信息、炮場信息、炮點信息、一維計算結果、二維計算結果以及結題報告、論文等多項數據,為該數據庫系統集成提供了有利條件,多年來深地測深數據庫不斷收錄物探中心產出的人工地震數據,累計數據量上TB,見表1。
本數據庫數據資料來源于中國地震局地球物理勘探中心檔案管理部門較早的深地震測深剖面結題報告和已公開發表的文獻,涵蓋全國各地區131 條深地震測深剖面(圖1)的人工地震資料,詳見表1,其中包含剖面的名稱、觀測系統、實施時間、經緯度、炮點、二維速度等值線圖等多種信息。

圖1 深地測深數據庫所含全國剖面示意圖Fig.1 Schematic map of the national seismic profiles contained in the deep sounding database

表1 數據庫收錄的人工地震測深剖面數據目錄Table 1 Catalogue of artificial seismic sounding profile data included in the database

續表1
深地震測深剖面信息為詳細研究各地區地殼結構、揭示發震構造等提供了基礎資料。但是,隨著時間的推移,這些珍貴資料大多零散地保存在項目結題報告和已經發表的文獻中。其他學科學者參考資料時往往需要花費大量精力搜尋這些剖面的相關信息,許多結果需要經過整理才能使用。年代久遠的剖面僅保存清晰度不高的二維速度等值線圖,大部分剖面僅給出樁號、深度對應的介質速度信息,而缺少經緯度信息。這給深地震測深成果的應用帶來巨大阻力。本數據庫對以往紙質數據、軟盤數據、磁盤數據、光盤數據進行了系統性整理和數字化處理,提高了數據使用的便捷性,對深入研究各地區地殼結構、地震發震構造等科學問題具有較大的實用價值。
人工地震剖面數據庫系統中常見數據資料類型如下:①文檔數據:項目編號、項目所在地區、剖面組成、起止時間、設計及實施單位等文檔信息;②采集數據:野外設計報告、施工報告、地震原始數據等;③處理數據:處理設計流程報告、處理總結報告、處理過程中的各種數據體等;④解釋數據:結題報告、歷年來的地震、地質研究成果,如地震解釋、地質研究的各種平面圖、地震數據體、剖面及地質模型等,與項目相關的各種文檔、匯報材料、論文等。
從數據的匯交、收集到整理、入庫,再到共享,實現的流程化、標準化,均遵循專人對接、數據準確且多人核對、數據操作前備份以及原始保留的原則,做到從初始數據即保證其準確性、可靠性。
在數據庫將全部數據匯總之后,為了數據體要素所賦屬性內容、結構、編碼等的完整性和正確性,項目組根據“數據庫開發細則”,進行數據內容的全面檢查與修改。檢查數據是否在規定范圍之內,各條目屬性是否正確,拓撲關系是否正確,并在數據入庫后檢查按圖幅顯示是否完整。針對每幅圖生成圖例,按圖例、圖層檢查屬性及面元顏色、填充圖案是否正確。針對文檔數據,檢查文檔日期、標號是否正確等。在建庫過程中,經過多層次、多環節的質量檢查與監督,確保數據庫數據準確無誤。
人工地震剖面數據庫具有廣泛的應用前景,可提供各地區深地資料及精細速度結構模型,還可廣泛用于地質礦產調查、管理、規劃與經濟建設工作(聶高眾等,2002)。項目起點高,設計思想先進,應用了先進的信息技術,內容豐富、查詢檢索方便、用途廣泛、可操作性強,并建立了相應的元數據庫,便于庫的管理與信息共享。深地震測深數據庫的建設,為深地震測深成果的轉化提供了條件,為地球科學相關領域提供了精細的地殼模型參考,也提高了該項數據資料服務社會的水平。該數據庫為深入研究各地區地震的發震原因、發震構造、大地動力學等科學問題,提供了基礎的數據資料。
目前,地震研究工作面臨著各種各樣的技術難題,迫切需要進行多學科、多專業的緊密合作,綜合應用多學科方法來解決技術難題已成為一種必然趨勢。而專業型數據庫在多學科綜合應用等方面有獨到優勢,因此,專業型數據庫的建立和應用具有重要的現實意義。專業型數據庫系統,是一個涵蓋人工地震剖面從設計到完成全過程的數據管理的綜合系統,它涉及到早期的人工地震施工設計、數據采集、資料處理、解釋,以及后期數據開發等多個方面,其綜合了人工地震各個領域多種數據類型的管理,由此導致系統自身龐大而復雜。任何一個系統從設計、開發、測試、實際應用,再到全面推廣都需要一段時間,而這段時間的長短,是由該系統的開發與應用的成熟度來決定的。普通用戶從對系統一無所知,到熟練應用也需要一個時間過程。每個數據庫或數據模型,都有其自身生命周期和適應環境,在數據模型建設之前,充分調研國內外已有數據庫綜合應用情況,使數據模型與企業的科研生產需求相一致,使其具有實用性、先進性、前瞻性,并盡可能保證其具有較長的生命周期。
深地震測深成果庫的建設是對深地震測深資料的深度整理,再次發掘,充分發揮了已有數據資料的價值,數字化的數據資料不僅更利于數據的管理與存儲,也更利于服務防震減災事業,并為地質、地球物理、地球化學等領域的學者提供詳細精準的數據和資料,實現了深地震測深成果的轉化,使科技成果更好地轉化為生產力,也提高了地震測深數據服務社會的水平。
在論文撰寫過程中,鄧曉華給予指導和幫助,中國地震局地球物理勘探中心提供數據支持,中國地震局臺網中心數據共享組給予支持,在此表示感謝。