鄧怡穎,樊雋軒,王 玥,史宇坤,楊 嬌,魯錚博
1. 中國科學院 南京地質古生物研究所,南京 210008;2. 中國科學技術大學,合肥 230026;3. 內生金屬礦床成礦機制研究國家重點實驗室,南京大學 地球科學與工程學院,南京 210023;4. 美國佐治亞理工學院,亞特蘭大 30332;5. 南京大學 地球科學與工程學院,南京 210023;6. 大陸動力學國家重點實驗室,西北大學 地質學系,西安 710069
古生物學是了解地球和生命歷史的基礎學科,古生物化石是地質歷史中地球表層的生物及環境信息的重要載體,也是深時數字地球(Deeptime Digital Earth,DDE)大數據建設的重要組成部分之一。進入信息時代后,如何整合海量古生物學數據,并借助高速發展的計算機技術進行數據的深度挖掘和分析,開展數據驅動下的古生物學研究逐漸成為了熱點(Miller and Foote,2003;Alroy et al.,2008;Miller et al.,2009;Darroch and Wagner,2015;Fan et al.,2020)。一些核心數據庫的建立與重要研究成果的發表,促使各國學者愈發重視古生物學數據的收集、整理、分析與共享,并依此建立了不同類型、不同功能或針對不同門類的古生物專業數據庫。
古生物學數據,廣義上包括了化石數據以及與之關聯的地層學、古生態學、古地理學等信息。從數據來源來看,則主要是以化石為核心的野外標本采集數據、實驗測試數據、解釋數據等。其數據類型豐富,獲取方式差異顯著,保存形式多樣。其中,野外標本采集數據主要包括化石標本、化石分類單元初步鑒定信息、剖面名稱、地理位置、采集層、標本號等。實驗測試數據通常以常規實驗手段,如化石拍照、標本度量、光片和薄片磨制等獲取的數據為主,近年來隨著一些新的實驗技術手段的出現,通過Micro CT、3D掃描等成像技術獲取的數據也開始快速增長。……