◎ 廖江南,林崇獻
2013—2020 年,廣西完成了 99 個縣(市、區)的土地質量地球化學評價工作,完成的調查面積、評價介質、分析測試數據居全國首位。廣西從土壤、巖石、水、大氣、植物、肥料等方面進行了立體調查和系統評價,并取得了豐碩的成果。這些調查評價成果可為國土空間規劃、生態環境評價、土地質量等級評定、基本農田保護、土地整治、生態修復、富硒特色農業開發等工作提供基礎數據支撐,具有重要的經濟價值和社會意義。
為了充分利用這些調查評價成果,順利實現調查評價成果的轉化應用,自2019 年開始,廣西開展了土地質量地球化學調查評價成果應用系統建設,工作內容包括數據庫建設和信息系統開發。研究小組對數據庫標準的研究情況和編制經驗進行介紹,對于完善該項工作進行初探。
廣西所完成的99 個縣(市、區)的1 ∶5 萬土地質量地球化學調查評價成果是數據庫建設的數據源。各縣(市、區)的調查評價成果資料數據包括成果報告、成果附圖、調查記錄卡、分析結果報告、野外照片、航跡數據、質量監控記錄文檔等內容。經統計,調查評價成果資料數據量達6.8 TB。
調查評價成果數據具有多源、異構、海量等特性,按數據異構性特點,數據類型可劃分為不包括幾何特征的結構化屬性數據、基于要素幾何特征的空間數據和非結構化數據3 種。
數據庫建設必須依據一定的標準來開展工作。對于土地質量地球化學數據庫建設,目前國內最新、可用的數據庫建設標準為中國地質調查局發展研究中心編制的《土地質量地球化學調查評價數據庫標準(申報稿,DD2018-XX)》(以下簡稱申報版《數據庫標準》)。在數據庫建設前期,數據庫工作組收集與整理了橫州市、賓陽縣以及巴馬瑤族自治縣3 個市(縣)的調查評價成果資料數據,按照申報版《數據庫標準》進行數據標準化工作,但在此過程中發現,該標準未能完全適用,主要存在以下問題。
申報版《數據庫標準》中指出,數據庫提交內容包括評價數據、原始圖、成果圖、元數據庫、報告及質量監控文檔、其他等,但部分內容沒有具體化,如沒有詳述評價數據、其他項包括哪些具體內容,這給建庫工作帶來不確定性,不利于數據庫建設的實際操作。
1.采樣介質類別劃分不夠詳細,造成部分介質數據無法入庫
廣西土地質量地球化學評價區的采樣介質涉及土壤、湖積物、土壤垂向剖面、灌溉水、飲用水、大氣干(濕)沉降物、農作物、根系土、肥料、巖石、巖石表層土壤、成土母質等12 類。但在申報版《數據庫標準》中沒有列出湖積物、飲用水、巖石、巖石表層土壤、成土母質等采樣介質的內容,僅以其他介質代替,這導致湖積物等采樣介質的數據難以錄入數據庫并提供服務。
2.采樣分析屬性表規定的數據項內容不全面
廣西土地質量地球化學評價工作有一套規范的野外采樣記錄卡,各類介質的野外采樣記錄卡均規定了野外采樣記錄的信息項目。經與申報版《數據庫標準》對比發現,廣西野外采樣記錄卡記錄的一些內容無法在申報版《數據庫標準》的對應采樣信息表中反映,如表層土壤采樣信息表,在廣西野外采樣記錄卡中有反映重復樣的標識字段,并且有原始樣GPS 點號、作物種類、照片數量、樣點數、詳細描述、標記位置、記錄人等數據項內容,但在申報版《數據庫標準》的采樣信息表中卻缺少這些數據項內容。
廣西土地質量地球化學評價工作在采樣介質的分析項目方面也作了規定。經對比分析發現,申報版《數據庫標準》的分析數據表未能涵蓋廣西實際的樣品分析項目,如農作物元素分析數據表中缺少Ge、Zn、無機As 等元素的分析項目數據。
在申報版《數據庫標準》中,土壤、灌溉水、大氣干(濕)沉降物的評價結果要素類劃分較多,如土壤養分單指標地球化學等級評價要素類按養分元素劃分為多個要素類,土壤環境單指標地球化學等級評價要素類按環境指標元素劃分為多個要素類,此外,還有土壤養分地球化學綜合等級評價、土壤環境地球化學綜合等級評價、土壤質量地球化學綜合等級評價等要素類的劃分。在實際等級評價成果圖的制作中,這些要素類均源自同一個土壤評價結果要素類,在該要素類屬性中掛接有多個營養元素和多個環境元素的含量值、單指標等級值,以及養分綜合等級值、環境綜合等級值、土壤質量綜合等級值。因此,申報版《數據庫標準》的評價結果要素類存在數據冗余的問題,這給數據庫建設與系統應用增加了難度。
在申報版《數據庫標準》中,工作區的數據集以“工作區名稱首字母縮寫”來反映其所屬的工作區,該方式不能很好地表達數據集所屬的工作區。廣西以縣級行政區為單位開展調查評價工作,若以“縣(區)的行政區劃代碼+縣(區)名稱首字母”進行表達,能更好地識別、區分工作區數據集。此外,申報版《數據庫標準》中野外照片的命名方式不符合實際操作,缺少航跡數據的命名規則,應補充完整。
在調查評價工作中,存在一個調查點采集多個、多類樣品,以及一個樣品分析獲得多類數據(如部分土壤樣品進行了元素全量和有效態兩類分析)的情況,因此,需要建立和詳細描述采樣信息表與分析數據表之間的對應關系,否則將出現采樣信息與分析數據之間的錯位對應或無對應。而申報版《數據庫標準》中缺少這方面邏輯關系的詳細描述,影響了數據的質量管理與正確應用。
可參考利用的土地質量地球化學相關標準主要有:《土地質量地球化學調查評價數據庫標準(申報稿,DD 2018-XX)》《多目標區域地球化學數據庫標準(DD 2010-04)》《土地質量地球化學評價規范(DZ/T 0295-2016)》等。
編制廣西土地質量地球化學評價成果數據庫建設標準時,建議充分利用申報版《數據庫標準》的工作成果,再參考《多目標區域地球化學數據庫標準(DD 2010-04)》等相關標準規范,并按照《地質數據庫建設規范的結構與編寫(DZ/T 0274-2015)》的要求進行編制。
廣西土地質量地球化學評價工作以縣級行政區為單位開展調查評價工作,建議將廣西土地質量地球化學評價成果數據庫分為2 級,一級為全區級數據庫,二級為縣(區)級數據庫,全區級數據庫由99 個縣(區)級數據庫集合而成。
根據評價成果服務與應用需求,入庫數據應涵蓋調查分析與評價成果,建議每個縣(區)級數據庫的組成內容應包含成果報告及相關文檔、成果圖、基礎評價數據、評價結果數據、元數據、其他、建庫說明七大項內容,并詳細描述各項所包含的具體內容。
(1)根據廣西調查介質情況,設置每類介質的采樣信息表、送樣信息表和分析數據表,保證各類介質數據完整入庫,并根據項目質量管理需要,增加采樣棄點信息表,以說明棄采的原因。
(2)根據廣西野外采樣記錄卡的數據項設計情況和樣品的實際分析項目情況,設置各類介質采樣信息表和分析數據表的數據項,以滿足全面、完整地反映實際調查分析工作中所獲取的信息和數據。
(1)根據實際需要,建立工作區、土地質量地球化學評價圖斑、土地利用現狀等符合廣西需求的基礎要素類。
(2)根據實際工作中的土地質量地球化學評價模型(見圖1)及分類統計需求,確定土地質量地球化學等級評價結果要素類及其屬性數據項內容。建議將等級評價結果要素類劃分為土壤質量地球化學等級評價要素類、土壤質量地球化學元素有效態等級評價要素類、灌溉水環境地球化學等級評價要素類、大氣干(濕)沉降物環境地球化學等級評價要素類和土地質量地球化學等級評價要素類5 類。

圖1 土地質量地球化學評價模型圖
(3)對于土壤單元素含量地球化學分布要素類,除設置常規分析元素含量地球化學分布要素類外,應根據實際工作成果圖的情況,增加土壤元素有效態含量地球化學分布要素類,實事求是地反映部分縣(區)的元素有效態調查評價成果。
1.充分利用申報版《數據庫標準》的數據命名與編碼規則
申報版《數據庫標準》的數據命名與編碼規則符合國家相關標準,設置的數據名稱直觀、簡練、突出主題,編制的數據代碼結構合理、可區分、易識別,應充分利用。如數據庫、實體類數據表、要素類的命名與編碼規則應參照申報版《數據庫標準》,數據項的代碼、數據類型、長度/小數位、約束條件、數據單位、值域范圍等應參考申報版《數據庫標準》進行設置,并根據數據項內容的實際情況進行補充完善。
2.修改工作區數據集命名規則
申報版《數據庫標準》的工作區數據集[即縣(區)級數據庫]的命名規則為:數據庫主體要素類代碼+省代碼+比例尺代碼+數據庫覆蓋范圍類型代碼+工作區名稱首字母縮寫。建議用“覆蓋范圍代碼+工作區名稱首字母縮寫”代替申報版《數據庫標準》中的“工作區名稱首字母縮寫”,覆蓋范圍代碼采用6 位縣級行政區劃代碼,以便快速識別數據集所屬的縣級行政區。
3.規范野外照片、航跡數據的命名規則
(1)野外照片存在大量重名現象,為減少工作量,在數據庫建設期間,建議不對具體照片進行重新命名,而是將照片按調查點分類存放,存放照片的文件夾名稱按采樣點號命名。將照片數據導入管理系統時,再按“樣點號+下劃線+照片原文件名”的規則對照片進行命名,實現照片數據的區分與識別。
(2)建議航跡數據GPX 文件的命名規則為:航跡首字母縮寫+介質類型代碼+覆蓋范圍代碼+采樣小組識別號+采樣日期,其中覆蓋范圍代碼用6 位縣級行政區劃代碼。使用該命名規則的GPX 文件可直觀地反映航跡數據于何年何月何日、由誰、在哪個行政區、采集何種介質樣品獲取的。
1.明確調查分析數據的邏輯關系
為了在應用系統中實現采樣信息、分析數據、野外照片以及航跡數據的一體化展示和有效利用,建議按以下要求反映調查分析數據之間的邏輯關系。
(1)所有采樣信息表的樣點號和每個分析數據表的樣品袋號(即樣品號)必須唯一。
(2)分析數據表中的樣點號、樣品袋號在對應介質的采樣信息表中必須存在。
(3)野外照片通過存放照片的文件夾名稱(以樣點號命名)與采樣信息表的樣點號建立關聯。
(4)航跡數據通過GPX 文件名稱與采樣信息表的航跡索引(該數據項填寫對應的GPX 文件名稱)建立關系。
2.建立數據質量控制文檔
實施全面數據質量管理,針對數據庫的各類數據特點,以及數據之間的邏輯對應關系,應建立適合本數據庫檢查驗收的一套數據質量監控表,除工作日志表、數據自檢表、數據互檢表、數據抽檢表外,建議新建分析數據檢查表、工作區數據庫檢查表等,加強對重要數據以及數據間邏輯關系的檢查。