賴正均
開展全國污染源普查,環保基礎數據采集面廣、量大、時間跨度長,將會產生海量的環保大數據。這些數據不但反映了污染源的過去與現在,還為污染治理打下了良好的基礎。因此,必須要站在未來的高度,用活用好普查大數據。要有針對性地設計大數據普查方案,實施普查大數據技術,分析普查結果,以增強全國污染源普查工作的前瞻性、主動性。
如何用大數據理念引領污染源普查?筆者認為,應做好以下幾方面工作。
一是采集數據要準更要全。由于抽樣分析技術的限制,10年前的隨機抽樣樣本有限,收集信息有限,這也意味著細微的錯誤會被放大,甚至有可能影響整個結果的準確性,因而相應的分析結果也非常有限。現在,大數據分析技術為數據采集分析提供了另一種完全不同的思維理念,即強調數據的“大”和“全”。在大量數據運算的前提下,通常用概率說話,甚至完全可以忽略部分數據的不準確、混亂性問題。通過大量相關或看似不相關的數據交互分析,得出以往想都不敢想的分析結果。
在污染源普查中,對于普查數據字段的采集不僅要注意普查對象的基本信息、污染物種類和來源、污染物產生和排放情況、污染治理設施建設和運行情況等重點信息采集的準確性,更要注重采集污染源相關或周邊信息的全面性,比如排污者經營狀況的變化、行業的發展歷程、周邊區域和流域的環境變化等。注重數據采集的全面,才能為大數據高效分析夯實基礎。
二是數據分析要重“相關關系”。傳統的統計分析方法,往往只得出一個大概的統計數據,這往往會導致同一結果眾說紛紜,不能很好地解釋產生最后的結果到底與什么相關。
“相關關系”是量化兩個數值之間的數理關系。相關關系強是指一個數值變化時,另一個數據值很有可能也會隨之規律性變化。在大數據背景下,通過大量的數據“相關關系”交互分析,讓我們不但知道結果是什么,而且不必讓我們再去說為什么,因為一切已經讓數據自己發聲。用數據說話更能客觀地分析污染防治與哪些因素相關,可以讓我們比以前更容易、更快捷、更清晰地分析污染源現狀的成因、與經濟社會發展密切關系,對未來的環保指導也意義深遠。
三是分析結果要注重全方位運用。污染防治是涉及社會經濟發展、人民生產生活方方面面的綜合治理工程,因此污染源的發展與變遷,也與社會生產生活歷程息息相關。作為污染源普查的結果,環保基礎數據是一座“金礦”。利用好這座“金礦”,我們就可以站在社會發展變遷的高度,集成經濟、人口等全國普查結果,運用大數據交互分析的超強運算能力,進行污染源變化及污染物排放與人口、經濟發展的相關性分析,全面分析污染防治的相關因素,確保未來污染防治有的放矢、精準出擊,全面打贏污染防治攻堅戰,也為相關環保法律法規、政策出臺提供強大的決策分析支持。(作者系深圳市人居環境委員會監察支隊信訪科干部)