譚 茗
(湖南三一工業職業技術學院,長沙 410129)
環境監測主要是為了一個特定的目標,尤其是按照預先的時間值,完成環境的期望狀態所期望的與其的目的。間歇性或連續測量環境質量的有關系,觀察其變化,以確定其對環境的影響過程。環境監測能夠體現為環境監測、測量、監控等。利用大數據技術對全部檢測數據實施收集、儲存、分析,反映了其研究目標與數據的整體性。此外,它拋棄了傳統的手工和原始編程處理問題的模式,而是應用和收集各種類型的數據,例如:統計分析、模擬采樣、分析和預測。所以,數據工具對于實際的監控更加準確,能夠充分、快速、方便的提供想要的結果。
大數據是現代社會下的一個新興產業,在對數據進行分析與整理的過程中,并非對數據實行簡單的處理與總結,通常是使用高速的運算來對廣泛的數據實施整合計算,讓它獲得更加真實的結果。當前,中國大數據的發展通常幾種在相對發達的城市以及互聯網行業的幾大巨頭,比如:阿里巴巴、百度等,為了能夠幫助大數據信息的收集供應穩定的來源,和互聯網形成密切的供求關系,成了中國大數據市場的基礎性框架。當前,大數據技術還具有一定的缺陷,并且它的市場系統也具有一定的問題,但大數據的發展速度十分快速,在許多領域有著極其廣闊的運用。政府機構對于大數據技術的應用也實施了積極開展,在惠民領域得到了廣泛使用,并且支持大數據技術,從而促進大數據技術的穩定發展。但是,當前大數據技術都集中在極其發達的大城市,較為偏遠的地區并沒有得到普及,因此,想要大數據在將來進行良好的發展必須處理這些問題。
環境監測中大數據的主要來源可以分成兩個部分。首先,監控部分的數據通常來自部門自身,覆蓋了生態監測數據和污染源數據,將結構化數據作為主要內容,時間跨度約40年;其次是來自外部的一些數據,其中包含了非結構化數據在人群活動環境相關數據信息中所占比例較大,但時間跨度并不均勻。
2.2.1 數據轉換模塊
對不同類型或格式的數據轉換,因為歷史中的因素,環境監測數據通常都具有編碼不匹配的問題,因此,把不匹配的數據來源以及網絡源數據轉換成統一的格式編碼。這樣的方法有利于未來大數據工作的可持續發展。
2.2.2 數據補充模塊
數據補全模塊通常是在面臨數據中斷、保存、處理丟失以及不完善的狀況下形成的。必須結合不同的狀況、類型的數據設計來設計有關的補采規則,對于冷、暖數據來說,必須讓手機人工補充的方式來進行處理,但是僅僅真的熱數據來說,還應該使用現實的補充任務來自主實施。
2.2.3 數據清洗模塊
數據清了模塊的主要職責之一是清理沒有用處的數據以及所謂的“臟數據”,把數據中不匹配的數據實施清理,但是在此其中,“臟數據”主要包括了不規則數據與事實不一致的數據。
在進行數據分析的過程中,應該注意數據的準確性,在數據的核心中,需要對各種種類的環境數據進行選擇、分布、轉換等,讓大數據技術中的虛假信息能夠得到有效的清理,從保存最真實的數據到最終在資源共享數據平臺中存儲排序后的數據。存儲的數據應根據其生命周期實施相應的安排,并供應面向外部開發的數據查詢接口。數據庫能夠快速滿足環境監控中一切數據并實施相應的分析和處理。
參考環境監測大數據的使用平臺最為關鍵的作用是整合和挖掘大量的水質、空氣質量、污染源監測等以往未被重視的整體數據,互聯網上的信息大而分散,沒有正規有效的組織管理,總量小,但能夠有效幫助環境監測開展相應的數據資源分析,并在此其中選擇具有價值的信息內容,開展具有針對性的分析與處理,并使用這項數據來反映出要去的地方的價值,它賦予了數據信息新的含義,能夠有利于提高環境綜合評價技能的整體水平,達到了提高環境整體質量的目的。
大數據技術能夠處理各種各樣的信息,這樣有利于環境監測工作的穩定開展。目前,社會環境發生的問題不斷增加,在此其中主要包括了數據間具有的相互影響與前置聯系,大數據技術的出現能夠變成處理與分析監測數據的重要工具,這樣,對環境監測數據和信息開展穩定、科學的風險評價。整體來說,大數據技術對于環境監測具有極為重要的作用,通過環境監測工作的不斷發展,大數據技術在環境監測中能夠具有極大的發展空間。