于曉晶 左煜杰 郭玉斌
(蘇州市職業大學計算機工程學院 江蘇蘇州 215104)
隨著國民經濟、科學技術迅猛發展,數據信息呈現了爆炸式的增長。互聯網、電子商務網站、社交網絡、移動設備、傳感器每時每刻都在生成各種各樣的數據。數據無處不在,政府機構職能部門運行、企業競爭發展、科學技術創新、衣食住行等各方面都面臨著挑戰,隨著大數據時代的到來,各行各業都十分關注對繁雜無序數據的分析處理及友好展示[1]。因此,未來任何領域的普通個人均存在著大數據分析的需求。“人人都懂大數據、人人都能可視化”將是大數據領域的發展目標之一[2]。如何快速簡潔地分析處理數據、清晰直觀地展示數據,并準確獲取有用信息,洞悉其中特征、趨勢、規律,并最終正確解讀現實、預測未來,實現基于數據的科學決策和行動,是目前亟待解決的課題。
近些年來隨著改革開放的深化,工業化和城鎮化進程加快,機動車保有量以及能源消耗逐年的增加,大氣環境污染源逐年逐漸增多。蘇州市的經濟建設取得令人矚目的成就,經濟迅速發展的同時,環境污染問題也更加突出,區域性特性日漸明顯。空氣質量是關乎民生的大問題。蘇州政府部門為落實建設“強富美高”的總目標,一直貫徹新發展理念,努力把這一藍圖變成美好現實,空氣質量有明顯改善。本文基于tableau 技術,依據蘇州市2014 年到2020 年的空氣質量數據,對蘇州市的空氣環境質量狀況及變化趨勢,進行定量與定性相結合的研究分析,為改善蘇州市環境質量提供參考。
分析所用數據均來源于天氣后報網(http://www.tianqihoubao.com),用Octopus8.3.0 軟件從天氣后報網上獲取蘇州歷史空氣質量數據,以天為單位記錄數據,包括日期空氣質量等級、AQI 指數、當日AQI 排名及PM2.5、PM10、SO2、NO2、CO、O3六項污染物的濃度,共計2557 條數據。
對采集到的數據進行初步處理,首先是對所有數據規范化格式,統一設置數據類型、字段命名,添加了“頻次”字段,處理異常值。視具體情況分析,對于缺失數據處理主要采用如下方法:(1)采用前后兩日的算數平均值;(2)用鄰近城市(無錫)同日數據代替;(3)分析往年同期數據及前后幾日數據,適當選取。
《環境空氣質量標準》(GB3095-2012)[3]是2016 年1 月1 日在全國實施,把6 項污染物實測濃度值按規定方法與標準相應限值進行比較,得出各項污染物空氣質量分指數(Individual Air Quality Ind ex,簡稱IAQI),在6 項污染物中IAQI 數值最大的即為AQI。
可視化作為一種可以放大人類感知的數據、信息、知識的表示方法,日益受到重視并得到越來越廣泛的應用,大數據可視化常用的工具主要有Tableau、Datawatc 及大數據魔鏡等。處理步驟為:數據采集,處理,計算、挖掘,可視化呈現。
Tableau public 是Tableau 公司開發的一款,用于實現交互的、可視化分析的免費數據分析工具,可建立交互式、可視化圖表,用來實現交互的、可視化的分析和儀表盤分析,方便快速完成數據的整合、篩選。廣泛用于商務服務、能源、電信、金融服務、醫療保健、制造業、媒體娛樂、教育等領域。僅需簡單的拖放操作即可實現數據突出顯示,改變數據分析內容與數據呈現方式,具有較強的交互性,并能依照一定思維方式及需求將多個工作表進行組合、布局,用于呈現出數據間的復雜關系與邏輯內涵。
近些年來,蘇州市一直大力推進揮發性有機化合物(volatile organic compounds,VOCs)及重點行業污染治理,重點實施精細化揚塵管控,取得了一定的成效。蘇州市區環境空氣質量總體趨于良好,大氣空氣質量優良的天數逐年上升,藍天白云不再是難得一見。下面從空氣質量指數、6 種主要污染物入手,具體分析蘇州市空氣質量特征。
導入相關數據表,數據是核心,是撬動數據價值的杠桿[4]。Tableau public 支持Excel、Access 和多種文本文件,對單個數據文件行數限制為10 萬行,對數據的存儲空間限定在50MB 以內[7],可以處理空氣質量數據。打開工作表,將維度、度量中的數據拖放放行、列。“年度”拖放放行、列區域,“優良”“良”拖放放行區域,并設置度量為“求和”,在標記中設置圖的類型為條形統計圖。由圖1 工作表中,可以直觀看出蘇州市天氣整體趨于好轉,空氣質量“優”(AQI 指數小于50)的天數逐年上升,從2018 年開始都是高于7 年的算數平均值線;圖2 的工作表展示了2014 年到2020 年的空氣質量信息,優良(AQI 指數小于100,即符合中國的環境空氣質量標準)出現的天數及其占全年的百分比逐年上升,從2015 年開始蘇州市已經達到國家衛生城市標準。

圖1 年度AQI<50天數

圖2 年度達標天數及占全年百分比
根據需求設置約束條件實現動態過濾,Tableau public 工作表中建立交互式的可視化圖表,對數據可視分析過程中各種任務建模,通過可視化界面中的圖形元素進行交互式分析,方便快速完成數據的整合、篩選。圖3 儀表板功能整合了7 張工作表,展示了2014年到2020 年的空氣質量信息,即不同等級出現的天數統計圖及其占全年百分比,通過“質量等級”“日期”篩選可以查看、對比每一月空氣質量情況或者某一等級分布情況。可直觀看到蘇州市天氣整體趨于好轉,“重度污染”“嚴重污染”的天數急劇下降;當日AQI 排名逐年上升。

圖3 空氣質量等級可視圖
經濟快速發展和城市化進程中大量能源的消耗排放了大量對人體有害的物質,對大氣環境造成了一定程度的污染。隨著生態文明建設理念的普及,人們對環境空氣質量的意識在提高,要求也逐漸提升。中國的環境空氣質量標準2012 年進行了第三次修訂,調整了環境空氣功能區分類,居住區、商業交通居民混合區、文化區、工業區和農村地區執行二類標準,調整了部分污染物的濃度限值,增設了PM2.5 濃度限值和臭氧8 小時平均濃度限值。PM2.5 的標準,是由美國在1997 年提出的,目前為止包括美國、歐盟、日本等一些發達國家已將其納入國標并強制性限制[5]。2012 年我國新修訂發布的 《環境空氣質量標準》 首次增加了PM2.5 監測指標。
2.2.1 PM2.5、PM10、NO2可視化分析
運用tableau 的分析功能突出顯示年度平均線,設置6 種污染物的二級標準濃度限為常量參考線,分析2014 年到2020 年的6 種污染物變化趨勢。圖4 是PM2.5 的可視分析圖,其中可以清晰直觀得到不同年份、不同月份的PM2.5 的濃度信息。通過交互篩選按器,對比查看不同月份的PM 2.5 濃度值,點擊“真”可以得到超過標準值的日期及其數值。在時間分布上,PM2.5、PM10、NO2的大氣污染物質量濃度日變化具有明顯的季節性特征,秋冬季偏高、夏春季偏低,平均值逐年下降、達標天數逐年增加。

圖4 PM2.5 趨勢分析圖
圖5 綜合分析,PM2.5、PM10、NO2三種污染物濃度都呈現下降趨勢:PM 2.5 從2014 年~2020 年超過二級標準線的天數分別為105、79、53、43、37、32、16 天,明顯下降;但是年平均值直到2020 才低于二級標準年均75ug/m3;PM10 從2014 年~2020 年超過二級標準線的天數分別為34、21、14、8、16、9、1,18 年稍有起伏,總體是下降,年平均值在2017 年低于二級標準年均70ug/m3;NO2從2014 年~2020 年超過二級標準線的天數分別為25、28、25、19、21、9、4,下降非常緩慢,年平均值也是直到2020 才低于二級標準年均40ug/m3。

圖5 PM2.5、PM10、NO2可視化分析[6]
2.2.2 SO2、CO、O3可視化分析
圖6 中展示了其近幾年的三種污染物的變化趨勢線。數據顯示SO2日均值、年均值都沒有超過二級標準值150ug/m3、60ug/m3,年均值逐年下降,比2014 年下降了76.3%,下降速度到2020 年稍有放緩;CO 的日均值、年均值都沒有超過標準值4 mg/m3;O3在2020 年有一天超過8 小時均值160 ug/m3,年均值都沒有超過標準線,但是曲線有上升趨勢,要引起重視。

圖6 SO2、CO、O3可視化分析
綜上所述,蘇州市區環境空氣質量總體持續改善、穩中向好,空氣質量達標天數穩中上升,空氣污染程度明顯下降。但是以可吸入顆粒物PM10、細顆粒物PM2.5、二次污染物臭氧(O3)等為特征的污染依然存在。“可吸入顆粒物”PM10 和PM2.5 作為環境空氣中的首要污染物直接威脅著人類身體健康,超標的臭氧則是個無形殺手:強烈刺激呼吸道,對人體皮膚中的維生素A 起到破壞作用。
所以要加快污染防控步伐,嚴格管理工程車、控制機動車保有量、提倡使用清潔能源、增加綠化面積,以減少揚塵、煙塵和機動車尾氣塵是城市空氣主要污染源。持續實施大氣污染防治工程,防微杜漸,才能保持現有環境質量狀況,繼而繼續改善空氣質量。進一步深入推進污染源治理,實施大氣綜合治理,實現生態環境“高顏值”。