董雪
(邢臺現代職業學校,河北 邢臺 054000)
對于目前如此嚴峻的氣象條件,有什么方法可以預測到像霧霾這樣的重污染天氣嗎?
通過查閱大量的網絡資料,我們發現現在很多研究員,諸如微軟亞洲研究院主管研究員鄭宇【麻省理工科技評論TR35(35名在科技創新領域具有杰出成就的35歲以下頂級青年創新者)2013年的獲獎者】一直從事大數據挖掘和算法研究,希望用大數據解決現代城市所面臨的天氣問題。如果大數據可以帶給人們對于天氣問題的預測,那么何嘗不是一件好事。
那么大數據能不能成功預測霧霾?答案是肯定的。Urban Air正是由微軟亞洲研究院開發,用大數據預測城市空氣質量的項目。目前,Urban Air已經實現全國70多個城市空氣質量預測,可以對京津冀、長三角、珠三角、成渝城市群未來48小時的空氣質量進行預測。
大數據不僅能預測霧霾,還可以精細化預測。除了在預測精度上有優勢外,大數據精細化預測還體現在地域范圍上。目前,傳統模擬方法預測霧霾只能精細到區的范圍,比如可以預測到邢臺市橋東區、橋西區的空氣質量,而大數據可以精細化到每個空氣質量站點,比如可以預測橋西區達活泉站點未來48小時的空氣質量狀況。大數據不僅能預測霧霾,還可以快速預測。傳統的重污染天氣預測工作需要6小時左右的模擬運算時間,無法快速實時發布,而大數據可以在幾秒鐘之內快速算出重污染空氣質量數據。未來,霧霾的運行軌跡也將有望實現,霧霾從哪來,到哪去都將不是難題。
預測霧霾的大數據主要包括當前空氣質量數據、氣象條件、未來天氣預報三類數據。空氣質量數據并不是指單純的空氣質量站點數據,而是以某空氣質量站點為圓心,囊括了方圓300公里范圍內所有的與空氣質量相關的數據,比如空氣質量站點數據、交通流數據、氣象數據、廠礦數據、人口流動數據、路網結構等。與傳統模擬空氣質量不同,大數據預測霧霾依靠的是多元融合方法,也就是說,空氣質量的預測不僅僅看空氣質量數據,還要看與之相關的氣象數據、交通流量數據、廠礦數據、城市路網結構等不同領域的數據,不同領域的互相疊加,相互補強,從而預測空氣質量狀況。大數據應用于預測霧霾,首先,由于每個站點、每個時段空氣質量的影響因素都不盡相同,所以針對每個空氣質量站點,我們都會為這個站點每個時段單獨建一個空氣質量模型,之后再將三者數據疊加,最后將數據進行融合,制作出空氣質量預測模型。
此外,大數據預測與傳統模擬方法有一定的相似性,都是通過數據來擬合模型,只不過是數據量大小不同。以往由于獲知的數據有限,傳統模擬方法只能基于有限的樣本數據,由科研人員通過經驗、假設找出這些數據間的規律,模擬出簡單的模型,預測空氣質量。而隨著數據增多,單單依靠人工已經無法從海量繁雜的數據中找出規律,所以需要借助機器學習和數據挖掘等工具來發現多源數據中隱含的規律。如今影響空氣質量的因素越來越多,傳統模擬空氣質量預測首先需要搜集完整的污染源數據,比如企業的排污數據和汽車尾氣排放等,而這些數據無法全部獲知;其次模型太理想化,污染物在空氣中傳播和變化的實際情況也要復雜很多,因此,傳統模擬的方法顯得“力不從心”。在這樣的因素下,大數據在空氣質量預測上就顯得頗有優勢。比如傳統方法要拿到精確的地面污染源數據才能預測,而大數據則可以解決數據缺失的問題。比如對于交通尾氣數據難獲取的情況,大數據運算可以采用與交通尾氣相關的交通流量、排量等相關數據,間接地分析其與空氣質量的關系。大數據的精髓就是A領域的問題可以借助B領域、C領域、D領域的數據來一起解決,通過多元數據融合的方法來解決數據缺失和不精準的問題。
雖然大數據對霧霾的預測已經成功實踐,但還有存在很多困難。數據量少是大數據發展的掣肘,我國數據開放進程比較晚,并且很多污染源數據都還不完善。數據量大小直接影響大數據預測的精準度。比如數據樣本量不夠,會導致霧霾的拐點很難預測,目前傳統經典模型和大數據模型都很難說清楚霧霾何時會消散。
“很多人認為大風來了,霧霾一定會散去”,而真實情況并非如此。霧霾消散與大風的強度、持續時間、風向來源地都有非常大的關系。比如,如果風向的來源地本身是污染源,那么霧霾不但不會散去,反而會加重等情況。針對大數據在環保領域未來的發展,不僅僅是懂大數據的算法,還要懂一定的行業知識,這樣才能把大數據轉化為生產力。其次,大數據時代要求政府及相關部門的配合,對數據進行開放。只要數據足夠,整個城市設計與空氣質量的變化情況,完全可以依靠大數據實現。
總之,伴隨著網絡的普及以及大數據的應用,我們對于霧霾預測和氣象條件的分析都可以運用數據網絡,利用先進的大數據技術來實現。以往人們都是以每天的天氣預報來獲取天氣情況但不是實時情況,而大數據可以做到實時數據的發布。利用大數據技術對霧霾進行監測和預測是氣象天氣預測的必然,改變大家固化的思維模式,將大數據能量轉化為真正的生產力,為人們服務,讓大家對惡劣天氣有效預防和治理。