向惠聰,趙小亞,王 浩
(1.吉首大學 土木工程與建筑學院;2.吉首大學 旅游與管理工程學院,湖南 張家界 427000)
改革開放以來,中國的經濟飛速發展。中國一些重大項目工程應勢而生,但同時,在發展的背后,我們也應該注意到各種項目工程等在實施過程中可能引發的對社會穩定造成一定影響的風險因素[1]。為了有效規避、預防和控制項目在實施過程中可能出現的各類影響社會穩定的風險,確保項目的順利實施,在實施前都會進行風險評估[2]。例如在2016年6月,四川遂寧叫停了一份投資上億元的項目,原因無他,就是因為該投資建設項目“雖可大幅增加遂寧縣財政稅收,但該項目社會穩定風險系數較高,安全性、可行性、可控性差,不宜在原項目建設地址建廠”。傳統的風險評估收集數據時比如實地調查,隨機抽查問卷等具有的普遍性不高,很難得出民眾群體的真實反映,且主觀性太強,數據調查的空間范圍不夠,數據所具有的時效性不強,收集到的數據的類型同樣不能代表廣大人民群眾,這就會對評估結果產生一定影響,并且一些項目由于某些原因,致使關于該項目的一些數據公開不到位,導致評估結果具有一定偏差。相比之下,將互聯網技術運用到風險評估當中,在大數據下通過對個人的動態分析從而上升到對群體的動態分析,將現實數據與網絡數據結合起來,得出更加準確、能反映出實際狀況的數據,為風險預測評估提供進一步的支持。
大數據,顧名思義指數據的量大。實際上,這不僅僅是簡單的數量概念,還包括了更豐富的內涵。根據IBM公司的闡釋,大數據具有“4V”特點:Volume(大量)——數據體量巨大;Variety(多樣)——數據類型繁多;Velocity(高速)——數據高速處理;Veracity(精確)——追求數據高質量。
基于大數據下的社會穩定風險評估,在一定程度上擺脫了傳統風險評估的不足性,同時也具有上述所提到的“4V”特點。當今世界科技不斷發展,如果僅僅依靠講座、走訪、調查問卷,公示等方式收集數據,推測人民群眾對項目建設的反映或者意見,所得出來的評估結果往往是不全面的。將互聯網技術運用到社會評估中,在大數據的背景支持下,得出的評估結果不能說是百分之百的正確,但也會給我們提供平時收集不到的數據,進一步提高評估結果的準確性。在科技越來越發達,網絡越來越普及的時代,網絡發聲這種方式也越來越被人們所接受,當有某一時事熱點發生時,往往能在網上掀起很高的討論熱度,網友通過評論留言發表自己的意見看法,千萬不要小看“網友”這一群體,它涵蓋了各種各樣的人,年齡不同、職業不同、地方不同等,相比于傳統的數據收集,分析互聯網數據具有一定優勢,如果再將二者結合起來,勢必會使評估結果更加準確。其中,可以通過了解并綜合群眾在網絡上搜索瀏覽的內容,得知群眾對社會事件的關心度及發表的內容意見,將群眾的動態瀏覽轉化為社會穩定評估上的靜態可參考的數據意見。如谷歌通過對“流感”及其相關詞匯在網絡搜索記錄中出現頻率的觀察,準確預測了流感病毒在全美的傳播狀況;又如美國加州大學的人類學家和數學家共同建立了犯罪活動預測平臺,通過分析過去1 300余萬起案件,探尋即將發案的時間與區域④。這便很好展示了基于大數據下的社會穩定風險評估的優越性[3]。
大部分的數據資源都儲存在政府處,對于零零散散,復雜而繁多的數據資源,政府也有能力將其掌握好,這表面上做到了各類數據的互通融合,做到了數據的共享,可由于地方不同、部門不同,導致各處政府掌握的數據資源不同,從另外一個方面來看,對于數據,還是處于零散狀態,只是使單個零散的數據體積變大了而已。
所以,各地政府將數據資源公開共享互通是數據收集平臺搭建的第一步。2015年,國務院印發的《促進大數據發展行動綱要》中提及了要在2018年底前建成國家統一的數據開放平臺[4]。而在此之前,我國多個省市已經陸陸續續開始政府數據開放平臺線上試運行了[5]。雖說數據資源共享開放得到了一定的重視發展,但在目前來說也只主要集中在地方政府,往更大的區域層面上看,數據資源共享開放的發展并不理想,這導致在進行社會穩定風險評估前收集的數據并不全面,影響評估結果。就現實情況來看,我國目前至少可以同貴州的“云上貴州”平臺一樣,建立預測社會穩定風險信息共享互通平臺,將交通、住房、就業、入學、保險、醫療等信息,通過處理分析,將其“集中”起來,建立一個數據庫,促進數據資源共享開放不理想的區域的發展。
同時,這樣一個數據資源共享平臺搭建也應該注意以下幾點:①在平臺上的數據要保證其真實性,運用真實數據來進行社會穩定風險評測;②在不影響威脅到國家安全、機密的前提下,數據體積越龐大越好;③數據應注重時效性,社會不斷發展,人們的思維趨勢不斷改變,及時掌握實時數據,有效做出針對當前情況的分析。
在數據資源收集平臺搭建完成后,接下來就要對收集到的體積龐大的數據進行分析處理了。如果對數據不會分析運用,那么即使擁有藏有如此多信息的數據,也不會增加風險評估的準確性,只是徒勞。美國在數據分析處理方面的發展比較好,花重金在數據分析平臺的搭建上,投入大量人力物力財力去研究,將大數據運用在經濟發展、反恐、維持國家穩定等方面,并取得不錯的成果。
基于大數據的數據分析和挖掘技術,其理論基礎來源于數據的分布式計算和挖掘原理,分布式計算是在原有算法基礎上的改進,將原有的單機運算變為多臺機器的分布式運算,而數據挖掘則主要依據聚類、分類和主題推進等算法,常用的大數據分析工具主要有Hadoop、Spark、Storm等。
將大數據運用于社會穩定風險評估中的目的就是提高評估的準確性。因此,在完成數據資源的收集,分析處理后,就要考慮將其運用到現實中,完成對大數據的應用。
以往的評估結果之所以不被公開,是因為運用傳統風險評估方法去評估風險,其結果僅僅只能得出項目是否能夠繼續,并不能知道這個結果是否準確,民眾也無法了解整個評估過程。試想,如果用傳統評估方法得出的評估結果可以被公開,民眾知道了這個結果,而恰恰這次的評估有所偏差,與預想中的不符,這是否會從另一方面引起社會恐慌,降低政府的“公信力”。而搭建風險評估應用平臺,將評估過程、數據來源、數據分析、在現實中的應用等都公開在平臺上,民眾對此一目了然,評估結果的準確性也有了一定的依據,每一次的評估都有數據支撐。而且也可以進一步拉近民眾與政府的距離,一舉兩得。
一般評估影響社會穩定的風險因素,傳統上只注重該風險是否會引發群眾聚集類事件,而這僅僅只屬于“穩評”中的一小類,實際上應該從多個方面、多個角度去看待問題。對于突發的,會引起群眾恐慌,社會不良影響的風險因素,也應著重、有針對性地開展風險評估。具體來說,前段時間高架橋坍塌事故,上海一在建樓房連根拔起倒塌事件的發生,都已經引發了嚴重的社會恐慌,哪怕沒有人員死傷,都應該列為高危的社會風險。同時,我們不僅要關注現實生活中引起的影響社會穩定的風險因素,還不能忽視群眾在網上的動態意見,不能只將引起人員傷亡定義為風險?;ヂ摼W技術基本走進了家家戶戶,近幾年來也有很多通過微博等媒介揭露一些事實真相,從而引起社會大眾共鳴的事件發生,這些事件的發生通常具有不確定性,更加不會提前預知,往往發生得很突然,并且引起很大的社會反響,這就對項目的實施具有一定影響作用,無論好與壞。由此可見,引發影響社會穩定風險的因素有很多,網絡上的數據也是我們在進行評估時必須要考慮的因素。
傳統的社會穩定風險評估中,所用到的數據大部分都是來自“線下”。一般都是通過講座、聽證會、實地調查問卷等收集數據,先不討論收集到的數據準確性如何,單單就數據的“體積”來說,就是不夠的,或許盡可能地多收集數據,可是這些對于當地區,甚至是中國這么龐大的人口基數來說,他們還很渺小,并不能代表全部民意,也不能夠保證基于這些數據上實施的重大項目會不會引起公眾躁動,甚至是社會動蕩。并且即使運用互聯網技術,將大數據利用起來,但由于數據的雜亂無章,缺少專業人員用專業技術處理,也很難將有用的數據提取出來,將其運用到穩定評估中,大數據將處于被浪費的狀態,致使結果仍和之前傳統的評估相似,并沒有太多地提高其分析結果的穩定性。
雖然將大數據運用于社會穩定風險評估在我國目前還處于起步階段,整體規模較小,并且面臨著眾多困難,如一些相關數據公開不到位,難以獲取到較為私密的數據,但隨著科技的不斷發展,將互聯網技術運用于社會穩定風險評估也必然成為趨勢,傳統評估方法會逐漸從主力軍位置退下來,大數據分析必將代替他得出更加準確的評估結果,保證在項目實施后不會嚴重影響社會穩定。