郭躍軍 侯江雷
【摘要】大數據時代下所形成的大數據思維是時代的產物。在網絡群體性事件頻繁發生的今天,如何有效防治網絡群體性事件是一個必須要解決的新課題。文章通過分析大數據思維治理網絡群體性事件的必然性和可能性,提出治理網絡群體性事件的新思維和新方法,做到預防為主,防治結合,盡量避免網絡群體性事件的發生。
【關鍵詞】大數據時代 大數據思維 網絡群體性事件 治理
【中圖分類號】B82 【文獻標識碼】A
隨著互聯網的普及,聯網設備和社交媒介的增加與創新,網絡的信息量不斷增加,整個世界隨之進入包攬海量數據的大數據時代,它在潛移默化中對我們的思維方式、生活方式、工作態度以及技術革新產生重要影響。在網絡群體性事件頻繁發生的今天,分析大數據思維治理網絡群體性事件的必然性和可能性,提出治理網絡群體性事件的新方法,有著重要的理論與實際意義。
大數據時代與大數據思維
大數據時代的到來。20世紀80年代,美國人就曾經提出過大數據概念,經過30多年的發展,2012年3月,美國政府斥資2億美元啟動“大數據研究與發展計劃”,這是繼1993年“信息高速公路”之后,美國的又一創舉,奧巴馬將其定義為“未來的新石油”。該項目的全面啟動標志著大數據時代的到來!
大數據簡而言之就是大量數據的集合體,但目前還沒有對大數據作出完全標準化的定義。在維基百科中,大數據被定義為海量數據、大量數據和大資料,指的是在寬帶、互聯網社交網絡等各種終端設備的普及下,產生了規模巨大到無法通過常規的軟件工具進行分析、處理的數據量。
數據量的持續增長和數據規模的擴大,一方面是全球網民數量的增長。市場研究公司eMarketer在報告中指出2014年互聯網用戶在全球總人數中首次突破40%的比例,網民數量高達28.9億人。預計2015年將增長6.2個百分點,全球互聯網用戶將達到30億人以上,同時在全球人口數量中所占比例增至42.4%。據推算,到2018年,全世界將近一半的人口(36億)每月可至少接入一次互聯網①。另一方面是聯網設備的增加和聯網技術的更新換代。以物聯網為代表,市場研究公司Gartner預測,2015年物聯網設備的使用量將增至49億,與2014年(38億)相比,增長了30%,到2020年,物聯網設備的數量將增至大約250億②。
與此同時聯網技術也在日新月異,網絡也從2G、3G發展到今天的4G網絡。全世界的移動網絡,到2017年,3G的使用數量將有希望超過2G,成為主要的網絡使用技術。到2019年,移動設備和聯接設備中44%將為3G網絡,26%將為4G網絡。Cisco VNI全球移動數據流量預測報告預測,到2019年全球移動數據流量將達到292EB,比2014年的30EB增長顯著③。這一系列的調查數據及預測結果表明:大數據時代向我們走來!
大數據思維。大數據的特征表現為:數量(volume)、速度(velocity)、多樣性(variety)和精確性(veracity)④。時代在發展,面對洶涌澎湃的4V時代,我們也要轉變看待問題的方式,培養一種與時代接軌的大數據思維,讓數據“發聲”。
第一個轉變:全數據模式,樣本等于總體。在小數據時代,由于收集、儲備和分析數據的設備不健全,我們只能收集到少量的數據。為了簡便分析數據的方法,隨機抽樣的方法應運而生,即以最少的數據,獲得最多的信息。隨機抽樣在測量和推算領域占據著很高的位置,但這只是在無法獲得和分析大量數據情況下的選擇,其自身也存在著缺陷。如今隨著信息收集和處理能力的不斷發展,我們已經有能力獲得海量的數據,全量數據可以使我們站在一個更高的角度,發掘被埋沒的數據價值,獲得更全面的研究結果,從而在大數據的分析過程獲得驚喜的發現。
第二個轉變:精確轉向混雜。執迷于精確性是小數據時代的產物,在信息貧乏的時代,我們只能獲得少量的數據,而可用的數據又少之又少,所以,對能夠收集到的相關數據要求十足的精確性,以保證研究結果的正確。如今我們生活在海量信息的時代,而且能夠掌握的數據庫也越來越全面,如果我們還以傳統的思維模式來審視信息大爆炸的21世紀,那么我們將錯過很多信息,據研究結果顯示,只有5%的數據是結構化的,可以適用于傳統的數據庫,如果不接受混雜或者不精確,95%的數據將無法利用。再者,在海量數據的大數據時代,我們無法實現數據的完全精確,當我們掌握了足夠多的數據,我們同樣可以預測出事情的發展走向。或許這種混雜數據看問題的思維剛開始會與我們的直覺相矛盾。接受數據的混雜與不精確,這種數據的不完美或許能夠使我們更好地預測,看到世界另一扇窗的景色。
第三個轉變:不問因果,重視相關。過去,人們對事物的分析,總是先有了想法,進行假設,然后收集相關數據,通過實驗和分析來證明想法的可行性。但是這種假設是主觀的,極易受偏見的影響。同時由于受時代的限制,收集和分析數據十分困難,所以對事物的相關性分析也容易產生錯誤。如今大數據時代攻破了此項難題,我們無需進行假設,數據自己會說話。也就是說大數據時代我們不再問因果,而且巨大的數據庫也不允許我們事事問因果。我們的思維開始由why轉向what,知道是什么,沒必要問為什么。大數據的核心是預測,而對事物相關性的分析擺在了突出位置,通過對事物相關性的應用,我們可以更好、更快捷地分析事物,捕捉現在,預測未來。
運用大數據思維治理網絡群體性事件的必然性
為了對網絡群體性事件更好地進行預測與事前控制,必須運用大數據分析的方法。隨著互聯網尤其是移動互聯網的普及以及智能終端設備的創新和發展,網民數量不斷增加。大數據時代,每天具有高速的數據流產生,所以傳統的數據抽樣法對于事件的治理具有明顯滯后性,以致網絡群體性事件的危害不斷擴大,輿情無法控制,錯失從源頭上控制和治理的時機。大數據時代下,我們要突破小數據時代傳統抽樣調查方式的局限,采用全數據模式,即樣本=總體,通過統計互聯網的整個檢索記錄,運用數據分析設備對整個數據庫進行分析,把握主流信息的走向,對主流信息的把握由宏觀轉向微觀,掌握可能引發網絡群體性事件的人群來源、地區來源,同時了解群眾的訴求和意愿等方面的信息。由事件個案的關注轉向整體態勢的把握,對網絡輿情發展的整體走勢進行分析和預測,對網絡群體性事件可以更好地做到事前控制,事后解決。
為了掌握網絡輿情發展脈絡,必須學會大數據思維。在信息和網絡技術不發達、互聯網尚未普及的時代,網民表達訴求和意愿的方式,僅僅局限于文本和圖像層面,同時使用互聯網的用戶也不算龐大,所以分析網民的輿論走向以及跟帖態度,只需對網上的文本信息和少量的圖像進行分析即可,也有時間對網民的跟帖態度做跟蹤式調查。大數據時代不僅是一個信息量大、快速化的時代,也是一個數據類型多樣化、價值高、密度低的信息時代,同時還是一個混雜性的信息時代,我們對網絡群體性事件的治理策略也應該順應時代的發展,在如此龐大、快速、混雜的數據時代,我們不可能對每一條信息的分析做到十分精確,在混雜海量的數據中,形成全局、動態的研究輿情數據的思維,掌握大體的網絡輿情發展脈絡,或許比關注和確定網民某時某分發布的什么帖子重要得多。
大數據時代為治理網絡群體性事件提供技術基礎
大數據時代的根本要求在于思維模式的轉變,大數據思維突破了傳統分析數據的框架,帶來了新的思考方式,同時也將給網絡群體性事件的治理提供新思路、新機遇。
一切皆可量化。隨著信息收集,儲存和分析設備能力的不斷提升,一切讓數據來說話成為可能。在信息技術高速發展的時代,不僅網頁的瀏覽次數、相關詞條的點擊量、微博中的跟帖數量、網民對于輿論的轉載數量這些量化信息可以形成大數據,而且網民情緒的變化、思維的轉變、評論、文化程度、區域位置、社會關系也可以量化,然后轉換為可以統計分析的標準化數據,通過把所有可以收集到的關于網絡輿情的定序定量信息轉變為可供觀察和分析的數據形式。當然,值得注意的是,量化輿情言論并不完全等于數字化輿情言論。然后,就可以通過相關的數據收集和信息技術,建立數據模型,預測輿情未來的發展動態。
一切皆可聯。網民行為和情緒變化的數據都具有內在的聯系,這可以用來預測網絡性群體事件的萌芽及動態。大數據時代下的大數據思維其中最重要的一個方面就是由重視事物的因果聯系轉向重視事物的相關聯系,不問為什么,只要知道是什么即可。大數據思維在網絡性群體事件的治理中改變了以往的“有罪推論”網絡輿情邏輯監測的思維方式,不再單純去關注導致網絡群體性事件爆發的因果關系,而是哪些相關因素可能會導致網絡群體性事件的發生,以便提前做好應對策略,這樣也為預測網絡輿情的發展方向爭取了時間和空間。注重相關性是大數據思維的重要特征,同時,網絡輿情的相關關系也是治理網絡群體性事件過程中,可被發掘和利用的重要知識,通過對網絡事件參數間關系的分析,從而發現輿情中隱藏的相關性,為更好更準確地把握和控制網絡輿情走向創造有利條件。
一切皆可用。大數據思維的一個方面表現為放棄精確性,接受混雜性。這種混雜可以指格式的不一致,也可以是數據的不精確。大數據時代下,各種媒體傳播形式多種多樣,信息技術日新月異,網民表達觀點、訴求、意愿的方式也紛繁多樣,例如文本、圖像、視頻、語音等,我們在對輿情走向進行監測時,要迎接大數據的混雜,同時在這種混雜中,全方位捕捉與網絡輿情相關的一切輿論形式。大數據具有快速、價值大、密度低的特點,大數據時代信息在網絡中流動的速度特別快,例如我們對新浪微博中一篇報道的某一評論進行跟蹤監測,來掌握該網民的情緒波動和思維變化,力求監測結果的準確性。可是我們如果放棄對個案準確性的精益求精,而轉向對該報道下所有評論的監測,或許我們收獲的信息量會更多,在這過程中我們雖然放棄了對個案研究的精確性,卻把握了對于該報道看法的整體趨勢。
大數據時代治理網絡群體性事件的新方法
目前,對于網絡群體性事件,應該實現由事件發生后的監測轉為事件發生前的預測,由事件發生后的治理轉為事件發生前的防范。大數據時代的核心是預測,網絡群體性事件的治理要突出新思路與新方法。
大數據與社會治理相結合,從可能導致網絡群體性事件發生的源頭開始治理。從一定意義上看網絡上的言論就是現實生活中社情民意的反映。所以,加強對網絡信息的監管也是在強化社會治理。大數據時代下,我們要充分發揮大數據的優勢,掌握全方位相關聯的數據,運用強大的“相關統計和分析”能力搭建網絡信息數據的立方體,通過將網上和現實生活中各個方面的數據進行整理分析,探索網絡輿情走向,把握網民情緒波動態勢,挖掘隱藏在現實社會背后的深層關系,將網絡信息的監測、分析同現實社會的治理結合起來。
大數據與政務信息在網上公開相結合,增加信息透明度和政府公信力。美國政府承接大數據時代“一切皆可量化”的理念,把政務信息由定性向定量轉變,建立統一的數據門戶開放網站,并向社會各界提供數據傳輸的接口,以此來便利各部門的數據供社會各界使用,使社會各界能夠及時正確地了解國家的政務信息。美國政府的這一行為把政務公開由傳統的“信息層面”向“數據層面”發展,開辟了一條與傳統政務信息公開方式不同的新途徑。美國政府的這一創新對于我國的政務公開方式的改變具有借鑒意義。首先,我們要保證數據的安全,在此基礎上探索正確的方式,建立本國的數據政務公開系統,讓民眾對于政府的政策信息有一個正確的了解。其次,引導社會各界積極參與到對數據的挖掘和利用中去,使數據的價值能夠得到很好地發揮。
大數據與思維引導相結合,提高言論的說服力和事實可信度。大數據時代下的思維引導要做到兩方面,常言道:“知己知彼,百戰不殆”,一方面,先要搜集網上的相關數據,建立網民思維傾向的數據模型,進行分析,找到網民的思維特點和愛好,用網民可以接受的交流方式進行引導。另一方面,要讓數據“發聲”。數據常常能夠使人們信服,相關部門要收集足夠充分的數據,利用可視化技術做表、制圖,將事情的前因后果全面的呈現給大眾,讓大眾對事情的來龍去脈有一個真實的了解,消除對事件的錯誤看法和偏激情緒,從而建立正確分析問題的思維方式。
大數據與治理突發的網絡群體性事件相結合,提高應對突發事件的能力。網絡群體性事件的發生與互聯網密切相關,網絡是一把雙刃劍,它為網絡群體性事件的爆發提供了平臺,同時也為網絡群體性事件的治理提供了有力支持。大數據時代,可以將事件的相關信息和危害程度量化,事件的發展趨勢模型化,從而全面分析事件的發起群體、傳播渠道、事態發展、網民思維傾向、點擊數量等相關數據。迅速判斷出該事件的嚴重程度和走向,掌握解決問題的切入點,制定出正確的應對策略。
大數據與網絡媒體和社交平臺的日常管理相結合,提高預防和治理網絡群體性事件的能力。大數據時代,數據不僅可以開口“說話”,還可以預測未來。以前,當某事件分析和處理完之后,與此相關的信息價值也不復存在,而在一切可量化和一切皆可用的大數據思維引導下,這些失去價值的信息有了用武之地,通過對歷史數據的分析,繪制網絡群體性事件發生的“地圖”,預測哪些群體、哪類思維、哪種言論容易引發網絡群體性事件,從源頭上進行預防。即便是網絡群體性事件發生后,我們也能利用這種數據“指引”方法,快速準確地找到治理措施。所以,我們在日常管理中,就可以通過搭建網絡信息后臺收集和整合系統,實時記錄微博、博客、QQ空間、論壇、網站等各個社交平臺和網絡媒體信息,量化為數據,從海量的網絡信息數據中找到預防和管理的重點,盡量避免網絡群體性事件的發生⑤。
(作者分別為河北農業大學馬克思主義學院教授,河北農業大學馬克思主義學院碩士研究生;本文系2014年教育部人文社會科學研究專項任務項目(中國特色社會主義理論體系研究)“大數據時代馬克思主義網絡傳播研究”階段性研究成果,項目編號:14JD710018)
【注釋】
①“2015年全球網民數量將突破30億”,http://www.china-consulting.cn/news/20141121/s101935.html。
②Gartner:“2020年物聯網裝置數量高達250億個”,http://www.ithome.com.tw/article/92827。
③思科VNI調研報告:“預測未來五年全球移動數據流量將增至10倍”,http://www.cisco.com/web/CN/aboutcisco/news_info/corporate_news/2015/02_05.html。
④肖飛,齊立磊:“大數據處理技術與探索”,《計算機與現代化》,2013年第9期。
⑤卿立新:“創新大數據時代的網絡輿情管理”,《紅旗文稿》,2014年第22期。
責編 /許國榮(實習)