2008年以來,學術界逐步掀起了大數據的研究熱潮。大數據時代的到來正在對傳統社會科學的研究產生巨大沖擊,同時也為我國社會科學發展提供了重要的歷史機遇。適時啟動對社會科學長遠發展的關注,探討大數據對社會科學轉型的重大影響,發揮專家引領作用,匯聚、總結現有研究成果,梳理、激發未來學術創新,規劃一定時期內我國社會科學研究的發展趨向,勢在必行。據此,哈爾濱工業大學米加寧教授和西安交通大學邊燕杰教授共同發起了“大數據與社會科學轉型高端學術研討會”,邀請全國社會科學領域從事大數據研究的知名專家學者共同研討。清華大學陳國青、羅家德、孟天廣、張小勁、張楠,北京大學楊競霜,中國人民大學孟小峰,南開大學孫濤、鎖利銘、張連增、段月姣,上海交通大學樊博,中國社會科學院王國成、陳華珊,上海社會科學院胡鍵,中山大學梁玉成,西安交通大學蔡萌,武漢大學羅俊,復旦大學鄭磊,浙江大學吳超,北京郵電大學何元,北京理工大學徐磊,哈爾濱工程大學康偉,哈爾濱工業大學王健,桂林理工大學章昌平等專家學者作為特邀代表參加會議。
2019年1月12日至13日,“大數據與社會科學轉型高端學術研討會”在哈爾濱工業大學成功舉辦。會議主題為“大數據與社會科學轉型:方向、方法與路徑”,主題報告包括清華大學陳國青教授的“管理學‘遇見’大數據”、北京理工大學徐磊教授的“大數據與社會科學轉型問題的思考”、北京郵電大學何元博士的“時空大數據技術、創新與應用”以及中國人民大學孟小峰教授的“社會計算的現狀與展望”。在主題報告的引領和啟發下,與會專家學者分為社會學組、公共管理組、綜合組進行了深入而充分的觀點闡述與學術交流,并在圓桌論壇環節進行了討論組匯報和自由討論。高端研討會之后,專家學者們借助互聯網平臺,持續開展學術互動,推進“大數據與社會科學轉型”這一學術主題的討論進一步深化。
本文主要對研討會的會議主旨以及與會專家學者的發言觀點進行梳理,以期呈現社會科學各領域專家學者對數據驅動社會科學研究的應用與實踐的分析與預測。
隨著物聯網、云計算、移動互聯網、智能終端的應用與普及,人類社會逐步邁向大數據時代,人類社會經濟活動和個人生活中的行為,正在以“數據”的形態被存儲下來,人類社會產生的數據正在以指數級的方式快速增長,形成了海量的、多源異構的數據形態。
面對這樣的發展態勢,大數據時代對于管理學的影響可以分為兩個階段:第一個階段是數據商務階段,即所有的社會和經濟活動及其涉及的要素在持續的數據化,并利用其進行數據分析;第二個階段是算法商務階段,即利用數據分析和大數據分析技術進行賦能和創新。(陳國青)
大數據是否帶來認知方式的跨越性的根本變革?當今的大數據觀念、平臺和技術,高保真一對一映射,360度多層級通透可視,理論空間與現實世界可零距離無遺漏對接等,正促使著社會科學研究轉型,有望從根本上突破傳統思維局限和慣性。(王國成)
與此相近的,有學者認為,社會科學正在發生歷史性轉折,人類的社會生活由于架構于網絡之上,可以隨時隨地獲取、傳輸和處理數據,不僅認知社會的數據基礎發生了根本變化,同時,社會網絡理論和計算技術的發展,使得大數據可以得到有意義的解析。新的研究范式漸漸顯露,一系列新的問題,如現象呈現和理論解釋的關系,社會科學能否進行仿真實驗,研究范式的理念基礎等,需要進一步研究和討論。(徐磊)
大數據發展對社會科學的整體影響表現為三個跨越,即對社會科學歷史階段的跨越,對研究者與被研究者之間的專業化差異的跨越,以及研究者與實踐者之間分工的跨越。大數據的特點在于減弱人為設定“規律”的干擾,基于海量、異構、多源數據進行相關性研究,可以更真實地還原行為人的特征。這種特點就使得各個學科在底層上的差異性減弱,共通性增強,更加指向真實世界,使得實踐分析者與理論研究者的鴻溝被有效填補。(鎖利銘)
有學者指出了數據驅動社會科學研究轉型的路徑。當數據從理論的邊緣走向理論的中央,由于數據的全域化和數據的泛在化,導致了社會科學研究正在出現急劇的變化:數據的全域化導致無處不在的數據,而數據的泛在化則導致無時不在的數據。大數據正在促使社會科學研究發生更本性的轉型,主要表現在由理論驅動的社會科學研究向由數據驅動的社會科學研究轉型。具體表現在預設研究向涌現解析的轉型;定性分析與定量分析融合的趨勢;從有限檢驗向仿真實驗的轉型;從小數據“驗證邏輯”到大數據“發現邏輯”的轉型;從“問題導向”的學科研究向“事件導向”的跨學科研究的轉型。(米加寧)
與會專家學者對數據驅動社會科學研究的新技術與新方法進行了廣泛的討論,主要的學術觀點如下:
(1)社會網絡的大數據方法
相對于傳統數據,社會網絡大數據中的個體網數據可以測量行動者的網絡規模和網絡異質性,可以測量行動者的相互認知和關系互動,也可以獲取歷史數據,形成長久可靠的追蹤數據。而將大數據技術應用于整體網,則體現出更為突出的優勢,一方面可以獲得歷史數據、時序數據、即時行為數據等,可以反映整體網復雜系統的動態全貌;另一方面可以獲得豐富的人際聯系的動態內容,不僅包括行動者在互聯網上的電子足跡,也包括文本數據、音頻數據、基因數據,對于研究社群認同,建立話題模型,提取語義框架。特別是將數據結構化后可以進一步分析具有理論和現實意義的議題。此外,大數據能夠建構出可以推論的預測模型,也可以指導數據挖掘的方向,大大擴展了傳統社會網絡分析用于對現實的解釋和理論假設的驗證的研究內容。(邊燕杰)
(2)數據驅動的自主行動者建模方法
利用傳統社會調查方法收集的數據所建立的模型無法滿足研究者模擬復雜環境下的動態社會過程的需求,是基于主體建模方法(ABM)所面臨的主要瓶頸。大數據可以有效解決數據缺乏的問題,將實證數據嵌入到ABM模型中,形成了社會模擬的新范式——數據驅動的自主行動者建模。通過這種方式,研究者可以模擬出更加接近現實的復雜社會系統。(梁玉成)
(3)人工智能的分布式機器學習算法
人工智能經過60多年的發展和積淀,隨著機器學習、互聯網、大數據、云計算和物聯網等技術不斷發展,人工智能正引發可產生鏈式反應的科學突破。基于目前人工智能算法的快速發展的現實,研究和設計一套基于隱私保護、促進數據交易、降低建模成本的分布式機器學習算法框架就顯得非常重要,比如利用區塊鏈、聯合學習、同態加密等技術設計一個分布式機器學習的環境,并研究其在一些典型應用場景的實現。(吳超)
(4)社會計算的技術方法
萬物互聯的智能時代對整個社會現象和社會行為的描述將發生重大的改變,而構筑智能社會的核心技術在于社會計算。社會計算的根本任務就是借助信息技術的使用,測量個體的行為數據,構建計算模型,發現社會變化,進而分析人類行為。其最終目的是建立一套方法體系,幫助人類預測和解釋社會現象。社會計算以它的強大的方法論的整合能力,可以促進社會科學的學科交叉和整體性特征,進而重建自然科學與社會科學的關系,有可能創立社會科學新的研究范式,可稱之為第五研究范式。(孟小峰)
(5)算法社會科學的技術方法
在計算社會科學的基礎上,進一步發展為算法社會科學這一新的社會科學研究類型。算法社會科學是基于海量、類型繁多、價值密度低、導入速度快的數據之上的社會科學,在數據處理過程中必須充分構筑與大數據的數據挖掘和數據分析功能。算法社會科學既是一種哲學思維的創新,也是基于大數據技術的國家能力的工具性創新。因此,大數據與社會科學的融合是有價值選擇的,也就是在使用大數據技術的時候是有“我們應該做什么”“我們應該如何做”的規定的;與之相區別的,“計算社會科學”則是純粹技術性問題,不含價值倫理的內容。(胡鍵)
(6)大數據對因果推論方法的改進
伴隨著大數據方法在方法論層面日趨成熟、方法技術日益豐富、研究議題逐步拓展,且與傳統社會科學方法逐步融合,大數據方法推進因果推論的能力逐步完善,革新著數據采集、概念測量、相關性分析、因果性與預測性分析等因果推論的各環節,形成了大數據與統計方法、大數據與小數據分析、大數據與實驗研究、大數據模擬方法等多種生產和檢驗因果性知識的方法路徑。(孟天廣)
(7)時空大數據的技術方法
社會科學研究面臨時空大數據帶來的新的研究機遇。GIS地圖、社交媒體、公共交通等空間信息數據對城市規劃、城市治理等社會科學研究領域具有極大的價值。同時,社會空間在社會學中具有更加核心且獨特的地位。在時間維度上,大數據為定量研究提供了大尺度的時間視角,使得歷史文化研究成為可能;也能夠實現針對智能設備記錄的微觀個體連續的行為數據或者使具有序列特性的非連續數據的數據分析與挖掘成為可能。(陳華珊)
從現有研究成果豐富性和實踐領域、國家戰略層面的大力推進來看,大數據對社會科學研究的影響是全方位的。
大數據正有力推動著國家治理體系和治理能力走向現代化,并日益成為社會管理的驅動力、政府治理的“幕僚高參”。從建立健全大數據輔助科學決策和社會治理的機制,并保障國家數據安全,打破信息壁壘、推動信息共享,再到利用大數據平臺形成社會治理合力,有力提升了治理科學化、精準化、高效化水平,增強了社會治理和服務經濟發展的能力。(楊競霜)
數字孿生成為各行業需正視的現實情境,人機協作關系在日常管理中變得更為緊密。為應對大數據時代城市管理決策的實踐需求,以數據為依托對虛擬世界探索、理解和操作,從而提升現實的公共事務和社會治理能力是未來的研究與實踐的重點,這其中,微觀思維、復合思維、語義思維和多向度思維等十分重要。(孫濤)
數字治理是未來公共管理學術研究的一個主流領域,其有三個核心任務:一是數據治理的功能,是研究高質量大數據的使能因素、因果機制和因果效應;二是整體政府的概念,研究大數據和互聯網背景下的流程再造、制度變革、協作治理甚至機構重組等問題;三是大數據驅動的公共事務分析,發現隱藏在海量數據中的規律知識,發現更有突破性的創新理論,也為公共政策制定提供更為科學的依據。(樊博)
大數據驅動公共管理決策模式創新,以“公共管理問題提出—問題分析—策略生成—方案評價”為邏輯框架,遵循大數據思維下“真實世界—數據—策略”邏輯鏈,形成公共管理部門、社會公眾、企事業單位等多主體參與下的策略生成機理,以及包含各領域公共問題融合分析、決策機制設計和具體行動方案的基于大數據的公共管理決策模式,從而實現公共管理問題分析的精準化、策略設計的精準化和方案評價的精準化。(王健)
在數據驅動的政府治理這一語境下,回應政府這一政治學的經典議題理應得到更充分的發掘。大數據及其相關技術為實現面向全社會民眾訴求的“全面把握、快速分析和精準回應”的政府治理理念提供了技術基礎。數據驅動的政府治理體現為對新技術的開放性包容。所以,政府部門應當充分利用大數據技術革新的時代機遇,以及大數據人才、技術和產業迅猛發展的本土優勢,以全面提升基于“互聯網+”的政府治理能力,推進政府決策能力、吸納能力、整合能力的全面提升。(張小勁)
作為公共管理學科的重要領域,區域治理研究關注多個行政區之間由共同目標與共同問題產生的集體性政策行為與治理行為,其本質為集體行動問題。大數據的引入使得原有結構型模型向連接型關系模型的轉型,后者是基于大數據思維的后驗型模型,以觀測區域之間的真實互動連接為主要目標,同時在實踐中區域治理逐漸走向以數據為載體的治理網絡。(鎖利銘)
以金融和保險領域的研究為例,在互聯網、大數據和人工智能的融合時代,金融風險監管部門的決策方式更應從大數據著手,通過對混雜大數據的總體把控、動態相關分析,得到準確甚至于精準的有效信息,從而達到精準施策的目標。因此,通過尋求全部可得大數據,借助機器學習算法與金融傳統理論相融合,提出一套新的監管體系,實現系統性風險的早識別、早發現、早預警,是當前我國金融監管發展的第一要務。(段月姣)
借助于機器學習和深度學習算法,在保險行業已發展出了各種預測建模技術。以人工智能為標志的保險科技廣泛應用于保險業務經營,大幅度提高保險公司的競爭力,提升工作效率,降低保險經營管理成本,強化風險管理,最終提升了保險行業的價值。(張連增)
研討會上,學者們提出了應對數據驅動社會科學轉型的科研工作者需要加強的自身能力建設的相關問題和解決方案。
大數據既沖擊著傳統社會科學的學術研究范式,也對傳統的社會學科人才培養方案形成沖擊,應該適應大數據時代數字治理的理論研究與實踐需求,重新思考理論體系和方法論體系的布局,按照社會科學研究四個研究范式建立質性分析、量化分析和仿真分析大數據分析的課程體系,為學習者打造堅實的方法論基礎。(樊博)
社會科學研究范式的轉型對研究人員核心素養的轉變提出了新的要求,需要具備對數據的確認、獲取、評估、清洗、分析及可視化的能力,其基本要素由數據意識、數據能力及數據倫理三個部分構成。為提升社會科學研究人員的數據素養,適應社會科學第四研究范式帶來的挑戰,需要結合科研人員職業生涯、科研項目過程、數據生命周期來設計科研人員培養路徑,形成數據素養模型構建與核心能力分析、數據管理與算法支撐的嵌入式發展。(章昌平)
同時,學界需要加強跨學科科研合作模式的開展。大數據背景下社會科學研究的新型模式,應由社會科學領域專家進行頂層設計,由相對缺乏對社會宏觀思考的數據科學家或算法工程師作為專門技術研究人員主導實現技術方案,共同完成跨學科、融合式的數據驅動的社會科學研究,服務于大數據背景下的知識需求。(何元)
本次高端學術研討會是我國社會科學領域在大數據問題上一次跨學科交流的嘗試,從會議的過程和討論的成果來看,可以說取得了初步的成效,為我國社會科學在大數據驅動下的研究轉型和理論創新開了好頭,希望今后有更多的理論工作者加入進來,共同完成這一歷史使命。