文/周燦
基于大數據的發展背景,本文簡要概述了大數據試驗場的概念和內涵:首先介紹了上海市大數據試驗場的建設背景,明確其定位與建設目標;其次,簡述了大數據試驗場的架構和服務體系,闡明了大數據試驗場的建設對推動數據科學研究、助力數字經濟發展、賦能城市數字化轉型等方面的現實意義。
自20世紀90年代互聯網逐漸普及以來,海量的數據開始呈現爆發式增長,并逐步應用于經濟社會發展的各個領域。2008年,《自然》雜志專刊提出“大數據”這一概念;2011年,麥肯錫全球研究院發布《大數據:下一個創新、競爭和生產力的前沿》,并指出“大數據時代已經到來”。與此同時,世界各國政府相繼發布大數據相關的綱領性文件,著重關注大數據的研究和戰略發展。
我國高度重視大數據的研究和發展。2014年,“大數據”首次被寫入政府工作報告,緊接著,政府出臺了一系列大數據相關政策文件、法律法規和發展規劃,并將數據確定為生產要素之一,強調要加快培育數據要素市場。“十四五”規劃也對大數據的發展做出總體部署,并提出突出數據在數字經濟中的關鍵作用、加強數據要素市場規則建設、重視大數據相關基礎設施建設,著力推動大數據產業步入“集成創新、快速發展、深度應用、結構優化”的高質量發展新階段。
上海市積極貫徹落實國家大數據戰略,并在2016年發布《上海市大數據發展實施意見》,著力營造大數據產業生態環境。據統計,“十三五”期間,上海市大數據產業核心企業已突破900家,核心產業的規模高達2300億元,平均增長幅度遠超全市平均水平。2021年11月,上海市人民代表大會常務委員會宣布通過《上海市數據條例》,這標志著上海市正式邁入數據驅動創新發展的新階段。隨后,上海市先后組建成立上海數據交易所和上海數據集團有限公司,力爭加速進軍數據要素市場。
為了更好地服務國家大數據戰略,賦能上海市數字化轉型發展,規劃建設大數據基礎設施勢在必行。中國工程院院士鄔江興提出,大數據試驗場是面向當前技術無法解決的大數據傳輸、管理、計算和分析等問題而設計的大數據技術與產品的創新和試驗平臺。作為以提供大數據相關服務為主的公共平臺,大數據試驗場不僅具備大規模實驗數據生成、大數據場景構建、大數據存儲計算等功能,還兼具支撐數據科學探索與實驗、大數據技術試驗與認證等作用。簡而言之,大數據試驗場的本質是用于數據科學理論與共性技術創新的重大基礎設施。

2014年,鄔江興院士和復旦大學的朱揚勇教授共同提出“大數據試驗場”的設想,試圖通過建設公共屬性的大數據技術研發和試驗平臺,解決大數據關鍵技術突破和高端應用問題。2016年起,復旦大學啟動大數據試驗場先導項目,積極推動大數據試驗場的規劃設計和平臺申報。同年12月,復旦大學和上海交通大學共同發起,聯合近30家高校、企業、科研院所成立了“大數據試驗場聯盟”,旨在進一步推動上海大數據試驗場的建設。2019年12月,大數據試驗場建設方案通過專家論證和審定立項后,被納入上海市研發與轉化功能型平臺布局工作,并于2020年得到上海市和靜安區兩級政府的共同支持,成功落地靜安區市北高新園區啟動建設。
上海市大數據試驗場依托于研發與轉化功能型平臺建設,面向大數據產業創新發展需求,著力解決數據、技術、資金和人才等瓶頸問題,針對大數據產業鏈各環節的技術研發與功能轉化提供高質量、專業化的科技服務。同時,上海市大數據試驗場也為政府治理創新、科研理論創新、民生服務創新和產業發展創新提供了試驗和推演場所,充當著連接政府、企業、資本、技術、數據資源的橋梁,不斷增強大數據產業的創新策源能力。
上海市大數據試驗場建成后,將從五個方面發揮效用:一是支撐科學研究,為重大科學理論和方法的探索提供大數據試驗場地;二是支撐產業創新,持續為大數據產業鏈中各環節的技術研發與功能轉化提供專業服務,促進大數據產業集聚發展;三是支撐技術創新,開展大數據共性關鍵技術研究和應用產品攻關,支持大數據技術升級迭代;四是支撐創新創業,發揮大數據資源優勢和公共服務平臺功能,賦能大數據產業投身各類創新創業活動;五是支撐人才培養,源源不斷地為社會輸送多層次大數據專業技術人才。
上海市大數據試驗場主要由大數據平臺系統、數據中心機房、數據資源池、計算資源池等新型架構體系構成。其運行原理是:基于DMZ(隔離區)機制,匯集部分原始數據和樣本數據,通過數據發生器等工具來批量生成仿真數據,從而滿足大規模試驗對數據資源的需求;搭建大規模數據存儲系統,實現10PB的數據存儲能力。上海市大數據試驗場功能完備、開發面廣,既有開發智能化、人本化的大數據分析平臺,也有支撐上千人同時分析P級數據的試驗平臺。上海市大數據試驗場同時面向多個不同語義層次、涉及不同領域的專業知識,既面向多來源的大數據訪問控制和隱私保護系統,也提供面向大數據產業、技術、科研等不同類型的試驗環境和應用模板,以及面向特定試驗目標的基礎數據、算法、模型和評測標準。
上海市大數據試驗場基于大數據公共服務平臺的建設形態,提供數據資源類、數據研發類、數據服務類等七類基礎服務,加快構建從技術研發到成果轉化的大數據全產業鏈創新服務體系。同時,上海市大數據試驗場主要通過以下六大功能子平臺的建設來滿足用戶各類服務需求。①數據資源服務子平臺:實現數據搜集功能,生成試驗數據資源,為大數據試驗提供數據支撐。②數據試驗服務子平臺:為用戶提供系統試驗、模型試驗、數據技術開發等一站式服務。③測試認證服務子平臺:研究大數據技術及管理標準,構建大數據技術成果認證標準體系,提供大數據產品的測試驗證等服務。④人才培養服務子平臺:提供大數據技術和業務培訓,輸出專業技能人才。⑤開源社區服務子平臺:吸引國內外研發力量,實現技術共享,完善大數據產業生態鏈。⑥成果轉化服務子平臺:實現對大數據技術與應用創新企業的成果轉化,加快推進大數據產業化。
(1)推動數據科學高水平研究。現階段,大數據正向著數據治理、數據驅動的方向演變,數據科學的研究主題主要包括數據科學理論和方法的基礎研究,以及人工智能、云計算等高端應用研究。在大數據試驗場的支持下,數據科學領域的研究者可以開展包括數學基礎、計算基礎和數據基礎等數據科學基礎的理論研究,以及多學科交叉融合的大數據技術及應用研究,從而推動大數據關鍵技術創新突破,有效提升數據科學研究水平。
(2)助力數字經濟高質量發展。當前,我國正處于從工業經濟向以數據資源為關鍵要素的數字經濟轉型的關鍵時期。上海市積極推動數字技術與實體經濟深度融合,布局培育綠色低碳、智能終端、元宇宙等新賽道,全面提升數字消費能級,打造世界級數字產業集群。數字經濟及大數據產業的發展,正在深刻改變生產生活方式和社會治理方式,因此,對以大數據核心技術為主的數字技術進行研發與推廣應用顯得尤為重要。未來,上海市大數據試驗場將全面發揮大數據領域協同研發平臺的功能,夯實大數據產業的基礎,著力推動大數據與人工智能、區塊鏈、數字孿生等新一代信息技術的集成創新,助力構建數字技術創新體系。
(3)賦能上海市數字化轉型。上海市正在按照“整體性轉變、全方位賦能、革命性重塑”的原則,全面推進城市經濟、生活、治理等的數字化轉型。上海市基于“全方位賦能城市迭代進化”的定位,深化利用數據的生產力和治理力,為經濟社會的發展注入新動能。上海市大數據試驗場作為基礎設施,重點圍繞大數據與各行業的融合應用,致力于提升數據技術服務水平,以數據驅動來實現城市經濟發展、城市治理優化、生活品質提升等城市數字化轉型目標。
站在中華民族偉大復興戰略的角度進行分析,推進大數據產業高質量發展,培育壯大數字經濟的可持續發展,直接關系到“十四五”時期經濟社會發展的全局走向。上海市大數據試驗場立足國家重大戰略需求,堅持數據創新驅動發展,為上海市打造具有世界影響力的科技創新中心和國際化數字之都提供助力。