茶洪旺 付偉 鄭婷婷
中國數據產業還處于起步階段,在快速發展的同時,仍然面臨五個方面的問題和挑戰。
部分重要數據規則尚未建立
數據權屬是運用市場手段配置數據資源和提高數據使用效率的基礎,也是當前制約數據收集、交易和利用等關鍵環節發展的核心問題。數據權屬不清,一方面導致數據擁有方不愿或不敢把數據拿出來交易和共享,另一方面基于原始的用戶數據,在去除個人身份屬性之后的數據產權的歸屬問題不明確,直接制約了數據交易和流動的發展步伐,也嚴重掣肘了數據產業的發展。《促進大數據發展行動綱要》明確提出要加快法規制度建設,研究推動數據資源權益相關立法工作。但是,目前數據立法工作進展非常緩慢,不利于產業持續健康發展。
由于既缺乏政府監管層面對數據利用規則的原則性規定,也缺少行業組織針對特殊領域的數據交易、處理、共享、利用方面的規則和指引,企業普遍不愿與外界共享數據、交易數據,數據相關的業務模式和商業模式創新方面仍然會面臨一系列問題。與之對應的是,數據領域非常容易成為灰色地帶,地下數據交易非常猖獗,部分企業和個人單純追求經濟利益鋌而走險,大量收集和濫用個人數據,甚至是敏感數據,或供自己利用牟利,或進行出售販賣牟利,完全不顧及個人隱私保護和數據所有者的權益保護等問題。
我國數據保護相關的法律法規仍不健全,政府信息資源開放共享制度仍然缺位,適應數據產業發展的個人信息保護、數據資產保護等制度體系尚未建立。部分廠商尚未意識到數據的重要性,缺乏保護數據資源的意識,而技術能力的不足也使得相關廠商無法真正有效地廣泛存儲、利用和保護屬于自己的數據。同時,對侵犯數據隱私和安全的相關行為處罰不足,包括攜程、支付寶、天涯網、12306等眾多互聯網企業發生了多起重大的數據泄露事件,但是對涉事企業的處罰力度過輕。
核心技術研發投入不足
目前,我國數據產業在結構上仍以數據應用層為主,企業仍以中小企業為主,鮮有營業收入超過10億元的平臺型生態企業。參與工信部2018年大數據優秀產品和應用解決方案征集活動的企業中,大數據業務收入低于1000萬元的達205家,占比超40%,僅8家企業大數據業務收入超過10億元,而146家大數據業務收入占比超過90%的企業中,研發投入共計14.76億元,占全部企業研發投入的比重僅為1.99%。
此外,中國數據產業生態建設方面也面臨挑戰。首先,缺乏掌握核心技術的企業。本土數據企業技術積累薄弱,在底層架構和核心算法方面不具備優勢。其次,數據產業鏈構建不完整。數據產業的發展需要從底層芯片到基礎軟件再到應用分析軟件等信息產業全產業鏈的支撐,目前國內無論是新型計算平臺、分布式計算架構,還是大數據處理、分析和呈現方面與國外均存在較大差距,難以滿足各行各業數據應用需求。最后,缺乏主導生態建設的企業。我國關鍵數據技術的創新和開源生態建設方面還處于跟隨狀態,相關企業主要基于已有的開源平臺進行優化和構建適合自身業務需求的數據平臺,缺乏構建產業生態的技術實力和資金支持。
數據產業創新要素投入不足
數據產業是典型的知識密集型、資本密集型的新興產業,人才、資本等創新要素投入是驅動產業發展的核心動力。數據產業面臨創新要素投入不足,要素投入帶來的市場績效水平不高的問題。
數據產業發展需要大量的復合型人才,但目前國內數據人才隊伍不足,遠不能滿足發展需要,尤其是缺乏既熟悉行業業務需求,又掌握大數據技術與管理的綜合型人才。
雖然全社會融資和投資規模都非常可觀,總的資本要素相對充足,但是流入數據產業領域的資本總量仍然較少,主要以風險投資機構、大中型企業、公開市場發行股份等為主。此外,中國數據產業投融資主要集中在數據應用層,投資回報周期較長的數據資源層和投資風險較大的數據技術層獲得較大數額的投資仍然非常困難。一方面,由于我國的數據技術原始創新能力不足,數據企業之間的競爭處于相互壟斷數據資源,利用價格戰爭奪數據應用市場階段,但是受制于企業成本不斷增加,提供的數據應用服務效果差強人意,使得大量的創新要素投入并沒有產生應有的市場績效。另一方面,數據資源規模和數據技術應用深度尚未達到明顯提升企業市場績效的拐點,因此還顯示出績效水平低于投入成本。應該看到各類創新資源要素的投入所產生的市場效益還未顯現。
地方政府存在急于求成心態
一些地方政府急于求成的心態比較嚴重,“囫圇吞棗”出政策、上項目。通過對比發現,各省市區和地級市層面的政策規劃和措施同質化非常嚴重,沒有充分考慮地方產業實際,也沒有考慮區域資源稟賦及周邊環境等因素,部分文件只是換個名稱而已。通過近幾年的宣傳報道和炒作,數據作為重要產業已是共識。在政績和輿論的雙重壓力下,快速出臺各類數據產業的促進政策文件是政府優先考慮的方式之一。以數據交易所為例,自2015年貴陽大數據交易所成立以來,短期內政府主導的數據交易所如雨后春筍般涌現出來,上海數據交易中心、華東江蘇大數據交易平臺、安徽淮南數海大數據交易平臺、浙江大數據交易中心、哈爾濱數據交易中心、錢塘江大數據交易中心、北京大數據交易支撐平臺、陜西省大數據交易所等紛紛成立。更有甚者,僅武漢就有三個數據交易所,即武漢長江數據交易所、東湖大數據交易中心、華中數據交易所。
實際上,流動是數據的天然屬性,數據流動的自由度越高,越有助于數據產業和數字經濟發展。地方政府采取分裂割據的方式新建數據交易所,必然會對數據自由流動造成阻礙,最終影響數據產業的發展。
數據產業風險防控能力不足
數據安全問題始終是國家關注的重點,安全問題不解決數據產業就難以獲得快速發展。總體來看,中國數據產業面臨四個方面的安全問題。
一是數據安全保障滯后于發展步伐,全方位覆蓋國家數據安全、數據跨境流動管理、企業數據資產管理、數據權益歸屬、數據流通交易、個人信息保護等方面的數據安全保障體系尚不健全。
二是數據基礎設施頻受攻擊,數據丟失及泄露風險加大。Hadoop、Spark等開源架構在設計之初并未充分考慮安全和隱私保護的需求,其安全機制往往偏簡單和粗放。隨著數據應用走向深入,觸及的行業和領域越來越廣,大數據基礎設施在安全技術和標準等方面的不足已經逐漸凸顯出來。
三是新型網絡威脅層出不窮,黑客和竊密活動十分猖獗。國家互聯網應急中心的數據顯示,2017年我國監測獲得的木馬或僵尸程序控制服務器IP地址總數為97300個,其中境外木馬或僵尸程序控制服務器IP地址數量為49957個,占比51.3%,仿冒我國境內網站的釣魚頁面49493個,涉及IP地址25048個,其中85.4%位于境外。
可以預見,未來生產生活中大量應用的信息系統和互聯網基礎設施仍可能出現更多嚴重的漏洞,數據平臺和應用面臨巨大的風險。
四是數據資源使用需求強烈,開放共享與安全保護矛盾凸顯。開放和共享是發展數據產業的必然要求,然而脫離安全保護的開放和共享是不現實和危險的。當數據應用涉及到多方數據的開放和共享時,安全問題就復雜化了,特別是當其中還涉及到用戶隱私數據和國計民生數據時。如何平衡開放共享的需求和安全保護的需求,這既是一個技術問題也是一個政策問題。