顧釗銓,張 尼,李樹棟,仇 晶,殷麗華,田志宏
(1. 廣州大學 網絡空間先進技術研究院,廣東 廣州 510006; 2. 中國電子信息產業集團有限公司第六研究所,北京 102209)
在大數據時代,掌握數據即意味著擁有財富。阿里巴巴多年前就通過買賣商品收集數據,通過挖掘數據中有價值的信息進行持續盈利,并表示“數據是阿里最值錢的財富”。隨著科技的不斷發展和信息的共享流通,越來越多的企業開始注重數據可能帶來的價值,并致力于從數據中挖掘信息,提升企業綜合實力。
現如今,大數據已逐步成為世界各國作為國家創新戰略、國家安全戰略、國家產業發展戰略以及國家信息網絡安全戰略的重要研究方向。全世界各國政府、企業及研究機構等各司其職,制定促進大數據產業發展的政策,開發數據挖掘、數據服務等創造價值的產品,研究大數據底層框架和關鍵技術等,共同促進大數據產業的快速發展。

圖1 大數據產業生態劃分
《大數據產業發展規劃(2016-2020年)》[1]中指出,大數據產業指以數據生產、采集、存儲、加工、分析、服務為主的相關經濟活動,包括數據資源建設、大數據軟硬件產品的開發、銷售和租賃活動以及相關信息技術服務。本文認為,大數據產業貫穿數據產生、采集、存儲、加工、分析、利用、服務等各個環節,并以軟硬件產品開發、數據加工和分析產品開發、數據交易和共享平臺、數據的信息技術服務等作為主要經濟活動。
數據越來越成為國家基礎性戰略資源,成為推動社會進步、經濟轉型發展的新動力。從國家層面而言,推動大數據產業蓬勃發展能更加有利于國家掌控和運用大數據提升國家綜合國力,因此各國政府紛紛將大數據及大數據產業發展規劃作為國家的發展戰略之一,不僅出臺大數據產業發展政策,制定相關法律法規,完善管理規范和措施,還通過稅收優惠、人才獎勵等多種渠道鼓勵更多人才參與大數據產業發展、鼓勵更多初創的大數據企業快速成長等。
大數據推動了社會生產要素的優化共享、資源集成整合、協作開發、高效利用,對傳統的生產方式產生改革,能顯著提升行業水平和效率,并持續激發創新商業模式等。近年來,大數據產業鏈涵蓋了數據生產、數據采集、高效存儲、數據管理、數據挖掘和分析、數據交易和共享、數據應用和服務等,產業鏈日趨成熟和完善。大數據產業正逐漸成為新的經濟增長點,必將對信息產業格局發展趨勢產生重要影響。
大數據產業圍繞數據資源,將產業的數據經過采集、存儲、加工、分析、利用及服務,最終實現數據轉變為價值。大數據產業鏈的成熟和完善,為大數據產業提供了良好的生態環境。
大數據產業生態主要包括數據產生、采集、存儲、加工、分析、利用、服務等各個環節,中國電子信息產業發展研究院、賽迪智庫等聯合發布的《中國大數據產業生態地圖》[2]將大數據產業生態分為:基礎支撐產業、融合應用產業和數據服務產業。其中基礎支撐產業主要針對數據存儲、計算、可視化等數據基礎處理;融合應用產業包含工業大數據、政務大數據、交通大數據、金融大數據等多個行業大數據的應用;數據服務產業則包含數據采集、交易及增值服務等。
從數據資源的角度劃分大數據產業生態,如圖1所示,大數據產業生態主要包括:數據資源建設產業、數據處理和分析產業、數據應用和服務產業。
(1)數據資源建設產業包括數據采集、數據整合、數據集成、數據存儲等過程,典型的數字資源企業包括電商(阿里巴巴、京東等)、社交平臺(騰訊、新浪等)、搜索平臺(百度、搜狐等);數據存儲平臺包括華為、阿里云、浪潮等大型數據中心和云平臺。
(2)數據處理和分析產業主要包含數據管理、加工、分析、挖掘、交易等過程。其中平臺級包括數據管理平臺、數據處理平臺、數據交易平臺和數據分析平臺等,工具級包括數據加工工具、數據分析工具、數據挖掘工具和數據可視化工具等。典型企業包括talkingdata、百分點、科大訊飛、出門問問、數字冰雹等;典型的數據交易中心包括貴陽大數據交易所、長江大數據交易中心、東湖大數據交易中心等。
(3)數據應用和服務產業包括大數據在不同行業中的應用,如電子商務、智慧物流、智慧交通、智能制造、大數據醫療健康、數據金融、虛擬現實、在線教育、智慧旅游、視頻娛樂等不同行業。典型企業和產品包括:淘寶、順豐、京東金融、陸金所、滴滴、海爾、攜程、途牛等。企業結合大數據挖掘和分析數據蘊含的內在價值,并進一步研發大數據驅動的產品,提升自身價值。
我國大數據產業蓬勃發展,不僅政府提供各種優越的政策環境,各大投資機構也大力支持大數據產業的高速發展,當前大數據產業的環境十分優越。
在產業政策上,我國出臺了一系列促進大數據產業發展的政策法規,通過制定大數據戰略和行動計劃,培育大數據產業生態體系。
2015年,國務院印發《促進大數據發展行動綱要》[3],系統地部署了大數據的發展工作,其中包括 “加快政府數據開放共享”、“健全大數據安全保障體系,強化安全支撐”等。2016年,國務院繼續發布《“十三五”國家信息化規劃》[4],并在規劃中明確指出“實施大數據安全保障工程,加強數據資源在采集、傳輸、存儲、使用和開放等環節的安全保護”。該規劃的提出使得大數據產業發展開始致力于大數據采集、清洗、存儲、分析、發掘、可視化、安全與隱私保護等關鍵技術攻關。2016年4月,發改委通過《促進大數據發展三年工作方案(2016-2018)》和《促進大數據發展2016年工作要點》,規劃了大數據產業發展路線圖。為了推進政府數據開放共享,2016年9月,國務院又發布了《政務信息資源共享管理暫行辦法》,進一步鼓勵政府數據開放,并用來深入挖掘創造社會價值。
2016年12月,工信部印發《大數據產業發展規劃(2016-2020年)》[1],提出要在“十三五”期間大力推動我國大數據產業持續健康發展,貫徹國家大數據戰略,規劃指出目前我國信息化積累了豐富的數據資源,大數據技術創新也取得明顯突破,大數據產業體系初具雛形,大數據產業支撐能力日益增強,并以創新驅動、應用引領、開放共享、統籌協調、安全規范作為大數據產業發展原則,把強化大數據技術產品研發、深化工業大數據創新應用、促進行業大數據應用發展、加快大數據產業主體培育、推進大數據標準體系建設、完善大數據產業支撐體系、提升大數據安全保障能力作為重大任務和重大工程。
除了國家政策扶持,地方政府也紛紛出臺相關政策加快大數據產業布局,突出產業集群效應。例如貴州省貴陽市先后出臺《貴陽大數據戰略行動實施方案》、《貴陽市大數據產業發展“十三五”規劃》、《貴州省大數據發展應用促進條例》,建立國家發展大數據安全技術和產業的試驗場,打造首個國家級大數據產業集聚示范區和大數據安全產業園,培育和壯大戰略性新興產業,全力推動大數據產業的發展,促進經濟發展。廣東省出臺《廣東省促進大數據發展行動計劃(2016-2020年)》等,旨在打造全國大數據應用先導區和大數據創業創新集聚區,搶占大數據產業發展高地,建立具有國際競爭力的國家大數據綜合試驗區。
不僅如此,全國各地政府相繼成立大數據管理部門,統籌數據管理和應用;北京、上海、深圳等多個省(直轄市)市引導建設了大數據產業聯盟,推進大數據產業生態體系的建設;多個省市建立大數據交易平臺,促進大數據共享和流通。
近年來大數據企業數量急劇增長,從中國信通院研發的中國大數據人工智能產業分析平臺[5]可以看出,北京地區、長三角、珠三角及成渝經濟圈是大數據企業熱度最高的區域,其中近七成大數據企業注冊于北上廣深四大城市。大數據滲透各行各業,其中集中在金融、醫療、社交、交通等行業居多。
大數據企業有著十分良好的投融資環境,2012~2016年五年內,大數據領域投融資事件超過1 600件,總金額超1 200億元,其中以大數據早期企業為主,天使輪及A輪融資比例超70%,B輪和C輪融資企業較少,而少量成熟的大數據企業正經歷PE階段,逐步上市。而這些企業的融資估值普遍很高,平均估算A輪融資估值均值在2億元左右,B輪融資估值均值5億元左右,C輪融資估值均值能達到10億元。通過和其他行業融資情況相對比可以明顯看出大數據企業的融資環境很好,投資公司對相關企業發展前景十分看好。各大IT公司也逐步通過并購等方式進行技術整合,同時也有很多大型企業依靠自身研發實力紛紛推出自己的大數據產品。
在大數據企業中,以數據分析、數據應用為主的企業備受關注。如數據分析中的文本分析、日志分析、商業智能都能成為投融資關注焦點;數據應用中的廣告營銷、運營優化、風險管控等也是投資熱點。近年來,大數據金融行業融資火爆,包括量化分析、銀行征信、風控管理等都是大數據金融行業中的關注點;隨著人工智能技術的發展,大數據驅動的人工智能企業越來越多,融資額度也越來越高,已經成為一個巨大的投資風口。
雖然大數據產業蓬勃發展,但是受限于市場機制、數據共享的價值鴻溝、數據隱私等多種問題,目前大數據產業發展還面臨著諸多挑戰。
雖然國內多個省市建立了大數據交易中心,但是數據擁有者存在價值認知的鴻溝,很多數據擁有者不放心讓自身的數據進行交易和流通,擔心泄露個人隱私和企業機密;同時,社會普遍還并未形成數據交易的傳統,大數據交易市場需要一個用戶培育的階段。
在大數據交易過程中,現有數據付費模式為先付費、一次性付費、按次付費等,目前大數據企業盈利能力整體偏弱,數據變現存在難度,在這樣的付費模式下,大數據企業很難購買大量的數據進行分析和挖掘, 這也是導致數據交易不暢的原因之一。
數據交易過程中數據所屬權很難界定,當同樣的數據被多次交易時,如何充分保證數據擁有者的利益也是目前大數據交易市場面臨的難題和挑戰。
數據產生于各行各業中,綜合不同行業的數據能促進各行業業務的進一步開展。然后,目前行業大數據流通性較差,行業數據處于分隔狀態。
對于部分大型企業,其自身能夠實現數據業務閉環,因此公開數據資源的動力不足,導致很多小型企業很難獲取其數據資源;其次,不同行業的數據標準不統一,很多行業內的數據格式、質量差異都很大,而數據治理的成本十分昂貴,導致行業數據統一化管理難度加大;另外,不同領域、不同行業數據關聯難度很大,在出臺數據隱私保護相關政策以后,如何根據行業間的非敏感信息對用戶數據進行關聯是跨行業數據流通急需解決的難題。
數據共享和隱私保護是數據利用的兩個對立面。數據共享是為了充分結合各方面的數據,挖掘數據背后潛在的價值,而在這個過程中勢必會涉及分析出用戶、企業甚至國家相關的隱私信息,從而導致隱私信息的泄露。因此,各國紛紛制定了數據隱私保護政策法規,我國頒布了《網絡安全法》等進行數據隱私保護,上海大數據交易中心頒布的《個人數據保護》、《數據流通禁止清單》,信標委發布的《個人信息去標識化指南》等都強調對于數據隱私的保護。
從企業發展層面而言,企業間的合作必然牽扯到數據合作。如果對數據僅進行脫敏處理,合作企業亦能通過數據的關聯性分析出用戶敏感信息,從而出現隱私風險;如果企業對數據進行過度處理,共享的數據
存在的有用價值就大大降低,制約企業的深入合作和高速發展。因此,如何在數據共享和隱私保護中進行政策法規的權衡、如何進行關鍵技術的研發是影響大數據產業發展的重大挑戰。
隨著數據的積累、關鍵技術的研發、國家政策的大力支持,大數據產業擁有優越的發展環境,產業生態也逐漸形成。然而,目前大數據產業在數據交易、共享、流通、隱私保護等重要過程中面臨難題和挑戰,必須積極應對,高度重視,創新大數據關鍵技術研發,加快推進大數據產業蓬勃發展。
參考文獻
[1] 中國工業和信息化部.大數據產業發展規劃(2016-2020年)[Z].2016.
[2] 中國電子信息產業發展研究院,《軟件和集成電路》雜志社,賽迪顧問股份有限公司.中國大數據產業生態地圖[Z].2016.
[3] 國務院.促進大數據發展行動綱要[Z].2015.
[4] 國務院.“十三五”國家信息化規劃[Z].2016.
[5] 中國信通院.大數據人工智能產業分析平臺[EB/OL].http://www.allindata.cn/.