張旭東
參與“數據二十條”起草的過程,我的感受有三點:第一,理性務實地淡化所有權,強調使用權,聚焦數據使用權流通,創造性提出建立數據資源持有權、數據加工使用權、數據產品經營權“三權分置”的數據產權制度框架,構建中國特色數據產權制度體系。第二,關注流通。交易是流通的一種特殊形式,它的特征就是以貨幣為對價,劃撥、共享、開放、贈與、繼承,這都是數據在流通,交易只是一種特殊形式。第三,強調安全可控。安全是信息安全,要保障信息安全,可控是安全的另外一個前提,凡是不可控的東西肯定不安全,可控的東西才有安全的基礎,所以數據使用可控是數據流通安全的根本保障。
數據流通的本質是什么?過去我們講流通,我把我的數據拷貝一份給你或者給你開個API接口你來調用就行,所以傳統明文數據流通就是流通數據本身,明文數據的流通有兩大核心障礙:第一,在流通使用中暴露信息并喪失數據價值,你把這份數據拷貝給人家了,或者我在使用當中把API的數據留存下來了,大家都有了。數據的價值在于它所承載的信息的不對稱性,越不對稱,使用價值越大,數據的價格越高。所以明文數據流通的方式本質上是違背經濟學理論的,經濟學理論的定價根本依據是稀缺性,所以明文數據不能定價,它違背了稀缺性原則。第二,使用不可控,無法厘清數據使用的“責、權、利”,我把數據給你了,你復制成多少份?交給誰?我無法控制;數據被用于什么目的,以什么方式,用多少次我也不知道;萬一某人在某個環節把數據用到了妨礙他人、妨礙社會、危害國家的目的上去了,根據《數據安全法》,所有人都有數據安全責任。怎么厘清?數據流通的問題在于供應側不愿流通、不會流通、不敢流通。其中,不愿流通是經濟問題,可以通過經濟手段來補償和平衡;不會流通,我們有生態、有技術、有專業化服務;怎么解決不敢流通問題,不敢流通問題的本質在于使用不可控。
數據流通需要樹立新的數據安全觀念,也就是使用安全。過去認為數據安全很簡單,數據在我這兒,就在我的域內使用,在我的控制范圍內使用,目的就是不讓人家看見,不讓人家復制拿走,不讓別人使用,傳統的數據安全本質就是不流通。現在說數據要流通了,在我域內的數據拿出去給別人用還安全嗎?在傳統觀念中肯定不安全,不安全那還拿出去嗎?所以很多做過分類分級安全評估的,就是以保管安全為根本宗旨,當然還有傳輸安全。當數據要流通起來,跨域使用的時候,擔心什么?除了暴露信息,那就是拿去干嗎,會出事兒嗎?會牽涉到我嗎?這才是不敢的原因。數據流通就是多方多元多種數據的協同計算,它能產生巨大的價值,不是加法,可能也不是乘法,有的地方可能是指數級,這才是它的真正價值。它跟開“數據化工廠”沒有任何區別,多種原料(數據)在一定的配方和反映條件下(算法)產生化合反應(融合計算),這個過程有可能對他人、社會和國家造成危害或重大危險,因此數據監管勢在必行。要建立評估和管控“數據化合反應”的機制,明確數據使用安全責任。管控“數據化合反應”的根本手段就是管控數據融合計算的目的和方式。
隱私保護計算技術現在很熱門,可用不可見,這個詞也是我們2018年提出來的,但“可用不可見”只做到了在流通中保護數據信息不暴露,它對使用目的是沒有辦法控制的。它保障在數據協同計算也就是在流通中的信息安全,不泄露,解決了明文數據流通的第一個問題——暴露信息,在技術上叫關閉信道,即關閉信息通道,在這個基礎上,利用計算合約和區塊鏈等技術,通過授權和存證,我們可以記錄和管控數據的具體使用、目的、方式和次數,做到“使用可控可計量”,也就是數據使用可控。數據使用可控是數據流通安全的核心保障,做不到這個,安全是不可靠的,凡是不可控的東西一定不安全,可控的東西才有可能安全,道理就在這兒。只有做到數據“可用不可見”,“使用可控可計量”才能厘清數據流通使用的責、權、利,從根本上解決不敢流通的問題,解決數據供給側的責任問題,打開數據流通的源頭大門。同時它也是數據監管的根本抓手,數據監管,監什么,管什么?管的就是數據流通使用的目的、方式和次數,所以合規合在這兒,合規認定定在這兒。
這件事是可以做到的,而且我們已經做到了,特別是在一些重要部門的高敏感、高價值數據使用上。當然它是有成本的,以算力為成本。場景價值大,數據敏感度高,監管要求高,這三個條件下會有不同的數據安全程度要求。安全度是一個梯度,安全要求越高,保密程度越高,對算力的要求越高。安全梯度是可以調下來的,在技術上已經不是一件難事,已經實現了。隨著社會應用的迅速擴大,它的成本,基礎設施投資效應會很明顯。所以我們各級政府和大數據公司,需要建設數據流通的基礎設施。
[作者為華控清交信息科技(北京)有限公司董事長]