黃益平(北京大學國家發展研究院副院長)
如果標準卡得太嚴,大數據分析也就無從做起。
周小川提出用安全算法手段克服國際間數據難以完全自由流動的矛盾,他的話可以理解為“數據不出境,但分析結果可以出境”。這個思路對我有很大的啟示。
當前歐美國家正積極推動國際數字貿易規則的制訂,提出了數據跨境自由流動的主張,但這對包括中國在內的其他一些國家來說構成了挑戰。如果基于國家安全等考慮做不到數據自由流動,就可能會對這些國家參與國際數字貿易形成制約。周小川的思路為化解這個矛盾提供了一個解決方案,就是用分析結果的流動替代原始數據的流動。
現實中大數據應用的成功案例已經非常多,包括產品的精準營銷、服務的個性化方案以及信用風險的有效評估等。大數據分析可以幫助提高經濟效率,改善用戶體驗,擴大經營規模,促進經濟與社會的創新與發展。大數據已經成為當前經濟中十分重要的生產要素。
如果大數據可以共享,大數據分析的紅利就會更大??赡芫褪浅鲇谶@個考慮,最近幾年政府在一些領域推動數據共享。設立幾家大數據征信公司的目的,應該就是為了讓更多的商業銀行利用大數據信用風險評估的手段。不過,作為特殊的生產要素,并非所有的大數據都是可以拿出來共享的。在這個前提下如何達成數據共享的效果,確實需要創新性的思考。
討論數據共享,首先要面對數據權屬的問題,即數據歸誰所有?傳統生產要素如資本和土地的有效利用都是基于一個前提,就是清晰地界定產權。但這個做法很難簡單地套用到大數據,直接的原因是一些大數據的權屬很難被清晰地界定。比如用戶在平臺上點外賣、看短視頻的數據,既包含個人的一些信息,但同時也有平臺支持的線上活動。顯然,在這個實例中,要在用戶和平臺之間劃清楚數據的所有權界線,難度非常大。一個合理的解決方案是涉及個人特性的數據歸個人所有,用戶在平臺上活動留下的數字足跡可以歸個人和平臺共同擁有,與個人基本上沒有關系的數據則可以歸平臺所有。
在現實生活中,數據確權還面臨一個挑戰,就是要在權益保護與使用效率之間取得一個平衡。中國和歐盟的實踐提供了兩個對應的典型案例。過去中國缺乏有效的數據治理政策,既沒有確權,保護也不足。這樣,一方面,利用大數據分析的創新活動十分活躍,但另一方面,各種違規、違法的行為也十分普遍。因此,最近幾年政府采取了許多措施,加大數據保護的力度。歐盟在數據保護方面一直做得比較早、也比較好,美中不足是由于限制比較多,基于大數據分析的經濟創新相對不活躍。
討論數據共享還要面對適合性的問題,什么數據可以共享、什么數據不能共享?從原則上說,起碼有三類數據不能共享:個人隱私、商業機密、國家安全。個人的姓名、年齡、性別、教育水平、家庭住址、聯系方式等均屬于個人隱私,應該明確歸屬于個人所有,當然也不能輕易分享。業內常見的做法是對行為與交易數據做脫敏處理,分析師無法追溯到具體的個人或者人群。就這些大的原則達成共識并不難,難的是在執行過程中如何把握。以國家安全為例,如果范圍劃得寬泛一些,那也許可以認定絕大部分數據都有敏感性,即便像公眾打車、叫外賣甚至看短視頻這樣的數據,也不排除能分析出一些人群行為方式的變化。所以,如何恰當地把握這個度,同樣是一個極大的考驗。如果標準設定得不夠嚴格,可能會造成不少隱患。但如果標準卡得太嚴,大數據分析也就無從做起。