秦鋒劍
我主要從三個方面談一下綠灣在數據治理方面的一些思考,一是當前政務大數據面臨的機遇與挑戰,二是基于第三代知識圖譜的政務數據治理解決方案,三是綠灣智子應用案例。
談到大數據方面的一些挑戰,我認為根源在于大家對大數據的理解不一致,也不是很透徹。很多時候我們盲目去做一個系統,覺得收集很多數據就是在做大數據業務,而具體到數據的類別、質量以及數據的應用卻沒有深入的思考。特別是政務相關的數據,數據量不僅大而且數據結構復雜,再加上收集的數據沒有統一的標準,有效的分析更無從談起,那么領導看了這些雜亂無章的數據也無法輔助決策。
國務院印發的《促進大數據發展行動綱要》中提到“大數據是以容量大、類型多、存取速度快、應用價值高為主要特征的數據集合,正快速發展為對數量巨大、來源分散、格式多樣的數據進行采集、存儲和關聯分析,從中發現新知識、創造新價值、提升新能力的新一代信息技術和服務業態。”這里面提到要做數據的關聯分析,為什么呢?如果我們只是根據一些數據做一個統計分析,生成一個報告,幾張圖就能說明問題。那這個本身不是真正地挖掘大數據價值,因為并沒有通過關聯分析,發現新的知識,形成啟發。可能常識性的知識也可以告訴我們這些結果。我們認為,利用數據要發現新知識、創造新價值、提升新能力,這樣才是一個好的大數據應用。……