胡小明
打開智慧城市的宣傳滿是數據化的內容,除了大數據就是數據共享、數據重要、重要、最重要。固然數據在智慧城市建設中是重要的,但是一切重要的理念都有邊界,講過頭了就會適得其反。數據的作用被捧上天,直接后果是對數據系統的盲目投資,無爭論、無批評的投資是浪費之源。
總是說數據共享能帶來巨大效益,大數據應用能帶來科學決策,但是很難看到實例,更找不到統計數據,找一個大數據決策實現大效益的例子難上加難,而大數據浪費的例子卻比比皆是。
大數據應用前景是輝煌的,但是輝煌的前景要靠一步一步如履薄冰地精心積累,不是靠“人有多大膽地有多大產”的邏輯實現的。數據服務目的是推動政府管理的精細化,數據精細化是管理精細化的基石,不能用粗放的習慣去管理以精細化為目標的數據應用,數據應用必須回歸冷靜。
剔除脫離實際的數據應用目標
期望過高必然會帶來問題
數據應用目標一定要實際,不實際的目標是造成數據服務失敗的主要原因。信息共享之所以成為電子政務的難題就是高估了信息共享的效益,造成投資過大,實際應用遠遠達不到預期目標,如果目標實際一些,做能夠看得清的數據共享,投資會小得多,也不會因長期不見效益倍受指責。
信息技術并不能保證效益
擁有先進的信息技術并不等于擁有效益,效益的產生需要一連串的配合,新技術只是效益鏈中的一個環節。沒有效益鏈整體的流暢配合無法形成效益,有效的數據應用時常需要業務流程的重組,效益鏈也是個系統,僅有技術思維是不足以構建效益鏈的。
現有信息共享措施并不成功
政府推動信息共享的兩大措施是建設政府信息資源目錄和信息共享交換平臺。兩項措施推行近十年依然不是很成功,系統開發推行很吃力,但使用者卻不多,政府信息資源目錄的主要貢獻是使政府數據管理標準化了,但其應用也是門可羅雀,用戶不足能使企業關門,政府部門對此卻不在意。
信息爆炸降低信息共享價值
信息共享的價值與全球信息化發展密切相關,三十年前計算機數據資源極為稀缺、信息共享渠道極為稀缺,信息共享成為推動數據庫應用的旗幟發揮著重要作用;但是在互聯網、大數據、云計算普及的今天,數據資源爆炸,共享渠道充裕,信息共享作為口號已經過時了,信息資源也因供應充足而降低了價值,數據應用需要新的口號了。
關注數據應用的效益與成本
數據應用的效益問題
政府數據應用的效益主要是社會效益,社會效益不便于與政府投入成本直接比較,在實際處理中是通過政府價值觀來評價的,政府要站在公眾的立場上評價政府數據服務的價值,判斷該數據服務是否值得投資,而公眾是以自己的獲得感直接評價政府是否浪費了納稅人的資金。
關注數據應用的機會成本
評價數據服務系統的效益需要扣除成本,如何計算成本?通常只想到會計成本,但是政府領導人主要考慮的是機會成本。機構負責人辦事都有優先級,知道什么事情更重要,絕不能讓次要的事情來耽誤主要事情,機構是否重視數據應用取決于有多少更緊迫的事情,被重大事情壓得抬不起頭的負責人是不會關注數據應用的,被耽誤的最大事情就是數據應用的機會成本。
數據服務有規模才有效益
政府數據應用服務的效益與規模密切相關,大效益就需要大規模,大規模的業務通常是政府對公眾的規范化服務,數據應用要盡量與政府大規模服務業務相結合才會有更大效益。用戶太少的往往不值得做,中小城市不能照抄大城市的做法,大城市有效益的事情中小城市卻可能虧損,為研究人員提供服務的數據系統更應當謹慎,因為此類服務不容易形成業務規模而很難經營。
效益的可持續性問題
要區別是一次性服務業務與長期服務業務。一次性服務效益容易計算,而長期服務業務必須考慮其生存風險,其效益與業務穩定性密切相關,例如信息共享系統的服務能力取決于其數據更新維護的穩定性。影響長期服務效益的關鍵是業務的可持續性及是否有自適應環境與需求變化的能力,所建系統必須有其生命力,要能在生命期內持續服務,在外部環境變化能夠自適應外部變化及需求的調整,數據系統設計不僅要考慮技術問題還要考慮運行與激勵機制的問題。
不要高估內部信息共享對決策的貢獻
信息共享概念的產生環境
重要概念的產生都有重要的歷史背景,每個概念都被打上時代烙印,對概念的理解不能望文生義,離開了歷史含義的理解會使概念絕對化而喪失活力。信息共享是從決策需求提出來的,當時是數據資源極為稀缺的時代,增加信息意味著決策質量會提高,信息共享則是增加信息的重要渠道,自那時開始至今政府始終高度重視信息共享。
決策需要的是數據集的信息
信息共享與數據共享是兩個概念,信息共享是為決策服務的,使用數據的目的是為了獲取信息,進而進行決策;而數據共享只是數據的直接使用,與信息無關,與決策更無關。
政府決策不是對某一具體的事件給出處理辦法,而是對普遍性問題制定政策,決策是針對普遍性問題的解決辦法,決策者不能依據個別數據決策,而需要以對數據整體的理解決策,即依據數據集包含的信息決策,決策使用數據的目的只是獲取數據集所包含的信息,數據資源只用于數據挖掘并不參與決策,參與決策的是信息。
不要指望信息共享會有驚人發現
政府目前所強調的信息共享只是在政府部門間的數據共享,即允許它部門使用本部門存儲的數據,部門數據主要是統計數據與業務數據,業務數據是部門業務工作數據處理的實體數據,決策研究并不需要單個的實體數據。決策研究不會只盯住政府內部數據共享系統,研究人員還有許多正式與非正式的信息渠道,如會議、部門匯報、電子郵件、互聯網、微信等等,這些渠道可提供更多的內容,部門內部存儲數據信息都會不同程度地泄露,使其內容不再有新鮮感,指望從內部信息共享系統有驚人發現很難。
要考慮互聯網帶來的數據競爭
互聯網豐富的信息資源一直在打壓政府信息共享系統對決策的價值,政府決策的信息來源是不受限制的,政府內部的信息共享系統始終受到來自外部信息共享渠道的競爭。政府內部信息資源只是領導人關注信息的一部分,更多的信息還需要來自外部渠道,外部信息資源的豐富程度內部系統不可相比,使用的方便性內部系統更不可相比,外部的競爭優勢降低了人們對內部共享系統的依賴性。
應把基層業務數據整合作為重點
提取信息與數據處理使用數據模式不同
政府使用數據的業務有兩類,一類是要從數據中挖掘信息以便用于決策,這種使用數據的模式稱為數據挖掘。數據挖掘只使用數據并不改變原始數據。
另一類使用數據的目的是完成具體的服務操作,這種應用稱為數據處理,政府為公眾具體的服務離不開對用戶數據的處理。業務處理使用數據是工作流程,數據處理結果會生成新的記錄,使用老數據按規則生成新數據。
數據挖掘與數據處理對數據質量要求不同
數據挖掘關注的是數據集中所包含的信息,數據只是提取信息的原材料,由于統計分析工具能夠過濾異常數據,對于具體數據的精準度并不關注。
數據處理是對用戶關聯的實體數據的直接操作,數據的精準度非常關鍵,數據的精準度直接影響服務質量,不準確的數據往往會引起業務處理糾紛,在數據處理流程中只關注具體數據的準確性,沒有信息概念。
決策與操作使用數據的不同層次
政府決策并不直接使用數據,數據被用來提取信息,決策依賴的是對數據整體的理解,理解數據是高于數據層次的概念,計算機并沒有理解數據的能力也沒有信息的概念,信息是人腦才有的概念,是數據層次之上的概念。
政府服務業務處理是直接使用數據,依據具體數據操作,數據處理的方法由系統規定,操作人員沒有自由量裁權,系統以形式邏輯的方式處理數據,是對數據的低層次的使用,沒有信息概念,基層服務大都是這種模式。
數據服務要向基層傾斜
政府高層從事決策與政策研究是信息層次上的工作,不是IT技術能夠承擔的,決策與政策研究是人腦才擅長的領域,IT技術除了幫助進行數據挖掘,對決策思維幫助不大,這也是決策支持系統難以推廣的原因之一。
政府基層工作主要是業務處理,對數據是直接使用,沒有高層次的分析,數據處理方法是形式邏輯可描述的,不需要人腦信息抽象,適合信息技術發揮作用,數據服務向基層傾斜能夠獲得更大的成果。
大數據應用的優勢與局限
政府怎樣理解大數據
大數據最初的定義是指“現有的技術不能處理的大規模數據”,在大數據熱的驅動下其概念不斷擴展,互聯網公司認為自己的數據就是大數據;人工智能將經由傳感器直接傳來的數據統稱為大數據;政府官員認為政府管理的數據集中起來就是大數據。現在很多城市都在成立大數據局,這將促使政府將一切數據都納入大數據的領域,以充分便利用國家支持大數據應用的各種政策優惠。
大數據比抽樣調查的優勢
對比大數據優勢首先是從統計分析的視角開始的,大數據與抽樣調查比較,顯然全樣本的分析要比抽樣調查可獲得的信息要更多,尤其是小概率環境中的相關關系;大數據對數據中的錯誤的容忍度要大得多,數據規模越大其對數據的異常值的平滑能力越強,大數據可以發現更多更精細的規律。
數據整合連接的信息價值
信息是連接的產物,數據是靜態的連接,連接是動態的數據。要理解一個組織或一個實體最重要的措施是觀察其組織連接的結構。城市各視角數據的整合為深入理解城市增加了大量信息。城市的信息空間是一個整體,信息存在于連接之中,將同一實體的多方面屬性匯集起來會使人們對該實體產生更完整的概念,這是連接的信息作用,將各部門的信息與地理數據相連接可以形成相應的地理圖層信息,借助于地理位置還可以發現不同數據在位置上的相關關系,數據整合的作用就是凸顯數據的連接,理解關注對象的整體結構。
大數據應用的局限性
大數據應用給我們帶來了發現事物規律的新方式、新工具和觀察問題的新視角,其貢獻是巨大的,特別是大數據與人工智能的連接更是如虎添翼,人們設想大數據能夠全面提升政府的管理水平,實現真正的科學決策、科學管理,甚至實現現代新計劃經濟。但是這種想法容易高估大數據的能力。大數據可以提升預測能力,但是對于不確定性問題預測依舊是不可能的。大數據能支持決策的范圍有限,因為并非所有信息都可數字化,便于大規模收集的數據需要標準化,其范圍會比較窄,也即數據規模必須以視野狹窄為代價,大數據適合于局部領域細節決策的優化,并不適合整體目標的大決策,不能盲目夸大大數據應用。
(作者系原中國信息協會副會長,現任中電科新型智慧城市研究院首席顧問)