林崇責+杜偉杰
基于浙江省經濟信息中心大數據的實踐探索
“忽如一夜春風來,千‘數萬‘數梨花開”。信息技術與經濟社會的滲透融合引發了數據量爆發式增長,運用大數據推動經濟轉型升級、社會治理創新、政府監管和民生服務能力提升成為“大趨勢”。筆者以浙江省發改委直屬的省經濟信息中心為例,探討政務大數據應用“五大趨勢”和 “三大形態”,提出深化政務大數據開發應用的對策建議。
政務大數據應用加快呈現“五大趨勢”
大數據通過對多源異構、跨域關聯的海量數據進行處理分析,能有效總結經驗、揭示規律、預測趨勢,為經濟社會創新發展提供新思維和新方法。隨著信息技術發展,政務大數據應用加快呈現“五大趨勢”:
政務和互聯網大數據加速融合。互聯網網民行為數據、交易數據、日志數據、意愿數據等海量數據,蘊藏著無限的可挖掘的價值。在“互聯網+”時代,互聯網、移動互聯網已經成為民眾獲取信息的最主要渠道,也成為政府采集民眾、意愿需求等數據的有效來源。研究表明,到2020年全球數據量將將激增到40ZB,這其中文本、圖片、音視頻、時空位置等非結構化數據占比將達到75%,而絕大多數數據是由互聯網、物聯網以及各類智能終端產生或掌握,政務數據規模比重將逐步下降。因此,政務數據與互聯網數據之間的融合應用,是深化政務大數據應用的必然趨勢。
政務“大數據”和“小數據”取長補短。“大數據”數據規模大,數據價值密度低,潛在價值相對不明顯,多以文本、圖像、音視頻以及位置等非結構化形態保存,對計算能力和數據處理能力要求極高。而“小數據”則相反,為數據總量較小、價值導向明顯的傳統統計分析數據,多以二維表格等結構化形態保存,對計算能力和數據處理相對較低。在政務數據開發應用中,政務“大數據”和“小數據”取長補短、互相支撐,已經成為政務大數據應用的重要方向。“小數據”的價值導向為“大數據”的開發應用提供了基本參考和方向指引,而“大數據”則為充實和細化“小數據”提供了基礎支撐。
政務大數據的外部性作用日益發揮。大數據時代,人類關注重心將從因果關系更多轉向相互關系,因果關系也可以理解為一種關聯性更強的相互關系。“有關”和“無關”的界限已經被打破。一方面,要充分利用與外部數據來解決業務中遇到的問題;另一方面,要求把政府自身業務產生中的數據拿出去,解決外面和本業務無關的問題,在更廣闊的空間發揮大數據的價值。實踐表明,應用機器學習等大數據算法,充分發揮數據外部性作用,是大數據應用中最神奇的利器。
應用拉動和技術推動互為強化。當前時期正處于經濟社會大轉型時代,在推進社會治理能力和治理體系建設的大環境下,政府需要準確及時地分析處理復雜的經濟問題和把握潛在的社會矛盾,這對大數據提出了迫切的應用需求。同時,以人工智能、大數據、云計算、移動互聯網、物聯網為代表的新一代信息技術快速發展,大大提高了對各類數據的處理能力,為解決各類政府業務中存在的痛點提供了技術條件。
政務數據共享開放成為必要前提。相比于社會領域大數據,由于行政體制分割,政務大數據一般分散在各個部門、條線,數據源很大程度存在著“三宮六院”和“衙門林立”等情況,極大地降低了政務數據應用價值。再大的數據規模,再豐富的數據形態,若未形成與其他跨域數據交換共享的“流通”機制,就難以形成大數據。因此,打破數據壁壘和孤島,促進跨層級、跨部門、跨領域系統互聯互通,推動數據從“隔水相望”到“阡陌交通”,已經成為深化政務大數據應用的必要前提。
政務大數據應用產品呈現“三大形態”
結合浙江省經濟信息中心前期實踐探索的經驗,政務大數據開發要堅持以部門自有數據、統計數據和互聯網數據等各類數據深度融合為主線。數據產品一般可以分為:指數化類、可視化類、咨詢報告類等三大應用形態:
指數化類應用,是圍繞某一專題,對部門政務數據、統計數據和互聯網數據等各類數據統計分析、深入挖掘,形成的評估、監測、預測類等量化指數產品。目前,指數化應用已經成為各類政務大數據開發應用的核心,如北京大學國家發展研究院“新經濟指數”、國家工商總局“企業發展工商指數”、國家信息中心“雙創指數”等產品。例如,省經濟信息中心已經初步形成了信息社會指數、信息經濟指數和浙江指數等多項指數產品。
可視化類應用,是數據產品的展示類應用。為了使數據挖掘分析結果、數據產品等內容一目了然,通過數據大屏等直觀形式,將相關內容以圖形化和圖表化形式對外展示。在當前互聯網高度普及和“讀圖時代”的大背景下,可視化類應用已經成為大數據應用的重要形式,成為政務大數據應用的必要形態。例如,省經濟信息中心完成了“數據云圖”:將省發改委各類政務數據清洗、比對、建模后,以“一張屏”的方式全景化、直觀化地展示便于各級領導隨時掌握經濟社會發展狀況,輔助政府領導決策支持。
咨詢報告類應用,是指對政務數據產品的深度加工,圍繞某一政務主題,立足為省委省政府、省級部門提供有價值的咨詢建議,而形成的咨詢報告。比如,省經濟信息中心已形成了兩類咨詢報告產品。一方面,基于輿情數據,初步形成了互聯網輿情大數據分析系列產品,截至目前共完成特色小鎮、失信黑名單新聞發布會、數據強省等專題互聯網大數據分析報告,定期供稿省政府辦公廳、省發改委等單位部門。另一方面,基于政務數據挖掘應用的課題研究,利用投資項目等業務數據,定期編寫省專項建設基金項目建設情況季度監測分析報告,獲得各級領導好評。
政務大數據應用仍處于起步階段
政府部門在推進大數據開發利用中普遍存在基礎不夠完善、技術實力不夠扎實、產品開發不足、人才隊伍能力不足等問題,政務大數據開發應用仍處于起步階段。
大數據基礎不夠完善。各政府部門數據規模雖然增長巨大,但離真正大數據仍有一定差距。在數據形態上,仍以結構化的基礎數據為主,數據更新頻率較慢,離大數據在線化、實時化、高頻率等要求差距不小。在數據采集上,仍主要依賴于傳統的人工填報方式,利用互聯網、移動互聯網、物聯網等智能終端自動采集數據未成體系。在數據安全上,部分政務數據保密性要求較高,也在一定程度上限制了深度的開發應用。
大數據技術實力仍處于1.0階段。目前,政府部門信息化技術仍以傳統技術為主,對大數據智能提取、機器學習等前言技術掌握仍相對較弱,特別是互聯網大數據的運用基本處于初級階段,仍然處于大數據應用的1.0版本(統計分析)、2.0版本(關聯分析),距離大數據應用3.0版本(機器學習)仍有較大差距。
優秀的大數據產品屈指可數。數據產品是是大數據建設應用的核心。對標互聯網大數據應用水平,政務大數據數據產品普遍呈現層次不深、應用不廣、效益不夠等情況。
大數據專業人才隊伍能力明顯不足。人才是大數據開發應用的根本保障。大數據是典型“應用拉動、技術推動”的發展范式,優秀的大數據人才必須兼具大數據思維、業務敏感性和數據挖掘分析能力,政府部門大數據專業隊伍能力明顯不足。
深化中心政務大數據開發應用的對策建議
“數據的價值產生于使用”。堅持應用領先,基于各類數據共享的融合應用,仍是政務大數據發展的重要趨勢。政務大數據開發應用應在培育提倡大數據思維文化、完善大數據基礎配套建設、梯度建設數據產品、培養數據分析師等四個方面加大推進力度。
培育提倡大數據思維文化。建立數據資產理念,按照“一切業務數據化”要求,及時采集、沉淀、存儲業務過程中形成的數據。建立“利用數據說話”數據意識,在業務研究和日常管理中加強定量分析,實現數據驅動創新、數據驅動管理。建立共享開放理念,強化數據文化意識轉變,創新共享共贏的合作方式,加強與互聯網先進公司、浙江大學以及高端智庫等機構交流,在業務研究、數據分析方面形成深層次合作關系。
完善大數據基礎配套建設。堅持政務和互聯網大數據“兩手抓”,進一步完善數據質量,探索開展一手數據采集,形成多渠道的數據采集渠道,整理數據資源,建立數據標準,形成全面、權威、及時的政務數據庫。建設數據智能分析系統,建立智能化大數據分析平臺。研發政務與互聯網大數據相互融合,提高非機構化數據的分析處理、神經網絡等機器算法研究和應用能力,持續提升大數據技術。進一步加大政務數據整合關聯力度,建立管理規范,出臺政務數據開發共享管理辦法。
梯度推進大數據研發。堅持應用導向,以服務好部門核心業務為主攻方向,按類別整理形成政務大數據服務目錄清單。遵照大數據方法論,鼓勵政府內部跨部門、跨領域合作,積極探索信息技術和軟課題研究融合突破口,遵從大數據統計分析、關聯分析以及機器學習演進路徑,梯度化形成一批高質量、有影響的大數據產品。
加快培養數據分析師。大數據時代最需要的是能夠具備敏銳的業務視角、熟練數據模型,并對大數據特征和模型選擇有豐富選擇經驗的復合型人才。政府部門要通過外引內育,建立健全大數據人才培養體系,將數據分析師培養納入單位人才培養計劃,加快培養一批既懂數理統計分析、數據挖掘分析技術,又熟悉政府部門業務的大數據分析師。
(作者單位:浙江省經濟信息中心信息化研究處)