文/化祥雨 王義偉
從數據、知識、模型算法、案例、工具維度看,數字化改革“大腦”應當將“大腦”數據鏈、知識鏈、模型算法鏈、案例鏈、工具鏈全面協同、交叉、融合、貫通、聯網,集成嵌入到各種業務流、治理流、服務流,真正形成政府和市場數字化改革閉環網絡
“大腦”毋庸置疑是全省數字化改革的中樞。類似于人類大腦,數字化改革“大腦”應包括數據、知識、模型算法、案例、工具等核心部件。其中,數據是數字化改革“大腦”接收的信息,知識是數字化改革“大腦”學習的老師,模型算法是數字化改革“大腦”決策的芯片,案例是數字化改革“大腦”對標的榜樣,工具是數字化改革“大腦”操作的系統。數字化改革“大腦”建設路徑應從數據、知識、模型算法、案例、工具幾個維度展開。

數字化改革大腦建設框架圖
“大腦”數據應包括統計大數據、互聯網大數據和地理空間大數據等。目前各業務部門數據歸集多以統計大數據為主,互聯網大數據和地理空間大數據有待進一步采集補充。值得注意的是,數據處理質量的好壞直接影響“大腦”的思考和決策。數據處理環節通常將數據和現實問題抽象成具體的數學符號,常用{X,Y}矩陣集表達存儲,根據具體問題進行數據缺失補齊、特征選擇、數學化、標準化、歸一化等操作。對有些特定問題數據以文本、圖像、音頻、視頻等形式存儲,需要進行文本分析、圖像處理、音頻處理、視頻處理等操作,將其轉化為一定格式的標準化數據進行存儲。
從內涵上來講,知識可以是物質世界中具體的文件,也可以是精神世界中抽象的思想。從分類上來講,知識包括圖書、文獻、論文、報紙、規劃、課題研究,也包括指導思想、戰略目標、政策法規、法律文件、黨規黨章、經驗做法、公理定理等。從形式上來講,知識的呈現形式可以是數據、文本,也可以是圖像、音頻、視頻等。需要說明的是,“大腦”知識也應該進行數據化、標準化、模塊化處理與存儲,這樣有利于更好地對“大腦”知識進行深入挖掘與對比分析。知識的重要價值在于其可以作為“大腦”學習、訓練、模擬、仿真、預測的先驗輔助集,時刻教導、監督、矯正“大腦”學習的效果。
選擇模型算法之前要厘清現實問題的屬性。各業務部門在做場景的時候,首先要思考清楚現實問題的屬性具體是什么。現實問題對應的是監督學習問題、半監督學習問題,還是無監督學習問題?對應的是分類問題、回歸預測問題、聚類問題、特征選擇問題,還是關聯匹配問題?對應的是單一指標問題、多維指標問題、指數構建問題,還是預警預測問題?合理匹配現實問題與最優模型算法是“大腦”的核心。對有些現實問題,單一模型算法未必一定是最優的,多種模型算法綜合學習對比或者組合集成決策值得探索。
從體系架構來看,“大腦”案例涉及黨建、紀檢、民主法制、意識形態、統一戰線、群團體制、生態文明、經濟體制、社會事業、文化體制、法治、社會治理等領域。從業務實操來看,“大腦”案例包括先進業績、突出成就、標志成果、最佳應用、規范標準、流程制度、專家經驗、經濟研判、周期規律等。需要說明的是,成功的案例可以作為“大腦”輸出的參考集,輔助“大腦”更好地學習訓練,亦可以作為典型標桿,對標對表,激勵不同領域、不同跑道、不同場景不斷迭代優化升級。
從學習端來看,“大腦”工具應包括數據整理導入、知識轉化處理、資源約束管控、模型匹配構建、算法選參訓練、預測輸出驗證、組件銜接調用等。從應用端來看,“大腦”工具應包括問題需求發布、指令一鍵傳達、戰略目標管理、政策模擬仿真、資源要素匹配、訴求及時反饋、問題智能診斷、關聯文件推送、新聞熱點捕捉、輿情預警研判等。
2022年是實現浙江數字化改革“一年出成果、兩年大變樣、五年新飛躍”戰略目標的關鍵之年,也是全面貫通、集成突破、集中展示之年。2月28日,省委書記袁家軍在全省數字化改革推進大會上提出:“要探索‘大腦’建設路徑,在全面實現支撐核心業務運行監測評估的基礎上,提升‘大腦’的預測、預警和戰略管理支撐能力。”數字化改革“大腦”應當將“大腦”數據鏈、知識鏈、模型算法鏈、案例鏈、工具鏈全面協同、交叉、融合、貫通、聯網,集成嵌入到各種業務流、治理流、服務流,真正形成政府和市場數字化改革閉環網絡。