●趙 愷
全面實施預算績效管理是黨中央的重大決策部署。 中共中央、 國務院《關于全面實施預算績效管理的意見》明確指出, 全面實施預算績效管理是推進國家治理體系和治理能力現代化的內在要求,是深化財稅體制改革、建立現代財政制度的重要內容。 為貫徹落實中央決策部署, 新疆維吾爾自治區財政廳緊緊圍繞加快構建“全方位、全過程、全覆蓋”預算績效管理體系目標任務, 將績效作為自治區財政管理的“底線”之一,全面促進預算管理與績效管理深度融合, 著力推動各部門單位以預算績效管理為抓手, 不斷提高財政資金配置效率和使用效益。
信息化是完善預算績效閉環管理工作機制、 推進管理水平提質增效的重要內容。 新疆維吾爾自治區財政廳在全區各級財政部門全面實施預算績效管理信息化的基礎上, 一方面依托金財工程網絡,建立“自治區—地(州、市)—縣(市、區)”縱向的績效管理數據通道, 打通上下級財政預算績效信息管理瓶頸, 初步構筑出全區規模的預算績效管理數據倉庫, 將財政部門對預算績效的監管延伸至基層單位和資金使用末端;另一方面,集中精力深入開展預算績效管理理論體系研究,結合財政預算管理需求, 借助高等院校、第三方機構的研究和技術力量,在預算績效評價大數據應用方面進行了有益的探索。
大數據有“4V”特征,即數據量大(Volume)、數據種類繁多(Variety)、處理速度快 (Velocity) 和價值密度低(Value)。 應用大數據技術就是要通過對數據量大、來源分散、格式多樣的數據進行采集、存儲和關聯分析,從中挖掘新知識、創造新價值、培育新能力。從現實和發展角度看, 大數據不僅是一場技術革命,還是一場管理革命。 原中國行政體制改革研究會副會長周文彰認為,大數據將通過全息數據呈現,使政府從“主觀主義”“經驗主義”的模糊治理方式,邁向“實事求是”“數據驅動” 的精確治理方式。 在大數據條件下,“人在干、云在算、天在看”,數據驅動的“精確治理體系”“智慧決策體系”“陽光權力平臺”都將逐步成為現實。
以大數據視角分析和審視新疆預算績效管理信息,符合開展大數據應用的基本需求。 一是預算績效信息量大、覆蓋面全。 貫徹落實中央全面實施預算績效管理決策部署,新疆已完成將“所有部門單位、所有財政資金”全部納入預算績效管理的工作目標,自治區本級、14 個地(州、市)、96 個縣(市、區)、1.3 萬家部門單位每年約6.7 萬個項目支出全部實現全過程預算績效管理, 年新生產數據量近80 個GB。 二是預算績效管理數據類型呈現多樣化。按照財政部、新疆預算績效管理制度辦法規定,新疆各級財政部門收集并審核的材料包括事前績效評估報告、績效目標表、績效監控表、績效評價單位自評表、績效評價部門評價報告、第三方機構績效評價報告和各階段佐證材料等。數據種類包括已納入數據庫管理的結構化數據以及諸多WORD、EXCLE、圖片、PDF 文檔等非結構化數據。三是預算績效信息處理速度符合財政資金管理特點。相比網上購物、娛樂、短視頻等在線商業應用,顯然預算績效管理信息產生、處理的效率比較低;但從財政預算管理的周期看,預算績效信息的處理速度是完全能夠滿足政府財政資金管理的需要。四是單個項目預算績效評價的價值已基本挖掘出來。 一方面,新疆各級財政部門在編制2021 年度部門預算時,落實績效評價結果與預算安排掛鉤機制,大力削減低效無效資金, 依據評價結果調減了2100 多個項目預算資金近30 億元, 發揮出了預算績效對提高財政資金使用效益的積極作用。 另一方面,項目作為財政資金管理的最小單位之一,往往受地域、時間、環境等諸多外部條件影響較大,單一項目(包括采取抽樣方法選取少量項目)的績效評價結論很難總結或提煉出標準和規律,對政府的宏觀經濟決策輔助功效不大,同時也限制了預算績效在更高層面對優化財政資金分配格局作用的發揮。
因此,從新疆預算績效管理提質增效的實際需求考慮, 在繼續深入做好項目預算績效精細化管理、全力保障預算績效管理基礎數據真實準確的同時,也迫切需要進行一場大數據管理革命,從全局、宏觀的高度審視和調整預算績效管理,力爭把績效結果根植于最廣泛的數據基礎上,探索建立“用數據說話、用數據決策、用數據管理、用數據創新”的績效新模式, 最大限度地為財政預算管理提供科學、可靠的依據。
通過大數據關聯分析,展示出的結果往往是不可預知的。 這種不可預知性通常反映出事務內部非邏輯性的必然聯系, 是數據挖掘價值最大的部分。但獲得有效成果的前提條件包括:原始數據采集是否真實,數據清洗方式是否準確,以及預設的數據模型或研究框架是否科學、合理、中性等。
為貫徹落實中央關于全面實施預算績效管理的指導思想,新疆維吾爾自治區財政廳將開展預算績效大數據應用的初期目標任務設定為:按照業界大數據應用標準,組建專業團隊,對全區直達資金(包括中央、自治區)項目預算績效管理數據進行分析建模,用實踐手段去驗證涉及預算績效大數據應用各關鍵環節的可行性,并總結出有效推進工作的方法。
初步預設的預算績效管理大數據應用模型有四種,包括:一是統計分析模型。 建立新疆分地域、分時間、分行業的財政項目支出投入—產出—績效的動態模型, 綜合反映同類資金在不同區域的效果。 二是支出標準模型。 對歷史的項目績效信息特征化,按一定算法將單個項目投入、產出、效益等關鍵信息降維成點,再將相同投入方向的所有項目點在數軸上做正態分布,從統計學角度為研究財政項目支出標準體系提供依據。 三是輔助決策模型。 將歷史數據封裝成“黑盒”,量化新增項目事前績效評估情況后,輸入“黑盒”進行討論,輸出對項目“支持”“部分支持”“不支持”的概率分析。 四是審計推送模型。 通過分析歷史數據,自動建立行業標桿,按流水作業方式,對當年部門單位填報的項目預算績效情況進行審計, 發現問題再推送到人工復審,降低財政部門全覆蓋審核工作強度,提高工作效率。
數據清洗是在收集多個維度、來源和結構的數據后,對數據進行抽取、轉化和集成加載的過程,目的是對全部數據進行歸并整理,以及更正、修復一些錯誤數據來消除噪聲。 新疆預算績效大數據清洗,計劃通過實踐,對比分析各類大數據清洗方法的優劣,包括統計學方法、基于聚類的方法、基于距離的方法、基于分類的方法和基于關聯規則的方法等,最終遴選并確定符合新疆績效管理最佳的數據清洗方法或組合方式。
數據標記是基于預期的應用模型,利用經驗為元數據增加統一的、 有使用價值的外部屬性的過程,來彌補數據收集階段的缺陷。 新疆預算績效大數據的標記工作, 計劃第一階段使用人工方式,采取“邊標記、邊建模、再標記”的方法,循環往復推進標記工作。 其目的是利用相對有限、可控的數據規模,來驗證在完成預期應用模式下最經濟的標記數量, 進而為后期改進和完善數據收集機制提供依據。
新疆預算績效大數據的總體架構為 “一個機制、兩套體系、三個平臺”。 “一個機制”指預算績效大數據管理工作機制,包括數據共享開放、業務協同、大數據科學決策、精準監管等應用機制。 “兩套體系”包括組織保障和標準規范體系、統一運維和信息安全體系,為大數據系統提供穩定運行與安全可靠等技術保障。 “三個平臺”分為基礎設施平臺、數據資源平臺和業務應用平臺,其中:基礎設施平臺是集約化建設的IT 基礎設施層, 為大數據處理和應用提供統一基礎支撐服務;數據資源平臺為大數據應用提供統一數據采集、分析和處理等支撐服務;業務應用平臺為大數據在各領域的應用提供綜合服務。
基于大數據實施方法,研究確定新疆預算績效大數據的技術架構:一是分布式系統架構,滿足各類型數據的存儲、 大規模數據計算和數據分析;二是J2EE 框架,遵循J2EE 標準及規格,規范應用系統的開發與部署,進而體現其良好的兼容性、可移植性、安全與再用價值;三是大數據BI 技術,提供完整的解決方案,將現有的績效數據進行有效的整合,準確地提供報表并提出審計、支出標準、輔助決策依據。
按照新疆預算績效大數據的總體架構,以自治區2019、2020 年度直達資金全過程預算績效管理為數據基礎,通過對數據采集、清洗、存儲、處理與分析等,實踐探索預算績效大數據的技術路線。
數據來源于自治區各地、 縣上報的EXCLE、WORD、PDF、圖片等非結構化數據。
1、數據抽取(Extract)
(1)建立分級文件夾并壓縮。 一級目錄為業務過程文件夾 (1—項目績效表、2—一次監控表、3—二次監控表、4—自評表、5—財政審核評價表),二級為區劃碼+地(州、市)名稱文件夾,三級為區劃碼+縣(市、區)名稱文件夾。
(2)數據包臨存入庫。 按照提取算法讀取壓縮包數據批量識別,同時自動歸類項目基礎信息和績效指標、監控信息、自評價、部門評價信息。 ETL 自動推送存疑常數據,由人工甄別處理。 提取甄別完畢后歸檔入臨時項目庫。
2、數據清洗轉換(Cleaning、Transform)
(1)標記關聯關系。 一是按照區劃、部門、單位名稱、項目名稱,按照規則自動標記關聯關系;二是依據項目信息自動標記目標、監控、自評價等隸屬關聯關系,確保項目、目標、監控、評價隸屬關聯準確性。ETL 自動推送不能建立關聯關系過程數據供人工標記。
(2)不一致數據轉換。隸屬關聯標記完成后,不一致信息由ETL 自動轉換為一致,如單位名稱、項目名稱等信息。ETL 自動推送不能自動轉換的數據供人工轉換。
(3)錯誤數據糾正。聯動推送項目監控、自評價數據執行率、 定量指標完成率等計算錯誤的數據,按照算法計算推送至人工核準。 復審通過數據,自動從臨時庫轉入正式庫。
3、結構化數據抽取。基于新疆預算績效管理信息系統上下級互聯互通的完成,自治區本級、地、縣數據采集將采用接口方式通過預算績效上下級互聯互通系統直接獲取。
4、增量數據更新。 一是采用時間戳方式,通過比較系統時間與抽取源表的時間戳字段的值來決定抽取哪些數據。二是全表對比在不一致時采取全增方式,解決績效目標調整的業務問題。
1、自動標記方法。 一是專項類型,如直達資金、產業扶持已明確的專項類型等。二是項目功能分類,通過功能科目一級自動標記為項目大類,如201—一般公共服務支出,細化標記至二級。 三是項目支出分類,如301—工資福利支出,細化標記至二級。
2、手工標記方法。一是標記項目分類,標記大類對個人補助類、專項業務費類、專項支出類,同時細化并標記專項支出類。二是標記其他屬性,如鄉村振興、文化潤疆、十大產業等。
1、項目信息模型。 項目是績效目標、監控、評價的載體,一個綜合、直觀、易操作的橫向可匯聚,縱向可級聯的項目展示模型尤為重要。 一是確定項目元素。 包括:地域、時間、部門單位名稱、項目名稱、專項類型、支出功能分類、支出經濟分類、預算數(財政資金、其他資金)、其他屬性、評價得分等。二是分析級聯關系。包括:地域維度(自治區、地、縣)、項目維度(績效目標、監控、自評價、部門評價)、時間維度等。 三是布局展示及鉆取。 按照地域、時間,以部門單位和項目為單位羅列展示項目信息,按照級聯關系鉆取,以項目信息鉆取按照原始報送格式展示齊目標、監控、評價信息。
2、統計分析模型。建立漏斗分析模型、分布分析模型、屬性分析模型等,通過分地域、分時間、分行業的財政項目支出中的投入、產出、效益的動態模型,采用均值、方差、偏度等統計方法解讀分析同類資金在不同地區的實施效果。
3、自動審計模型。 包括指標體系、監控、單位評價審計模型。 通過歷史數據透過分地域分行業績效審計體系模型,按流水作業方式,對當年部門單位填報績效數據進行審計, 發現問題再推送到人工復審,降低財政部門全覆蓋審核工作強度,提高工作效率。
4、支出標準模型。對歷史項目信息特征化:一是信息降維, 按照單個項目支出標準=預算執行數/實際產出數來計算,將項目數據降維成點。 二是數據投影,將同類項目的支出標準在數軸上做正態分布, 從統計學角度研究財政項目支出標準。
5、輔助決策模型。 將新增項目預算績效指標與歷史項目實際完成指標封裝成決策池, 從支出標準、 效益兩個維度進行計算, 對偏差值進行統計,以一定的支持率劃分區間,按等級確定支持程度。
目前, 新疆財政預算績效大數據第一階段實踐工作已基本完成。總結工作開展過程,主要發現有兩個方面的問題: 一方面在預算績效管理業務上,存在項目分類沒有統一標準、同類項目績效指標設置不規范、績效評價方式和尺度不一等問題,會干擾大數據分析結果;另一方面在技術準備上,低估了數據抽取及清洗階段的工作量, 對項目屬性把握能力不足、標記屬性精準度有待提高,選用的建模工具對復雜算法支持度不夠等。
以問題為導向, 下一階段新疆預算績效評價大數據建設的工作思路為: 一是在標準化上下功夫,加快自治區分行業、分領域共性項目核心指標體系建設,把控好項目分類和核心指標,確保入數據倉庫項目可比可測;二是在規范化上下功夫, 全面實施自治區預算績效上下級互通工程,從基層單位、從信息源頭規范入庫數據,降低非結構化數據量, 減輕數據抽取和清洗的工作量;三是在科學化上下功夫,組成專家小組重新評估數據建模分析工具,提高數據分析效率和對復雜算法的支持,確保能夠及時積極應對財政管理各類需求。