摘? ?要:構建開放共享的數據資源體系是公共資源交易大數據共享、流動和應用的基礎,促進交易大數據價值的更大化,利于營造公開透明、競爭有序的公共資源交易市場環境。基于對公共資源交易業務與主體行為關系、交易數據特征的分析,設計公共資源交易數據資源體系框架,涵蓋從原始數據的收集和資源化,到形成統一目錄對外共享應用的過程,并提出構建難點。
關鍵詞:公共資源交易;數據資源體系;資源目錄;共享應用
中圖分類號:TP319? ? ? ? 文獻標志碼:A? ? ? 文章編號:1673-291X(2024)07-0078-03
2022年6月國務院印發了《關于加強數字政府建設的指導意見》,明確將構建開放共享的數據資源體系作為我國數字政府建設的重要任務。同年10月,國辦印發《全國一體化政務大數據體系建設指南》,提出到2025年,政務數據資源將實現有序流通、高效配置。
公共資源指由政府或被授權的組織所有或者管理的公有性、公益性資源。公共資源交易活動是關聯政府和市場的紐帶,業務特征明顯,屬于政務公開范疇[1]。公共資源交易數據資源體系是全國一體化政務大數據體系建設的組成部分,是對交易數據資源生命周期的統籌規劃,利于數據流通共享和高質量地應用。目前以市場化方式配置的公共資源如農村集體產權、無形資產、海洋資源等也納入了交易平臺覆蓋范圍,作為基礎的公共資源交易大數據的資源體系急需先行。
一、公共資源交易業務關系和數據特征分析
(一)交易業務鏈條式關聯
公共資源交易以分交易領域的項目/標段交易進展為主線,圍繞入場登記、招標、投標、評標、中標、合同的業務環節,形成鏈條式結構化數據[2],記錄交易全周期。市場主體不僅是交易活動的組織者、發起者,也是交易行為的參與者、實現者。交易業務與主體行為關系見圖1。
(二)海量數據隱含市場資源配置規律
公共資源交易領域眾多,數據海量且時效性強,不涉敏感信息,源自全國1 000多個地市或省級交易平臺,涉及交易市場主體100多萬家,僅工程建設招投標和政府采購領域進入平臺的年度成交項目就超120萬個。2億多條異構多源交易數據清洗重組,由應用需求牽引流動,揭示交易行為隱含的資源配置規律,反映出交易市場的區域化融合程度。
二、公共資源交易大數據的發展現狀與問題
(一)交易大數據歸集穩定但未形成資源體系,缺少統一編目
地方的公共資源交易電子化數據源結構千差萬別,質量參差不齊,向國家級平臺提交時需按照數據規范進行內容和格式轉換。目前,工程建設招投標、政府采購、土地使用權出讓、礦業權出讓、國有產權交易5個領域的關鍵數據已完成從地方到國家的實時歸集、治理和初步整合,在國家公共資源交易服務平臺表現為統一格式的庫表和主體成交記錄接口,但沒有形成統一對外的分類和目錄,資源體系規劃尚未形成。
(二)數據規范更新滯后仍未形成機制,數據仍有應進未進
理論上,隨著交易全流程電子化要求和納入領域的不斷擴充,作為依據的數據規范應跟隨修訂,并反饋到交易平臺軟硬件系統,指導數據處理和流轉。但是由于制度、資金、技術等因素制約,配套的規范修訂和落地機制均未納入體系,規范修訂后在地方的及時切換難以實現,現有交易數據應用時還需統籌考慮應進未進的完整性誤差。
(三)數據資源體系研究依然停留在獨立環節,無全周期考慮
數據變成資源是流通共享并發揮應用價值的前提條件。公共資源交易數據資源體系與數據質量、規范、軟硬件、應用等因素緊密相關,并與市場主體、市場環境等構成動態發展的有機整體。近三年來,學者們對于公共資源交易數據的研究主要集中在交易數據倉庫構建[2]和可視化、交易數據交換共享[3]等歸集治理與建模、共享與應用,以及區塊鏈用于交易數據的整合共享與傳統級聯模式的對比[4]、數據規范設計[5]等研究。截至目前,仍保持在獨立環節的設計研究,還沒有全周期地將業務分析結合技術處理形成資源,并統一分類編目支撐共享應用的交易數據資源體系的整體框架研究。
三、公共資源交易數據資源體系構成
(一)可動態擴展的交易數據資源體系框架
開放、共享的公共資源交易數據資源體系框架包括數據規范體系、數據歸集體系、數據資源化體系、數據資源分類體系、數據資源目錄體系、數據資源共享體系、數據資源應用體系、數據安全體系,如圖2所示,每個組成部分均可動態擴展。
數據規范體系、數據安全體系貫穿所有組成,指導并約束資源從歸集到應用始終;每一層體系內容均為上層實現的基礎和前提條件,存在依附關系。
(二)約束與擴展共存的數據規范體系
作為數據生命周期質量控制的機制和保障,數據規范體系包括三部分:一是規范數據內容和格式,明確不同領域數據所含的交易業務關系、技術約束和數據所有權,應達到技術層面易實施、業務層面可跟隨政策和實際做擴展;二是規范內容在全國落地的流程和對接人要求指南,保障順利切換;三是規范修訂版本的管理制度,明示不同版本間的繼承和更新內容,以及各版本實施時間、問題處理備案,減少地方運維人員頻繁變動和交接缺失的風險。
(三)兼容多種技術的數據歸集和資源化體系
目前,多領域交易數據從地市經省級到國家級的級聯式歸集體系已形成。地方交易平臺和中央范圍的異構交易數據,按數據規范轉換,經格式、必填項、及時性校驗,歸集到國家公共資源交易服務平臺政務云存儲。歸集體系應開放、兼容,接納多種技術實現方式。
國家級平臺實施按省考核數據的機制,對所收到的數據打標簽,識別所屬領域、主體性質、交易類型、交易時間等業務特征,對疑似異常的大額中標值核查治理、整合補全,形成質量較好的庫表資源和接口資源。目前,國家級平臺已有140個基礎庫表,涉及3 000多個字段,生成了元數據及穩定的數據監測機制,但庫表數據未對外開放。
(四)支撐業務應用的數據資源分類體系
數據資源分類從支撐公共資源業務應用角度考慮。最常用的報表、統計分析、交易平臺電子化都是按交易領域分類;而按交易流程分類能夠精準定位招投標的重要環節,對于過程查詢或監管必不可少。交易屬地、來源平臺是分析不同省份和地市交易主題、數據質量的必選維度;而主體類型、主體性質定位于全國市場主體參與交易程度、交易市場一體化、區域營商環境等研究。
(五)方便檢索定位的數據資源目錄體系
數據資源目錄從方便資源使用人檢索角度進行編目,表達出庫表數據之間的業務依賴、包含關系。表現層采用交易領域、交易流程、資源來源樹狀結構邏輯對外,一并提供資源名稱、資源描述等屬性;支撐底層為統一的物理庫表和接口資源。例如,交易流程目錄樹劃分為入場登記信息、招標公告信息、成交公示信息、交易合同信息四個一級子節點,同筆交易的一級子節點縱向跨越交易時間主線,從入場登記到交易合同,表達出一個交易周期;橫向的一級、二級子節點、三級子節點之間為從招標項目到標段的業務包含關系。
(六)利用已有基礎設施的數據資源共享體系
公共資源交易數據在政務系統內開放共享為非貨幣媒介交易,以輔助政務單位的履職應用為目的。國家電子政務外網承擔著全國交易數據的歸集,也必然地成為面向政務部門資源共享的主要渠道。全國一體化政務服務平臺、全國政務信息共享平臺、國家公共資源交易服務平臺都是國家級數據開放平臺,采用統一的資源共享機制面向全國開放,以實名認證申請資源的方式,強化資源提供方與需求方的有機連接。
(七)跨部門跨地域的數據資源應用體系
公共資源交易數據資源的流通,推動跨部門、跨地域的業務協同,破除省際間招投標的壟斷分割,推動了競爭有序的全國統一大市場建設[6]。目前,接口資源的主體信息、交易成交記錄已用于實時支持南京、云南、海南等40多個地方交易系統的投標文件制作、評標業績審核、機器管招投標、主體庫等環節,簡化了招投標原有流程。部委業務協同上,為信易貸實時提供全國郵儲銀行中小企業融資評價服務,支撐住建部、國稅等單位行業中標項目的核查監管;現有面向社會的交易公告公示日訪問量達600萬次,新的應用場景需要不斷發掘。
(八)安全可信的數據安全體系
安全和可信貫穿交易數據的歸集、資源化、共享和應用全過程。作為政務數據資源,安全可信流通應反饋在“管得安全、查得精準、用得便捷”。網絡層面充分利用政務外網安全設備和策略做保障。數據層面無敏感信息,但需考慮系統支撐能力以及爬取大批量數據關聯時的業務價值,采用日訪問量限制、IP地址限制、每分鐘訪問次數限制等反爬策略,保障正常業務訪問,并防止數據批量外泄。
四、公共資源交易數據資源體系構建難點與建議
(一)資源化體系決定數據質量
數據資源應用成效關鍵在于數據的高質量,而數據的及時性、準確性、完整性是數據資源化體系的根本目的。資源化的過程中,數據治理任重道遠,如原始數據的金額單位元與萬元不清、金額填成手機號碼、行政區域代碼填成郵編,雖有監督和考核手段,各種錯誤依然層出不窮,建議資源化過程中增加結構化金額數值與公告公示大文本的比對校正,以及人工抽查。
(二)數據規范體系決定數據易用程度
同筆交易在不同資源的前后串聯,在不同交易環節的定位,以及分維度統計分析,是業務應用最為頻繁的場景。數據規范對于交易鏈條的串聯約束,若采用完全依賴主鍵的第三范式,在海量數據且需要大量表多次深度關聯的復雜依賴關系應用中,速度與效率非常低下。因此,數據規范的設計應“既保持函數依賴”又具有“無損連接性”,考慮將關鍵數據項復用到不同表,適當增加冗余換取時間效率。再者,規范對數據權屬的約束除對滿足數據生產者的追蹤外,需實現流轉周期對數據使用者的標識。
在大數據上升為國家戰略的背景下,公共資源交易數據資源體系應以服務政府和市場主體為本,打破省際物理疆界,滲透到跨部委跨省跨域的政務應用和社會應用中,利于交易數據的價值發現和價值變現,促進資源配置不斷優化。
參考文獻:
[1]? ?王叢虎.重視公共資源交易營商環境評價指標的構建[N].中國政府采購報,2019-10-01(3).
[2]? ?付宏燕.公共資源交易數據倉庫的構建[J].現代計算機,2022,28(5):46-51.
[3]? ?付宏燕.公共資源交易數據交換共享的設計與實現[J].計算機時代,2022(11):92-95.
[4]? ?付宏燕.區塊鏈在公共資源交易數據整合共享中的應用研究[J].現代計算機,2022(12):86-89.
[5]? ?付宏燕.公共資源交易平臺數據規范的研制與應用[J].現代計算機,2021(29):36-40.
[6]? ?付宏燕.京津冀公共資源交易協同發展成效評估研究[J].中國物價,2022(8):41-43.
[責任編輯? ?劉? ?瑤]