蔣 思,張文璐,盧軍強,李劍峰
基于大數據的政府采購風險防控策略探索
蔣 思,張文璐,盧軍強,李劍峰
(北京郵電大學 采購與招標辦公室,北京 100876)
該文以政府采購風險防控視角為例,運用大數據技術分析財政部發布的政府采購案例處理意見,構建風險防控系統,實證分析詳解問題成因,提出面向“放管服”的策略建議,有效率先規避風險,切實提高政府采購效率和管理水平,對今后政府采購項目執行具有重要的指導意義。
大數據;政府采購;風險防控
大數據分析技術為現代化治理提供了創新性的技術手段,構建政府采購的風險防控策略分析模型,捕捉客觀現狀、挖掘數據價值、及時學習經驗,對今后在采購實踐中提前發現和準確規避案例中涉及的類似問題,促進陽光采購的公開透明,助力政府監管治理決策更加精細化、科學化,全面提高采購經濟效能,具有重要意義。
2015年,國務院發布《促進大數據發展行動綱要》(國發[2015]50 號)[1]部署的三項主要任務就是一要加快政府數據開放共享,推動資源整合,提升治理能力;二要推動產業創新發展,培育新興業態,助力經濟轉型;三要強化安全保障,提高管理水平,促進健康發展。國務院辦公廳同年發布的《關于運用大數據加強對市場主體服務和監管的若干意見》(國辦發[2015]51 號)[2]中提出運用大數據創新政府服務理念和服務方式,提高市場主體服務水平;建立健全守信激勵機制、失信聯合懲戒機制;提高政府運用大數據的能力。2018年2月28日公布的十九屆三中全會公報,同樣提出深化推進國家治理體系和治理能力現代化的深刻變革。政策的促動和改革的需求,構筑了“互聯網+政府采購”的制度優勢,適應實踐發展的新要求,為政府采購行業的技術創新、融合監管帶來巨大機會。
逐漸健全的法制環境形成了社會共同監督環境,促進了供應商維權意識提高,相關的投訴舉報案件呈現上升趨勢,處理和解決相應案件耗費了采購人和監管部門的大量精力。本文以此為切入點,開展大數據技術應用在政府采購監管治理的風險防控策略實踐初探。
財政部作為政府采購的權威監管部門,在受理質疑、投訴、舉報后做出的調查決定,是行業專家精準把握政策后,做出的科學決策意見,體現了豐富的實踐經驗,因此對現有處理案例的分析是法律法規有效的補充指導意見,便于運用大數據技術根據大量歷史案例,總結具有指導意義的結論,掌握經濟規律,推動行業規范發展。
隨著大數據行業的蓬勃發展,機器學習和深度學習技術在各行各業廣泛應用,因此,以技術手段從數據中學習經驗,構風險防控策略分析模型,如圖1所示。從權威監管發布的內容著手,開展數據挖掘和數據關聯分析,應用機器學習和深度學習算法構建風險防控系統,并在此基礎上,融合案例的統計分布情況,挖掘熱點問題、追溯案例來源、細化事項分析,結合實際政策,提出面向“放管服”的風險防控策略,可以極大程度率先規避風險,幫助采購人總結判例要旨,提高管理水平,也為監管部門科學制定政府采購績效評價體系提供決策支持建議。

圖1 風險防控策略分析模型流程圖
構建風險防控系統,首先需要獲取與市場風險相關的數據資源,通過文本處理,以詞向量的語義表示形式構建政府采購領域的向量空間,為實現數據分析和文本分類奠定基礎。
財政部對案例的處理意見發布在政府采購信息處理公告欄[3],從外部獲取數據的主要途徑就是主題爬蟲,爬蟲搜索策略的制定直接影響到獲取的數據質量。基于分布式主題爬蟲策略,對每篇信息公告的內容根據主題相關性選擇搜索路徑,逐頁遍歷每篇公告的內容,解析網站返回的結果頁面,判斷獲取的關鍵詞相關性,以標簽形式對案件進行分類整理,便于后續研究開展標簽間的對比分析。
共獲取2010年到2017年底發布的全部510條數據,與信息公告文號一致,且全部采集數據均為非空文本,包括信息公告序號、發布時間、發布原因、相關當事人姓名、基本情況、處理結果、處理決定等,可以確定數據獲取策略的有效性。
在線內容是以文本內容形式存在的非結構化數據,并不能被機器所識別和計算。文本處理的意義就是將這些文本轉換成具有實際語義的詞,常用的經典分詞方法包括了詞典匹配、統計、神經網絡等算法,以及科研機構研制的成熟分詞工具,但因政府采購行業具有較強的領域特殊性,在算法和工具應用中不能準確識別專業詞匯,故采取近年來在深度學習領域最主流的詞向量表示技術,應用word2vec開源工具[4],將詞的表示轉換成固定維度的稠密向量,維度間的相互關聯保留了語義信息,從而便于在數據集中獲得較高的訓練效率。
基于深度學習的神經元分層連接結構原理是模擬人類大腦,在大規模數據集上自動學習抽象的深層文本特征,從而免去了傳統的機器學習方法中的特征抽取過程。對于沒有明確標注類別的新鮮語料,采用主流的聚類K-Means算法[5]進行無監督學習,基于計算案例內容的距離,選取不同的K值將相近案例集中在一起,生成集群標簽。在此基礎上,參考政府采購專家歸納總結的集中涉案類型[6],細化標簽類別,首選基于深度學習CNN[7]和RNN[8]模型的有監督學習訓練,然后以人工經驗矯正核驗,精確目標類別。
分類效果極大程度依賴于訓練文本的數量,同類型內容越多,其分類質量越高,經典的評價指標包括了準確率、召回率和F值。因涉及不同的案例類別,故對不同類別分別實現主流的機器學習和深度學習分類算法,構造不同的分類器,調整參數,優化結果。對每種分類器進行5折交叉驗證,可較好地評估分類效果。實驗結果表明,經典的線性回歸、樸素貝葉斯和捕捉上下文信息的RNN分類器在案例分類實驗中具有一定優勢,在案例原因和事項分析的八分類實驗中,最高準確率可達到74.2%和67.3%。
整合財政部在信息公告中的法規依據和實際案例,是技術融合政府采購的首次探索,“有理有據”的實證規律可以更加實質性地指導采購人落實主體責任,對招標采購全流程管理的水平提升起到明顯促進效果。
以柱狀圖對政府采購年度案件處理數量統計,結果如圖2所示。

圖2 財政部政府采購信息公告統計分布圖
從整體上看,政府采購處理案例在近5年呈現快速增長趨勢,案件總平均年處理量為64件。2017年財政部共發布125件政府采購處理案例,屬近年來最高;2015年發布處理案例106件,2013年發布處理案例94件。究其原因,這三年正逢國家對政府采購的監管執行加大力度,財政部于2013年發布《政府采購非招標采購方式管理辦法》(財政部令第74號),國務院于2015年發布《中華人民共和國政府采購法實施條例》,2017年發布修訂后的《政府采購貨物和服務招標投標管理辦法》(財政部令第87號),新法新規的實施對規范政府采購當事人的采購行為,加強對政府采購貨物和服務招標投標活動的監督管理,維護當事人的合法權益起到重要作用,也為采購人和監管部門帶來更大的監管責任和壓力。
對不同的案例標簽和其中包含的關鍵詞分類,構建政府采購行業的案例共詞“熱點”網絡。為體現案例焦點,突出特點,去除詞共現網絡中詞頻出現在5次以下的低頻低質詞,生成如圖3所示的關鍵詞云圖。
從圖3中可以看出以下三個特點:一是制度明確,監管部門對所有判決做到有法可依,各項法律法規出現的詞頻最高;二是流程規范,所有投訴和舉報事項,均依法調查、正式受理,經過嚴格的調查取證后,作出處理決定;三是熱點集中,貨物和服務類招標是案件高發區,競爭性談判在非招標采購方式的采購執行中存在較多問題。

圖3 案例關鍵詞云圖
基于聚類的實驗結果和共詞網絡,開展分類實驗,優化后的結果將公告內容分成8個類別,綜合8個類別歸納成4個大類,分別是投訴、舉報、檢查、和其他,圖4展示了歸類規則和層次關系。

圖4 案件來源分類比例圖
根據內容類別發現,監管部門在各項執法檢查中發現問題,從而發布處理決定的,在4大類中占比最高,達到46.6%;在案件受理后,監管部門開展了多方調查和項目檢查,特別是在2017年加強了在對投訴案調查處理環節中的審查,由此發現的違規情形數量在總投訴數量中接近1/3的比例,說明部分采購活動的開展過程存在潛在違規行為。其次是投訴的數量達到31.4%,且多數訴至監管部門的原因都是因為供應商對采購人或采購代理機構的質疑答復不滿,以此原因提出的案件占比為31.5%;采購人和供應商的直接舉報案件近年呈現小幅上漲趨勢,占比為19.2%;由于舉報案件,開展的監督檢查數量占比總數量將近一半。其他公告內容還包括了對代理機構的考核名單公告和通知公告等??上驳氖牵罅ΡO管收獲巨大成效,在2015年的專項檢查中發現的各類問題在2016和2017年明顯減少和消除。
共詞熱點發現聚焦問題,案例來源感知案例態勢,然后具體關注涉案事項,方能發現問題根源,總結判例要旨,提高監管質量。根據案例基本情況和投訴舉報內容實證分析,整合權威監管部門的決策結果,從圖5的堆積折線圖可以看出,問題集中在非合理性的超低價中標、串標圍標、廠家未授權或多家授權、存在不良記錄或違法記錄的企業中標、評審專家抽取不規范、評審過程不合規、虛假應標、以及招標文件編制不合理八個事項。近兩年最明顯的事項增長出現在了涉及招標文件和虛假應標這兩方面。

圖5 歷年累計涉案事項統計分布圖
3.4.1 招標文件涉案較多
涉及招標文件事項的投訴案例最多,是投訴事項的“重災區”。根據判決意見顯示,僅有23起最終因缺乏事實依據,駁回投訴。處理意見充分體現了招標文件的規范制定對規范采購行為,減少采購不良風險,提高采購質量起到關鍵作用。招標文件的投訴事項,主要分為兩個方面:—是采購需求的制定,集中出現在部分指標不能實質性響應招標文件的情況;存在傾向性等情況;部分招標文件未列明政府強制或優先采購節能、環境標志產品要求;還有對供應商需提供的資質和相關證書的設置上,具有條件限制條款等。二是評分標準的制定,部分招標文件對分值未量化[9],或存在評審標準中的分值設置未與評審因素的量化指標相對應的行為,有11個案例涉及此問題;出現了在價格分計算時以投標人報價算數平均值作為基準價進行價格打分、未給予小微企業產品價格扣除等情況;還有將投標人資格條件作為評分因素等。
3.4.2 虛假應標數量增長
以供應商虛假應標為由提起的案件數量逐年遞增,特別是在2017年出現驟增,全年出現25起,特別是3月和7月,分別發生6起;然而此類事項在2015年及以前一共14起;涉及虛假應標的案件累計發生62起,經監管部分查證后以缺乏事實依據駁回的案例僅13起,這意味著近80%的案件存在供應商明顯違反政府采購誠實信用原則、提供虛假材料謀取中標的情況,需要采購人和相關代理機構引起高度重視,在評審中加強監管,提高核查力度。
3.4.3 加強代理機構監管
財政部的檢查中還發現了關于代理機構的問題,一方面是采購公告問題,多數問題集中在政府采購信息公告內容不完整、中標公告的發布日期與中標通知書發出日期不一致、存在延長開標時間的變更公告發布時間不符合規定期限的情形、存在未在省級以上財政部門指定的媒體上發布政府采購信息的情形等。另一方面是采購執行中存在招標文件售價過高、招標公告與招標文件內容不一致、采購文件中規定保證金可以以現金形式支付、保證金的收取數額超過采購項目預算比例、逾期退還保證金等問題。目前越來越多的采購人委托采購代理機構開展政府采購業務,故對采購代理機構的專業化服務和自身約束的行為規范提出更高要求,避免投訴舉報事項的發生,保障采購計劃順利實施。
期待獲取更多的政府采購數據,開放多元數據平臺和接口,將大數據技術滲透在政府采購行業的全流程?;诤暧^經濟數據、法律法規、同類采購項目執行情況等的多維數據綜合分析,發現行業的規律性趨勢、影響因素、先行指標等,構建行業發展的趨勢預測模型[10];多層次的數據驗證,有助于提高采購人對供應商和代理機構的監管水平,以技術手段把握失信、違法等判定的實時情況,審核供應商資質,對虛假投標、圍標串標等現象,提前預警,準確評估供應商的產品質量和服務水平,從而有效規避違法案件的發生;文本分析采購人對供應商的反饋評價信息,便于及時發現和解決問題,落實采購實踐,提高采購質量。
強化事前監督,嚴格源頭管理,強化全體采購相關參與人在政府采購全流程環節主體責任,加強內部管控,優先內部質疑,率先防控風險,規范行為,從源頭上減少外部質疑的發生,切實做到讓政府采購項目經得起質疑[11]。數據開放促使先進技術可以全面感知不同采購人的多樣化需求,及時作出具有針對性的響應,從而實現供需之間的良性互動[12]。權威監管部門以此構建的科學政府采購評價體系,有助于提高資金的使用效率和透明度,引導政府采購工作科學開展,實現技術驅動、精準服務。
政府采購品類的不斷增加以及市場加速發展,共同促使產品專業性越來越強,“答疑”“釋疑”的難度也在增加。采購人應練好內功,不斷提高業務水平,增強運用專業知識處理政府采購實務的能力,整合數據、優化流程,利用技術手段改善人力資源局限[13],提高政府采購管理水平,全面提升更有效的決策信息支持,合力提升政府采購監管質量,提高政府采購工作效率,推動政府采購更加規范透明,服務市場主體全面發展。
本文是大數據分析技術融合政府采購行業數據分析的創新實踐。依托財政部政府采購處理案例,以技術手段構建風險防控策略分析模型。結合案例中的熱點問題,提出面向“放管服”的風險防控策略建議,實現了以現代化技術在監管治理的應用,提升了監管質量和采購效率。期待在大數據推動的數據開放、融合共享的新時代背景下,不斷加強融合創新,助推政府采購行業的科學發展。
[1] 國務院.國務院關于印發促進大數據發展行動綱要的通知[EB/OL]. http://www.gov.cn/zhengce/content/2015-09/05/content_ 10137.htm.
[2] 國務院辦公廳.國務院辦公廳關于運用大數據加強對市場主體服務和監管的若干意見[EB/OL]. http://www.gov.cn/zhengce/content/2015-07/01/content_9994.htm.
[3] 中國政府采購網.財政部政府采購信息公告欄[EB/OL]. http: //www.ccgp.gov.cn/gg/.
[4] Google. Tool for computing continuous distributed representationsof words[EB/OL]. https://code.google.com/archive/p/word2vec/.
[5] Coates A, Ng A Y. Learning Feature Representations with K-Means[J]. Lecture Notes in Computer Science, 2012, 7700: 561–580.
[6] 郭綱,郭秀娟.政府采購中的投訴舉報問題及其對策:以沿海某縣級市為例[J].中國經濟周刊,2017(40): 78–80.
[7] Dundar A, Jin J, Culurciello E. Convolutional Clustering for Unsupervised Learning[J]. Computer Science, 2015: 1143–1151.
[8] Mikolov T, Karafiát M, Burget L, et al. Recurrent neural network based language model[C].INTERSPEECH 2010, Conference of the International Speech Communication Association, Makuhari, Chiba, Japan, September. DBLP, 2010: 1045–1048.
[9] 張志軍,邵月娥.編制采購文件如何避免質疑投訴[J].中國招標,2016(6): 11.
[10] 申孟宜,谷彬.論大數據時代的政府監管[J].中國市場,2014(36): 32–40.
[11] 李外禾.大數據時代涪陵政府采購監管機制研究[J].學理論,2016(12): 68–70.
[12] 于施洋,楊道玲,王璟璇,等.基于大數據的智慧政府門戶:從理念到實踐[J].電子政務,2013(5): 65–74.
[13] 何哲.人工智能時代的政府適應與轉型[J].行政管理改革,2016(8): 53–59.
Exploration on risk prevention and control strategy of government procurement based on big data
JIANG Si, ZHANG Wenlu, LU Junqiang, LI Jianfeng
(Procurement and Bidding office, Beijing University of Posts and Telecommunications, Beijing 100876, China)
By taking the risk prevention and control perspective of government procurement as an example, this paper uses big data technology to analyze the case handling opinions issued by the Ministry of Finance, construct the risk prevention and control system, and to empirically analyze the causes of the problems, and puts forward some tactical suggestions for “Putting in custody” so as to evade risks effectively and improve the efficiency and management level of government procurement, which has important guiding significance for the implementation of government procurement projects in the future.
big data; government procurement; risk prevention and control
F253.2
A
1002-4956(2019)07-0277-05
10.16791/j.cnki.sjg.2019.07.069
2018-12-18
2019-05-10
蔣思(1989—),男,北京,碩士,研究方向為風險管理和大數據分析.E-mail: jiangsi@bupt.edu.cn