豐景春,馬佳佳,馮同祖,陳潤東,馮海瑜
(1.河海大學商學院,江蘇 南京 211100; 2.江蘇省“世界水谷”與水生態文明協同創新中心,江蘇 南京 211100;3.河海大學項目管理研究所,江蘇 南京 211100; 4.廣西壯族自治區水利廳,廣西 南寧 530023;5.廣西壯族自治區水利工程建設管理中心,廣西 南寧 530023)
水行政建設主管部門重視信用等級在水利工程建設政府監管中的作用,水利建設市場主體信用等級對于提升政府監管效率和效果具有重要作用。2012年,王偉國[1]探索了誠信體系建設的法治保障,提出了要加強政務誠信、商務誠信、社會誠信和司法公信建設的提議。隨后,中國共產黨第十八次全國代表大會采納了該提議,將誠信建設的規范化、法治化提上日程;2014年,《社會信用體系建設規劃綱要(2014—2020年)》[2]指出要加快建設“以信用信息資源共享為基礎的覆蓋全社會的征信系統”。按照國務院“放管服”改革[3]的精神,需要構建以信用為核心的集行政手段、市場手段、社會手段為一體的社會化監管體系。信用等級是政府監管的基礎,為此,需要開展準確的信用評價工作[4]。《水利建設市場主體信用評價管理辦法》[5]規定了信用評價的內容,包括水利建設市場主體的綜合素質、財務狀況、管理水平、市場行為和信用記錄5個部分。針對勘察、設計、施工、監理、咨詢、招標代理、質量檢測、機械制造這8類水利建設市場主體,應分別進行信用評價。
通過分析水利部的信用評價指標體系,8類水利建設市場主體信用評價的一級和二級指標基本相同,而三級指標因主體類型不同而存在差異。水利建設市場主體信用評價指標體系存在以下問題:一是指標體系中大多數指標與企業規模相關,如經營規模中的年產值,創新能力中的主編或參與編制技術標準等,直接造成企業規模越大,其信用等級越高,而中小企業信用等級得分則遠低于大型企業,造成了不公平;二是有些指標較難量化,如積極參加行業自律活動就難以量化。總之,水利部推行的信用評價辦法中的指標與企業規模顯著相關,難以反映中小企業信用的真實水平。
為此,相關學者開展了水利建設市場主體信用與政府監管之間的關系以及信用評價方法等方面的相關研究。楊高升等[6]通過構建水利工程政府監管成效評價模型,改善了政府監管成效和水平,但未能從根本解決水利工程范圍廣大與政府監管力量薄弱的問題;費凱等[7]通過構建政府監管與市場主體誠信行為之間的演化博弈模型,得出政府直接監管和間接監管與市場主體誠信和不誠信間的演化博弈路徑,并提出將信用評價作為政府監管的有力抓手、轉變政府監管模式的建議;鄭曉利等[8]基于一次與多次博弈模型,分析承包商信用缺失動機形成的原因,研究發現無法長久合作致使承包商為了眼前利益選擇失信,提出信用是降低失信風險的重要手段。管曉永[9]、豐景春等[10]將大、中、小企業進行無差別信用評價研究,容易造成評價結果失真,打擊中小企業對于守信行為的積極性,不利于行業誠信風氣發展;李戰江[11]考慮到中小企業信息不透明、經營規模較小等特點,將定性與定量指標結合、增大定性指標所占比重,提升了中小企業信用評價的科學性,但該研究無法滿足實際應用需求;張可等[12]基于政府監管視角,從企業基本情況、管理能力、經濟能力、項目管理能力及信用行為構建信用評價指標體系,具有參考價值,但多數指標與企業規模相關;簡迎輝等[13]通過問卷調查法得到市場主體對信用評價指標的認同度,刪去認同度低的指標、提高認同度高的指標權重,但未對改進后評價指標體系在提高市場主體滿意度或提升信用評價準確度等方面進行驗證;王龍寶等[14]構建的信用評價指標體系體現出水利特色,但指標大多與規模相關,評價結果無法體現中小企業的真實信用水平;李晟等[15]為解決信用信息不對稱的問題,提出信用信息共享激勵的博弈模型,視角新穎,但未能從根本上解決信用評價結果不夠準確的問題。
有關信用評價方法方面的研究,部分學者采用層次分析法[16]、模糊綜合評價法[17]及專家打分法[18]等方法,評價結果具有參考價值,但主觀性較強,科學性有待提升;Logistic回歸[19]、BP神經網絡[12]等方法使信用評價變得更客觀、科學,但信用評價問題屬于非線性問題,對此類問題Logistics回歸模型的適用性較差,BP神經網絡模型對數據質量要求較高且可解釋性較差;機器學習在處理大規模數據上的效果和準確率十分顯著,部分學者結合決策樹[20]、AdaBoost和XGBoost等方法[21-22]構建信用評價模型,提高了準確性和模型效率,但存在靈活性較差、十分依賴數據、可解釋性較低等問題。貝葉斯網絡[23-24]利用圖模型理論和統計學知識表示屬性與結果之間的關系,依據類別的先驗分布計算分類結果的后驗概率,選擇后驗概率最大的屬性作為最可能的類,這種特質使貝葉斯網絡在分類方面具有較高的準確性與效率。郭春香等[25]使用貝葉斯網絡對個人信用進行評價,克服了神經網絡分類結果難以解釋的缺陷。貝葉斯網絡分類模型在數據集質量一般的情況下,仍有較好的分類效果。王龍寶等[14]針對水利建設市場主體信用數據質量低、數據冗余、信息孤島等問題,造成水利工程建設違約違規、失信及重大安全事故發生的可能性大大提升,開展了水利建設市場主體信用信息共享方面的研究。
為了提高水利建設市場中小企業信用評價結果的準確性,提升中小企業對守信行為的積極性,避免大型企業對誠信的懈怠情緒,正向發揮信用評價結果在政府監管中的積極作用,本文選擇將與企業規模關聯性較弱的信用評價指標納入現有信用評價指標體系,采用貝葉斯網絡等方法,研究并構建水利建設市場主體信用評價模型。
通過分析發現,水利建設市場主體(包括勘察、設計、施工、監理、咨詢、招標代理、質量檢測、機械制造等企業)的信用意愿、信用記錄、研發經費占比等指標與企業規模關聯度較弱,而這些指標能夠較為公平地反映小型企業的信用狀況。為此,借鑒與水利建設市場主體信用評價研究的相關成果[12-14],增加信用意愿、信用記錄、研發經費占比等方面的指標,構建水利建設市場主體的信用評價體系,以同時適應大中型企業信用評價的需要。
a.經營情況。包括企業資質、經營年限、設施設備3部分。企業資質由施工許可證、施工資質證書的數量及級別來表現;經營年限由施工企業的注冊時間決定;設備設施由企業所有的施工設備數量決定。經營情況是企業遵守誠信的基礎,在經營不善、運轉不周的情況下,企業幾乎沒有精力去考慮信用問題。
b.人員素質。包括企業法定代表人素質、教育培訓、成果轉化3部分。企業法定代表人素質由企業法定代表人的學歷衡量;教育培訓由近3年開展的教育培訓次數及涉及人數決定;成果轉化由編著及專著教材決定。人員素質與企業員工的專業能力和道德水平密切相關,企業的生命是由人賦予的,人員素質對企業的信用水平有非常重要的影響。
c.財務狀況。包括資金負債、資金利潤、營業收入增長率3部分。這3個指標在很大程度上能夠反映企業的財務狀況。良好的財務狀況是企業運作的基石,是企業開展所有活動的基礎,是企業維持信用水平的重要保障。
d.信息化與科研水平。包括信息化程度、研發經費投入、科研創新能力3部分。信息化程度可以反映企業的信息化水平;研發經費投入由投入金額占營業收入比例決定;科研創新能力由期刊文獻發表、新方法新工藝、專利發明數量等方面來衡量。信息化與科研水平在一定程度上能反映企業的信息公開程度及新技術應用能力和發展潛力,對企業信用有重要影響。
e.信用意愿。包括企業文化活動組織、慈善公益活動參與、信用評價報名登記3部分,它們分別取決于3年內企業文化活動組織次數、3年內慈善公益活動參與次數和信用評價報名登記記錄。信用意愿是表現企業主動承擔社會責任、建立積極企業文化的意愿,不屬于企業的經營活動,由企業自主選擇。
f.信用記錄。包括單位獲獎表彰表揚情況、不良信用記錄、銀行授信3部分。信用記錄是有關部門對企業經營實踐行為的客觀記錄,也是對企業守信與否的公開記錄,能夠客觀且直接地表現企業的守信情況。
在上述分析的基礎上,構建了水利建設市場主體信用評價體系,見圖1。

圖1 水利建設市場主體信用評價指標體系
在圖1中,經營情況、財務狀況、信息化與科研水平和信用記錄及其包含的二級指標為經營事實記錄,該部分指標與企業規模相關性較強;信用意愿及其包含的二級指標,人員素質中的教育培訓與成果轉化,不良信用記錄及信息化與科研水平中的研發經費投入占比,這部分指標既能有效體現企業的信用水平,又與企業規模的關聯性較低。
設輸入空間χ∈Rn,Rn為n維向量集合,輸出空間為類標簽集合γ={c1,c2,…,ck},其中,k為輸出類標簽的數量,ck代表第k個類標簽的具體類型。X是定義在輸入空間χ上的向量,Y是定義在輸出空間γ上的隨機變量,其中X={X1,X2,…,Xn}是屬性變量集,Y是類變量,其取值空間為{c1,c2,…,ck},則根據貝葉斯定理,樣本xi=(x1,x2,…,xn)屬于cj的概率可表示為
P(Y=cj|X=(x1,x2,…,xn))=
αP(cj)P(x1,x2,…,xn|cj)
(1)
式中:P為概率;Y為類變量表示信用分類;cj為分類變量,j=1,2,…,k;X為輸入空間χ上的向量;xi為第i個指標屬性值,i=1,2,…,n;P(Y=cj|X=(x1,x2,…,xn))為當指標屬性輸入值為(x1,x2,…,xn)時信用等級分類為cj的可能性;α為正則化因子;P(cj)為類cj的先驗概率;P(x1,x2,…,xn|cj)為類cj關于xi的似然。由概率的鏈式法則,式(1)可以表示為
P(cj|x1,x2,…,xn)=
(2)
式中:α為正則化因子。貝葉斯分類模型的目標是確定一個映射函數f(x1,x2,…,xn)→Y,使得對任意的未知類別的實例xi=(x1,x2,…,xn)能夠依據貝葉斯后驗概率最大化準則,選擇后驗概率P(cj|x1,x2,…,xn)最大的類作為該實例的類標簽。利用貝葉斯網絡處理輸入數據集,輸出類標簽,這一過程的本質就是利用貝葉斯網絡求解式(2),得到同一數據集分類結果的最大后驗概率,其中概率最大的分類標簽即為貝葉斯網絡預測的分類結果。
將各級信用指標與信用等級間的影響關系通過貝葉斯因果關系[26]表示,構建水利建設市場主體信用評價貝葉斯網絡結構見圖2。

圖2 貝葉斯網絡結構
為了對條件概率進行訓練,需要選擇信用等級分布,本文以水利部信用評級評價標準作為參考,它由AAA、AA、A、BBB、CCC這5種評價結果組成,其中,AAA表示信用極好,AA表示信用優良,A表示信用較好,BBB表示信用欠佳,CCC表示信用極差。
根據水利部對水利建設市場主體的5種信用評價等級設計,目標層節點C狀態屬性集{state AAA, state AA, state A, state BBB, state CCC},表示的是評定指標的概率。一級指標層A1~A6狀態屬性集{state HIGH,state LOW},表示該指標層狀態的評價高級、低級。二級指標層B1~B18狀態屬性集{state HIGH,state LOW},表示該指標層狀態的評價高級、低級,任意一個節點的兩種狀態的概率之和均為1。
以水利建設市場主體信用評價為研究對象,在對比分析貝葉斯網絡分類算法模型相關研究成果[23-25,27]的基礎上,本文設計信用評價模型算法流程如圖3所示。首先將數據集分為訓練集和測試集,根據信用評級的5個分類維度進行選擇,并使用模型進行概率學習;然后經過關系概率學習后得到分類先驗信息和診斷先驗信息,經貝葉斯網絡學習得出信用評價分類的標簽;再根據測試集的分類結果調用其診斷關系概率;經過貝葉斯網絡學習診斷出其關鍵節點,最后得出貝葉斯網絡的關系概率。

圖3 水利建設市場主體信用評價貝葉斯網絡模型算法流程
先驗關系概率的訓練與優化是信用評價貝葉斯網絡關鍵節點診斷過程中模型運行的基礎。本文通過Netica軟件進行仿真,構建貝葉斯信用評價網絡模型,將訓練集輸入貝葉斯網絡,得到表達信用等級與各模型節點之間關系強度的先驗概率。在模型實證過程中,對測試集的信用評級進行預測,經推導得到不同節點實際發生的概率分布,以及評定為5種信用等級的概率,從而實現一個完整的信用評價診斷過程。
通過數據訓練得到貝葉斯網絡的條件概率集,以施工企業信用評價為例,從全國水利建設市場信用信息平臺獲取信用評級數據,根據從業單位統一信用代碼,從廣西水利數據庫中獲取有關單位的數據,組成仿真所需的數據集。指標說明見表1。

表1 模型仿真指標層說明
基于本文構建的評價指標體系,在Netica軟件中設置貝葉斯網絡初始節點及規則,初始狀態見圖4。

圖4 初始貝葉斯網絡結構
將50家施工企業的訓練集數據輸入Netica軟件構建的貝葉斯網絡信用評價模型中,對貝葉斯網絡輸出的分類標簽和關鍵節點診斷進行置信度判斷,滿足置信度要求的,可以用于修正現有貝葉斯網絡模型的關系概率,通過數據訓練將貝葉斯網絡模型邊緣概率變量離散化,得到水利建設市場信用評價貝葉斯網絡模型的邊緣概率見表2。

表2 訓練所得貝葉斯網絡模型節點條件概率(部分)
以第一行為例,若某企業在6個一級指標評價均為HIGH的狀態下,得到信用評價為AAA、AA、A、BBB、CCC的概率分別為40%、24%、31.2%、4.3%、0.5%,其中AAA的概率最大,則該狀態對應的信用等級為AAA。
模型訓練結束后得到水利建設市場主體信用評價模型,將11個測試數據集輸入模型進行測試,測試集的仿真運算結果及一級指標節點狀態見表3。

表3 貝葉斯網絡模型測試結果
根據表3,11個測試集樣本中有10個樣本的輸出預測結果與實際信用評級一致,在數據質量一般的情況下,選擇后驗概率最大的信用等級作為信用等級預測結果,準確率為90.91%。
樣本3的后驗概率的貝葉斯網絡結構如圖5所示。將樣本3的不同節點的數據錄入評價模型中,得到信用等級預測結果為A的概率,其概率為35.8%,它高于其他信用等級的預測概率,樣本3的信用等級預測結果為A。其他樣本信用等級預測結果采用相同的方法得到。

圖5 樣本3貝葉斯網絡評價信用等級概率分布結果
a.在現有水利建設市場主體信用評價指標體系的基礎上,通過增加信用意愿、信用記錄、研發經費占比等方面的指標,據此建立了水利建設市場主體信用評價指標體系,它可以有效地解決現有評價指標體系中有關企業規模指標過多的不足,即本文構建的評價指標體系能夠較為公平地滿足大、中、小型企業信用評價的需要。
b.構建了水利建設市場主體貝葉斯網絡信用評價模型,提高了信用等級評價準確率。利用數據集對模型進行訓練得到信用評價模型,通過測試集數據對該模型進行測試,90.91%的企業信用評級測試歸類結果與實際歸類結果相一致,有較高的準確率。
c.根據本文模型得到的水利建設市場主體信用等級確保了公平性和準確性,從而能夠為政府監管提供有效的依據,有利于形成以信用為核心的工程建設社會化監管體系和差異化監管體系。