








摘要:全面識別PPP項目績效付費行為,對于完善PPP項目制度有重要作用。通過設計PPP項目績效付費行為文本挖掘流程,構建文本數據庫,對文本進行分詞及去停用詞處理,挖掘行為關鍵詞,對關鍵詞聚類分析,識別出PPP項目績效付費行為,即合作行為、機會主義行為和合謀行為。研究成果可為PPP項目績效付費行為研究提供理論參考。
關鍵詞:
PPP項目;績效付費行為;文本挖掘
0引言
根據財政部政府和社會資本合作中心項目管理庫的數據,我國超過90%的PPP項目基于績效付費。PPP項目參與主體在內外環境影響下做出的能動反映,主要包括行為主體和行為手段。項目公司可能出于契約精神或社會責任,按照績效標準積極完成績效目標,也可能由于自身逐利本性不按照績效標準完成績效目標,而采取機會主義、行賄監督部門等行為,使未達到績效標準的產品或服務得到超額支付。在績效付費過程中,績效監督機構和項目公司選擇不同的付費行為,直接影響不同的績效結果和最終支付額度,甚至影響項目效益。因此,要制定一套完善的PPP項目績效付費制度,需要系統地識別出PPP項目績效付費行為。
現有研究中PPP項目績效付費行為有合作行為,如張云華等[1]通過計算實驗方法研究PPP項目多主體協同合作行為;鄒國良等[2]基于演化博弈理論分析鄉村振興戰略下農村人居環境整治PPP模式中參與者的合作行為;孫謀軒等[3]研究公私制度邏輯沖突與社會資本在PPP項目中的合作行為作用關系。除了合作行為,PPP項目績效付費行為還存在機會主義行為,如Liu等[4]通過演化博弈理論研究PPP項目運營期私人投資者機會主義行為演化;Sanda等[5]研究PPP項目中利益相關方的機會主義行為;王天日等[6]建構了基于Moran過程的博弈模型,探討抑制PPP項目承包商機會主義行為策略的條件。從現有研究看,目前對PPP項目績效付費行為進行系統識別的研究較少,而隨著PPP項目的發展,網絡上涌現出大量PPP項目績效付費案例,較為全面地反饋了現有PPP項目績效付費的實施過程和經驗,這些案例中包含了對PPP項目績效付費行為的描述。應用文本挖掘技術對這些案例進行挖掘,可全面系統地識別出PPP項目績效付費行為。
文本挖掘技術是數據挖掘技術的一個分支,是從文本數據中抽取出有價值的信息和知識的計算機處理技術。目前,文本挖掘技術已被應用于因素和行為挖掘識別。例如,陳芳等[7]利用文本挖掘技術從空中危險接近事件中挖掘出導致接近事件的因素;田水承等[8]利用文本挖掘技術從國內大量建筑施工坍塌事故調查報告中挖掘出導致安全事故的影響因子;姜早龍等[9]通過文本挖掘技術對社交媒體上的老舊小區改造話題進行挖掘,識別出不同主題的熱點話題;薛楠楠等[10]通過文本挖掘技術從大量建筑安全事故報告中挖掘出建筑工人不安全行為。因此,本研究基于文本挖掘技術設計PPP項目績效付費行為文本挖掘流程,對大量PPP項目績效付費案例進行挖掘,以全面識別PPP項目績效付費行為。
1文本挖掘流程設計
文本挖掘與數據挖掘流程基本相似,二者關鍵區別在于數據挖掘的對象是結構化數據,文本挖掘的對象是非結構化的自然語言,而計算機無法直接理解非結構化的自然語言,需先通過自然語言處理技術將其轉變為計算機可理解的結構化數據,再進一步挖掘分析。
文本挖掘的一般流程為:文本獲取→形成待挖掘文本數據庫→文本預處理→形成結構化數據→文本數據分析→結果可視化→發現規律。文本獲取后,形成文本數據庫,通過文本預處理將非結構化文本轉換成用特征詞表征的結構化數據,然后通過數據聚類、關聯等,挖掘文本與文本之間的內在規律。
然而,本研究對PPP項目績效付費行為的挖掘識別是先將隱藏在大量案例文字中的行為關鍵詞挖掘出來,再對其聚類,以識別出PPP項目績效付費行為。因此,本研究的文本挖掘流程分為三步:第一步,文本獲取,構建文本數據庫;第二步,數據處理,挖掘行為關鍵詞;第三步,行為識別,進行行為關鍵詞聚類,識別出PPP項目績效付費行為。文本挖掘流程圖如圖1所示。
2文本獲取
文本獲取是指對網絡上與研究主題相關的文本進行收集,形成文本數據庫。本研究的案例來自各國PPP官方數據庫、世界銀行PPI數據庫、專業機構報告、文獻案例、網頁案例、中國裁判文書網,最終篩選出三個渠道,即專業機構報告、網頁案例及中國裁判文書網。PPP項目績效付費行為文本數據庫來源如圖2所示。
21專業機構報告
北京明樹數據科技有限公司發布的專題報告《可用性付費模式應用的國際經驗總結與借鑒——以交通基礎設施項目為例》列舉了12個項目案例,均包含PPP項目績效付費相關內容,因此,將這12個項目案例納入本研究文本挖掘數據庫。
22網頁案例
通過百度、谷歌搜索引擎,以“PPP”“BOT”“成功”“失敗”“案例”為關鍵詞進行搜索,在搜索結果中盡量選擇權威或較有公信力的網站發布的案例。搜索到13個成功案例(國家發展與改革委員會公布)、21個失敗案例(搜狐網),其中有兩個失敗案例是項目前期問題導致的,將這兩個案例剔除,共保留32個案例資料。
23中國裁判文書網
在中國裁判文書網主頁搜索欄中以“PPP”“BOT”“工程”為關鍵字進行搜索,得到1354個文書。通過對這些文書進行閱讀,發現其中較多的為建設期施工合同糾紛案件,不涉及績效付費行為。最終篩選得到4份民事裁定書、1份民事判決書和1份行政裁定書,共6份案例資料。PPP項目績效付費案例文本數據庫資料來源及數量見表1。所收集的案例中,國內案例有34個,占比68%;國外案例有16個,占比32%。
3文本處理
對文本中淹沒、隱藏的行為關鍵詞進行挖掘,需要先將文本中的語句切分成單個詞匯,然后清洗淘汰無用信息,最后保留PPP項目績效付費行為相關詞匯。具體流程分為兩步:一是分詞(Word Segmentation),二是去停用詞(Remove Stopwords)。
31分詞
分詞是指將語句文本分割成詞或詞組并按照一定的規范重新組合詞序列的過程。本研究文本資料包含大量專業術語,采用統計和理解的分詞算法會造成專業詞匯無法識別,因此采用基于詞典的分詞方法。該方法能有效準確地分詞的關鍵是建立與文本資料專業相符的專業詞庫(或稱“專業詞典”)。
311PPP項目績效付費行為文本分詞詞庫構建
目前,有關專業詞庫構建方面的研究較少。王愛華[11]針對工程項目腐敗行為構建領域詞表,但該詞表無法獲取。搜狗詞庫收錄了工程領域專業詞表,但無PPP項目績效付費行為專業詞表。本研究對于搜狗詞庫中與本研究相關的城市信息大全、社會科學、工程與應用科學三大類詞庫進行下載,以作為基礎詞庫,并在此基礎上構建PPP項目績效付費行為專業詞庫。
312分詞程序設計
構建PPP項目績效付費行為專業詞庫后,采用Python語言編寫分詞代碼程序,以實現對文本分詞。分詞主要程序是讀取文本數據庫中文本的路徑、標題及每個文本的內容,存儲到數據庫中,導入jieba工具加載上述建立的詞庫,讀取數據庫中的每個文字或單詞,判斷是否出現在詞庫中。如出現,則按專業詞庫分詞;如未出現,則按單字分詞。分詞實現流程設計圖如圖3所示。
32去除停用詞
對文本進行分詞處理后,需要將不具有實際含義的詞移除,以降低對文本挖掘的干擾。
321停用詞表構建
本研究采取停用詞表的方法去除停用詞。第一步是構建停用詞表。在全球最大開源代碼網站Github中下載通用停用詞表。該網站提供了百度、哈爾濱工業大學及四川大學的通用停用詞表。本研究分詞結果中包含了大量城市名稱、項目名稱、部分專業術語等,這些詞匯對本研究毫無意義,需要去除。但這些詞匯沒有包含在停用詞表中,不能滿足本研究需求,因此需要在此基礎上構建PPP項目績效付費行為停用詞表。停用詞表構建與停用詞去除相輔相成,首先用通用停用詞表去除部分停用詞,然后再將去除停用詞后的結果與PPP項目績效付費行為不相關詞一起添加到停用詞表。
322去除停用詞程序設計
去除停用詞思路為:首先加載停用詞表,然后匹配分詞結果與停用詞表。當分詞結果中包含停用表中的字符或詞匯時,去除該詞。去除停用詞實現流程設計圖如圖4所示。本程序過程采用Python語言編寫。
4行為識別
對文本清洗后的PPP項目績效付費行為關鍵詞進行詞頻統計,采用詞云法展示詞頻較高的關鍵詞。首先,基于Python采用groupby函數將相同關鍵詞聚合;其次,采用numpysize函數對聚合的關鍵詞進行個數統計;最后,采用wordcloud函數對關鍵詞進行詞云繪制。詞云中詞匯大小與其自身出現頻率呈正相關。通過運行程序,PPP項目績效付費行為文本關鍵詞詞頻見表2,PPP項目績效付費行為文本挖掘詞云圖如圖5所示。
圖5中關鍵詞出現頻率越大,字體越大。PPP項目績效付費行為比較突出的關鍵詞有:付費、扣費、違約行為、拖欠、合作、終止合作、運維不達標。這些詞也是PPP項目績效付費行為中的具體行為,從詞云中可看出這些具體行為的出現概率。
41行為關鍵詞聚類
從行為驅動力(即利益)的角度對以上具體付費行為詞匯進行聚類:部分詞匯表征了“為他”的PPP項目績效付費行為,如“付費”“合作”“按約定時間”“良好的大修”等,這些行為可視為良好合作的行為;部分詞匯代表了“為己”的PPP項目績效付費行為,如“拖欠”“運維不達標”“違約行為”“擅自”等,這些行為往往破壞政府與社會資本的合作,或產生不良后果。因此,將這些具體付費行為詞匯聚類為合作行為和不合作行為,PPP項目績效付費行為初步聚類如圖6所示。
42PPP項目績效付費行為識別
在圖6的合作行為中,賄賂、大肆收受、尋租正好符合“合謀行為”的定義。合謀行為是指工程利益相關方相互串通立場,通過正當或不正當的手段侵蝕項目利益或公共利益的行為[12]。因此,可將此類行為歸為合謀行為。
在圖6的不合作行為中,運維不達標、拖欠、違約行為、腐敗、缺乏足夠的監督、擅自、主體責任不落實、隱患排查治理不徹底、不能繼續履行、違反合同均為單方的自顧行為,正好符合“機會主義行為”的定義。機會主義行為被認為是“狡猾的自利追逐”[13],是社會經濟活動中一種常見行為。根據新制度經濟學對人的假設,人是追求效用最大化的。人們在追求自身效用最大化時,往往會借助各種不正當手段謀取自身利益,不遵守約定和服從信用約束,損害他人利益,可將此類行為歸為機會主義行為。
因此,進一步將PPP項目績效付費行為聚類為合作行為、機會主義行為和合謀行為。PPP項目績效付費行為聚類識別如圖7所示。
5結語
本文通過收集PPP項目案例,采用文本挖掘技術識別出PPP項目績效付費行為關鍵詞,基于利益對行為的驅動力,聚類識別出合作行為、機會主義行為和合謀行為。
合作行為是PPP項目績效付費行為中最基本、最常見行為,也是項目持續發展的基礎。合作行為意味遵守項目約定,各自履行職責,社會資本按照約定時間運營維修,并進行良好的大修,持續履行自己職責;績效監督機構定期檢查,及時全面地評價社會資本績效;政府依據評價結果按照規定對社會資本進行付費。另外,在項目運行過程中,參與主體在完成各自職責過程中還可能為其他參與者提供工作便利,互惠互利,促使合作更加緊密,項目發展更加健康。
機會主義行為是一種自私自利的行為,通常為了自身利益而做出損害他人利益的行為。PPP項目績效付費中也經常存在這種行為,如社會資本違反合同約定,在運維過程中主體責任落實不明確,隱患排查治理不徹底,導致運維不達標,損害政府或公眾利益;績效監督機構不嚴格監督,對社會資本績效無法準確評估;政府擅自挪用PPP項目應付款項,對社會資本拖欠付費或不合理扣費等。這種行為如果存在較多且持續時間較長,會使項目效益受損,嚴重的還可能使項目被迫終止。
合謀行為是PPP項目績效付費中因委托代理關系的存在,作為代理方的績效監督機構與作為委托方的政府之間存在信息不對稱,績效監督機構與社會資本合謀,以此追求自身利益最大化的行為。例如,績效監督機構尋租,放松監管或修改績效評價結果,使社會資本在不完成績效目標的情況下獲得足額支付。
針對PPP項目績效付費中的機會主義行為和合謀行為,應采取一定的抑制措施,如提高項目透明度,讓公眾參與監督,阻斷不良行為的發生;優化績效付費系數,激勵社會資本積極完成約定內容;提高合謀懲罰,震懾雙方不敢采取合謀行為。
隨著時間的推移,網絡上還會出現更多的PPP項目案例,后續研究中可從更廣闊的渠道收集案例,以更加全面地識別PPP項目績效付費行為。
參考文獻
[1]張云華,伊弘陽基于計算實驗的PPP項目多主體協同合作行為激勵仿真研究[J]技術與創新管理,2022,43(4):441452
[2]鄒國良,劉娜娜,梁雁茹鄉村振興戰略下農村人居環境整治PPP模式合作行為演化博弈分析[J]運籌與管理,2022,31(4):6168
[3]孫謀軒,朱方偉公私制度邏輯沖突與社會資本在PPP項目中的合作行為研究[J]南開管理評論,2023,26(3):233245,256
[4]LIU J,GAO R,CHEAH C Y J,et alEvolutionary game of investorsopportunistic behaviour during the operational period in PPP projects[J]Construction Management & Economics,2017,35(13):137153
[5]SANDA Y N,ANIGBOGU N A,IZAM Y D,et alManaging stakeholder opportunism in PublicPrivate Partnership(PPP)housing projects[J]Journal of Construction in Developing Countries,2022,27(1):213228
[6]王天日,郭靖云,王海濤,等基于Moran過程的PPP項目承包商機會主義行為演化動態[J]技術經濟,2020,39(8):168173
[7]陳芳,沈芮宇基于文本挖掘的空中危險接近事件致因研究[J]安全與環境學報,2022,22(6):32803287
[8]田水承,王雪晨,范彬彬基于文本挖掘的建筑施工坍塌事故致因研究[J]西安科技大學學報,2022,42(5):849855
[9]姜早龍,李荷老舊小區改造的公眾關注熱點及推進策略研究——基于文本挖掘技術[J]建筑經濟,2023,44(1):2936
[10]薛楠楠,張建榮,張偉,等基于文本挖掘的建筑工人不安全行為及其影響因素研究[J]安全與環境工程,2021,28(2):5965,85
[11]王愛華工程項目腐敗行為的領域詞表構建[D]北京:清華大學,2013
[12]樂云,單明建設工程領域工程合謀現象研究綜述[J]工業技術經濟,2013,32(1):14551
[13]WILLIAMSON O EThe economic institutions of capitalism:firms,markets,relational contracting[M]New York:Free Press,1985
收稿日期:20230607
作者簡介:
梁秀峰(通信作者)(1989—),男,博士,講師,研究方向:項目管理與工程經濟。
吳興歡(1989—),女,研究方向:項目管理。
柴瑩(1994—),女,研究方向:PPP項目管理。
劉毅(1994—),女,研究方向:項目管理。
*基金項目:河北省教育廳科學研究項目“鄉村振興背景下河北省城鄉融合發展模式及路徑研究”(BJS2024086)。