以Neo4j為代表的圖數據庫是以數學中的圖論為基礎實現的一種新型NoSQL數據庫,它通過節點和關系構成一個圖結構,在此基礎上實現數據庫的所有特性,并用圖的形式表達數據與數據之間的關系。與傳統的關系型數據庫相比,Neo4j更擅長海量數據之間的復雜關系分析,具有處理速度更快,表達形式更直觀、淺顯、簡單等諸多優點,近年來被廣泛應用于知識圖譜、社交網絡等領域。在政府采購及招投標審計過程中,審計人員往往需要對參與投標的企業與個人的背景,以及相互之間存在的關系進行審查分析,從而判斷是否存在圍標串標的行為疑點,圖數據庫能快速、方便地解決這個問題,而且分析結果直接以圖形等視覺化的效果呈現,更加直觀。本文以某公立醫院設備采購為例,利用圖數據庫Neo4j的分析功能,通過構建招投標網絡分析模型,介紹如何快速檢索出投標個人及企業間的關聯關系,從而快速鎖定疑點項目,為審計人員進一步核實調查提供明確的方向,以求達到“靶向抽檢項目、精確鎖定疑點”的效果。
在招投標領域,企業互相串通投標的情形較多,違法行為呈現出多樣化的形式。《中華人民共和國招標投標法實施條例》第四十條和《中華人民共和國政府采購法實施條例》第十八條分別就投標人之間互相串通投標做出了判定標準和禁止性規定。根據上述兩條依據,筆者提取出企業圍標串標行為的兩條線索特征:第一條是不同投標人委托同一單位或者個人辦理投標事宜;第二條是單位負責人為同一人或者存在直接控股、管理關系的不同供應商參與同一合同項下的政府采購活動。
在第一條線索特征下,關注的是在投標過程中,遞交投標文件相關個人之間的關系,只要能證明參與某個項目的投標人中有兩個或者兩個以上從屬于一家單位即可判定該項目存在圍標串標的嫌疑;在第二條線索特征下,需要關注參與投標的企業間存在的控股與被控股關系,以及企業股東之間的重疊關系,找出兩家或兩家以上參與同一項目投標的企業間存在關聯關系或者股東存在重疊的情況,即可快速鎖定審計疑點。
利用圖數據庫Neo4j的分析功能,構建招投標網絡分析,即可快速檢索出投標個人及企業間的關聯關系,從而鎖定疑點項目,為審計人員進一步核實調查提供明確的方向。
圖數據庫在招投標審計中的應用,關鍵要明確網絡中的節點和關系。在招投標審計中,可以將招投標數據、企業工商登記信息、社保參保信息等多個行業進行管理,構建以投標參與主體為核心的關系網絡進行大數據分析。
審計關注的主體即為圖數據庫的節點。在招投標及政府采購過程中,審計關注的主體即為參與投標的企業與個人。
審計主體之間的關系即為圖數據庫的關系。在招投標及政府采購過程中,審計需關注的關系主要是參與投標企業與個人之間存在的關系,通常有三類:一是個人與企業之間的從屬關系;二是企業與企業之間的控股與被控股關系;三是不同企業股東之間的重疊關系(即一人同時持股兩家或兩家以上企業的情況)。
采集的招投標數據、工商登記數據、社保參保信息等數據,進行整理,可快速構建出審計網絡分析模型,在此基礎上完成對數據的分析。
數據分析主要用到的信息如表1。

表1
確定好數據模型后,需要將采集的結構化數據批量導入到Neo4j。Neo4j提供了兩種數據導入方法:一是將結構化數據導出成csv格式的文件,然后使用Neo4j提供的Load CSV命令或者neo4j-import工具,將csv文件導入Neo4j;二是采用微云數聚(北京)科技有限公司(Neo4j中國代理)設計的導入精靈工具將數據導入(該工具支持excel和mysql兩種格式的數據)。
對于零星數據,可以直接采取Cypher語句的方式,直接創建節點和關系。具體語法格式如下。
(1)創建節點的語句:


這樣就創建了三個節點,{}里面的內容代表每個節點的屬性。名為公司的節點,含有兩個屬性,分別是公司名稱為甲公司,注冊地為武漢市;設備節點的屬性是設備名稱為彩超,采購單位為甲醫院。審計中可以根據實際,對于節點賦予多個屬性。
(2)創建關系的語句:

在關系創建語句中,()里面的內容代表的是節點的id,[]里面代表的是關系。通過箭頭運算符等,根據經濟業務發生的順序,完成對各節點間關系的創建。例如:甲公司為張三繳納了社保,證明了兩者之間存在的勞動關系;張三代表甲公司于2013年1月1日參與了彩超(該彩超為甲醫院采購的)項目的投標。
根據審計需求,筆者選取少量的案例,使用Cypher語句直接將相關數據插入數據庫中,并構建出關于醫療設備招投標的網絡分析模型。
Cypher語句:


最后構建出的網絡分析模型如圖1所示。

圖1
Cypher語句:

如此得到的查詢結果如圖2所示。

圖2
從圖2可以看出,李四的社保由甲公司繳納,但在投標過程中代表了乙公司進行投標,且甲公司也參與了該項目的投標。隸屬于同一公司的不同個人分別代表不同的企業參與同一項目的投標,符合本文前面所述的線索一的特征,該項目存在圍標串標的嫌疑。
Cypher語句:

如此得到的查詢結果如圖3所示。

圖3
從圖3可以看出,王五同時持有甲公司和A公司的股份,這兩家公司同時參與了CT和彩超設備的投標。這說明兩項設備的招投標中,甲公司和A公司作為關聯公司,分別參加了項目的投標,符合本文前面所述的線索二的特征,存在圍標串標的嫌疑。
利用圖數據庫簡單、快捷的關系分析,審計人員可以將經濟活動涉及的各類主體編織成一張數據“大網”,利用Cypher語句快速進行深度挖掘,揭示其中存在的某種特定關系。Neo4j不僅可以用于招投標項目的審計,還可用于公職人員經商辦企業、違規享受財政補貼、民生資金優親厚友等違紀違規問題線索核實方面。