十堰市審計局在某農機補貼專項資金審計項目中,采取八爪魚網頁數據采集器和Neo4j圖數據庫有機結合的辦法,有效解決了審計組數據采集慢、分析難的實際困難,大大提高了工作效率,實現了快速獲取數據、精準高效分析,最終查出多家企業操縱多重身份假買假賣騙取農機補貼的問題,挖出了在審批過程中以權謀私的幕后黑手,揭示了農機版的“空手套白狼”。
審計組經過調查,確定了在農機補貼資金的申報審批環節,對農機買賣雙方企業及個人的背景信息進行審核分析,找出虛假買賣騙取農機補貼疑點的大數據審計思路,但是卻面臨兩大難題:一是數據采集慢,該區工商數據質量不高,審計組需要花費大量時間采集整理數據;二是數據分析難,面對200多家參與買賣的企業,以及企業背后的法人和數量成倍增加的股東,常規的SQL數據庫分析方法已經不適用,如何才能理清買賣行為背后錯綜復雜的關系是審計組亟待解決的問題。
審計組一方面運用八爪魚網頁數據采集器在“天眼查”網站上批量采集工商數據,實現短時間內數據的自動化采集和規范化儲存。該方法改變了網頁查詢“翻開一個網頁、查詢一條信息、記錄一條數據”的現狀,擺脫對人工搜索及收集數據的依賴,從而降低獲取信息的成本,大幅提高了工作效率。另一方面,利用Neo4j圖數據庫數據模型簡單、反饋結果直觀的特點,將整理后的……