摘 要:傳統的人工稅務稽查選案,具有人為因素大、缺乏科學性和準確度等弊端。建立稽查選案模型、采用計算機自動選案,可以避免上述弊端并提高工作效率。最初選取了9個財務指標,經過篩選,最終使用8個指標建立了稅務稽查選案的Logistic判別模型,樣本回帶總準確率達79.6%。
關鍵詞:偷稅;稽查選案;Logistic回歸模型
中圖分類號:F231.6 文獻標志碼:A 文章編號:1673-291X(2012)35-0096-02
引言
稅務稽查的工作流程主要包括選案、實施檢查、審理和執行等階段[1]。選案是找出偷漏稅疑點最大的被稽查對象的過程,是稽查人員根據納稅企業的各種非財務和財務信息,進行定性和定量分析的結果。傳統的人工稽查選案,主要依靠舉報材料、稽查人員經驗或是上級下派的任務確定稽查對象,具有人為因素多、工作強度大、準確度低等缺點。同時,如今偷逃稅方法日益高明,稽查人員日益感到力不從心[2]。建立稽查選案模型、采用計算機自動選案,可以避免傳統人工選案的弊端,提高稽查選案工作的客觀性、科學性、準確度和工作效率,對于堵塞企業偷漏稅行為具有重要作用。
一、樣本選取、指標選取和均值差異檢驗
本文共選擇了27家企業2009年上半年和2010年上半年的54組數據作為研究樣本,每家企業2組數據,企業類型包括制造業、煤業、發電等行業。54組數據中誠實納稅的數據為47組,被定性為有偷稅行為的數據有7組。樣本數據來源于某稅務局的納稅申報表和企業的財務報表。
選取稅務稽查選案指標尚無統一標準,但通常應遵循綜合性、規范性、易得性、重要性、穩定性、簡潔性等原則[3],根據上述原則并借鑒參考文獻,本文共選擇了4類9個財務指標,如表1所示,包括2個稅收負擔狀況指標,2個盈利能力指標,2個營運能力指標,3個償債能力指標[1-4]。對偷稅組和誠實組的9個財務指標進行Mann-Whitney U均值差異檢驗(零假設H0:均值相等),用以探查各指標均值差異情況,顯著性概率p值分別為:0.027、0.010、0.928、0.078、0.847、0.328、0.847、0.949、0.709,說明稅負率、進銷項比2個指標在5%的水平上偷稅組和誠實組均值差異顯著,主營業務費用率指標在10%的水平上均值差異顯著。
二、Logistic回歸偷稅企業識別模型
構建模型使用了SPSS統計軟件?;檫x案屬于二分類問題,因此,誠實企業用0代表、偷稅企業用1代表;自變量即為表1中的9個財務指標。盡管不需要對模型進行序列相關檢驗和異方差檢驗,但需要進行多重共線性檢驗,以決定最終是否刪除某些能用其它自變量線性組合表示的自變量。使用容忍度(Tolerance)指標進行該項檢驗,容忍度小于0.2的自變量應該刪除,在SPSS軟件的線性回歸模塊中可以自動計算自變量的容忍度。最終刪除了“流動比率”指標,因為其容忍度太小。如表2所示,最終模型保留了其余8個指標,因為它們的容忍度均大于等于0.485,不存在多重共線性。Logistic模型為:
模型參數如表2所示,Wald統計量用以檢驗模型系數的顯著性,類似于線性模型的t檢驗。使用最大似然估計法估計Logistic模型參數,似然值越大,模型擬合效果越好。但習慣上常用似然函數值的對數的-2倍,即用-2 Log likelihood(-2LL)表示擬合效果,因此就變成-2LL越小模型擬合的越好。Logistic模型的擬合度也可以用和2個指標值來衡量,這兩個值的涵義就如同線性模型的擬合優度一樣。三個擬合度指標值分別為23.581、0.613、0.817,擬合效果很好。
分類閾值概率選擇的不同直接影響到模型識別的準確率,經試算閾值取為ρ≤0.08,即如果偷稅概率則判為誠實企業,如果ρ>0.08則判為偷稅企業,樣本回代到模型中的判別準確率如表3所示,總準確率79.6%、偷稅企業100%、誠實企業76.6%。以某水泥企業為例,其2009年被稅務局定性為偷稅企業。2009年的8個指標值分別為:0.00、5.38、0.081、1.61、0.547、0.02、0.70、0.76,代入模型中得p=0.898,大于0.08,因此,模型判別其2009年為偷稅企業,定量判別結果正確。