999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中小企業(yè)稅務(wù)稽查投影尋蹤建模與實(shí)證分析

2015-06-06 15:01:40樓文高樓際通宋雷娟王浪慶
經(jīng)濟(jì)數(shù)學(xué) 2015年4期
關(guān)鍵詞:分類模型企業(yè)

樓文高,樓際通,宋雷娟,王浪慶

(1. 上海商學(xué)院 財(cái)經(jīng)學(xué)院,上海 200235;2. 北卡羅來(lái)納大學(xué)教堂山分校, NC 27514 )

?

中小企業(yè)稅務(wù)稽查投影尋蹤建模與實(shí)證分析

樓文高1,樓際通2,宋雷娟1,王浪慶1

(1. 上海商學(xué)院 財(cái)經(jīng)學(xué)院,上海 200235;2. 北卡羅來(lái)納大學(xué)教堂山分校, NC 27514 )

從上海市某區(qū)386家中小企業(yè)申報(bào)的15項(xiàng)稅收指標(biāo)數(shù)據(jù)中篩選出對(duì)判定企業(yè)納稅情況具有重要影響的10個(gè)評(píng)價(jià)指標(biāo),并將全部386個(gè)樣本分成性質(zhì)相似的建模樣本和測(cè)試樣本(其中測(cè)試樣本個(gè)數(shù)占45%),建立了基于投影尋蹤分類(PPC)技術(shù)的稅務(wù)稽查評(píng)價(jià)模型.與多元線性回歸(MLR)、判別分析(MDA)、Logistic和支持向量機(jī)(SVM)模型相比,PPC模型的識(shí)別錯(cuò)誤率最低,建模樣本和測(cè)試樣本的平均分類錯(cuò)誤率低于6%,改進(jìn)型PPC模型包含的評(píng)價(jià)指標(biāo)少,兩類錯(cuò)誤率很接近,非常適用于實(shí)際企業(yè)的稅務(wù)稽查評(píng)估研究和實(shí)踐.對(duì)339家待判斷企業(yè)納稅情況的判定結(jié)果研究表明,建立的改進(jìn)型PPC模型具有很好的泛化能力和魯棒性.

稅務(wù)稽查;投影尋蹤分類技術(shù);分類錯(cuò)誤率;樣本分組

1 引 言

中小企業(yè)在國(guó)家創(chuàng)新經(jīng)濟(jì)發(fā)展模式和解決就業(yè)問(wèn)題中占有越來(lái)越重要的位置,量大面廣,給基層稅務(wù)稽查和納稅評(píng)估工作帶來(lái)了很大的風(fēng)險(xiǎn).因此,建立實(shí)用性強(qiáng)和可靠的稅務(wù)稽查評(píng)價(jià)模型,既能幫助企業(yè)提高涉稅風(fēng)險(xiǎn)的防控能力,又能幫助稅務(wù)部門足額征收稅款,日益受到政府有關(guān)部門(稅務(wù)局等)和學(xué)界的重視[1,2].樓文高等[3]對(duì)Tobit模型、層次分析法(AHP)、主成分法(PCA)、判別分析(MDA)、Logistic模型和多元線性回歸(MLR)等傳統(tǒng)統(tǒng)計(jì)模型以及新興的多層感知器神經(jīng)網(wǎng)絡(luò)(BPNN)、概率神經(jīng)網(wǎng)絡(luò)(PNN)、支持向量機(jī)(SVM)、自組織神經(jīng)網(wǎng)絡(luò)(SOM)等數(shù)據(jù)挖掘技術(shù)與傳統(tǒng)統(tǒng)計(jì)模型的組合模型[1-2, 4-8]的優(yōu)缺點(diǎn)、適用情況以及現(xiàn)有文獻(xiàn)存在的問(wèn)題等進(jìn)行了詳細(xì)的評(píng)述,并應(yīng)用廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)和多重交叉檢驗(yàn)法,建立了適用于小樣本情況的稅務(wù)稽查GRNN模型,分類錯(cuò)誤率10%左右,明顯低于傳統(tǒng)統(tǒng)計(jì)模型和SVM模型,取得了較好的效果.但是,由于GRNN建模過(guò)程中確定合理的光滑因子值是相當(dāng)繁瑣的,而且GRNN模型是隱性模型[3, 9-10],無(wú)法顯性地直接揭示出企業(yè)納稅情況與各個(gè)評(píng)價(jià)指標(biāo)之間的非線性關(guān)系,給后續(xù)的稅務(wù)稽查工作(判定、研究企業(yè)納稅情況)以及企業(yè)如何制定合理的納稅策略、降低涉稅風(fēng)險(xiǎn)帶來(lái)不便.

另一方面,投影尋蹤分類(Projection Pursuit Clustering,簡(jiǎn)稱PPC)技術(shù)是一種適用于高維、非線性、非正態(tài)分布數(shù)據(jù)處理的新興統(tǒng)計(jì)建模方法[11-14],不僅數(shù)學(xué)意義清晰,而且是顯性模型,便于對(duì)樣本和評(píng)價(jià)指標(biāo)的重要性進(jìn)行排序和分類研究.本文首次將PPC技術(shù)引入到企業(yè)稅務(wù)稽查研究中,212個(gè)建模樣本和174個(gè)測(cè)試樣本(占45%)的平均分類錯(cuò)誤率低于6.00%,低于MLR、MDA、Logistic等傳統(tǒng)統(tǒng)計(jì)模型和SVM模型,建立了更加簡(jiǎn)潔、實(shí)用、可靠和有效的稅務(wù)稽查模型,應(yīng)優(yōu)先用于中小企業(yè)的稅務(wù)稽查研究和實(shí)踐中.

2 建立中小企業(yè)稅務(wù)稽查評(píng)價(jià)指標(biāo)體系

本課題組選取上海某區(qū)稅務(wù)局管轄的木制家具制造中小企業(yè)增值稅納稅情況進(jìn)行研究,共有2 000多家企業(yè),考慮到數(shù)據(jù)的真實(shí)可靠性,選取一般納稅人作為研究對(duì)象.在2010~2012年度有較完整財(cái)務(wù)數(shù)據(jù)和增值稅納稅申報(bào)數(shù)據(jù)的正常經(jīng)營(yíng)企業(yè)有725家(次),成立時(shí)間短則1年多,長(zhǎng)則16年多.筆者查閱了40多篇有關(guān)稅務(wù)稽查(納稅評(píng)估等)的文獻(xiàn)和文件,先后被采用過(guò)的評(píng)價(jià)指標(biāo)有180多個(gè).在比較研究的基礎(chǔ)上,筆者根據(jù)現(xiàn)有企業(yè)財(cái)務(wù)數(shù)據(jù)和增值稅納稅申報(bào)表可獲得數(shù)據(jù)兩個(gè)方面,建立了由如下15個(gè)指標(biāo)組成的企業(yè)增值稅稅務(wù)稽查評(píng)價(jià)指標(biāo)體系:全部收入稅負(fù)率(x1)、成本費(fèi)用稅負(fù)率(x2)、銷售毛利率(x3)、成本費(fèi)用利潤(rùn)率(x4)、銷售利潤(rùn)率(x5)、總資產(chǎn)收益率(x6)、銷售費(fèi)用率(x7)、管理費(fèi)用率(x8)、財(cái)務(wù)費(fèi)用率(x9)、流動(dòng)資產(chǎn)周轉(zhuǎn)率(x10)、總資產(chǎn)周轉(zhuǎn)率(x11)、流動(dòng)比率(x12)、速動(dòng)比率(x13)、現(xiàn)金比率(x14)和資產(chǎn)負(fù)債率(x15).經(jīng)區(qū)稅務(wù)局多位經(jīng)驗(yàn)豐富的同志和課題組稅務(wù)學(xué)方面專家共同研究和認(rèn)真、仔細(xì)的甄別,在上述725家企業(yè)中,判定211家企業(yè)進(jìn)行了誠(chéng)實(shí)納稅,175家企業(yè)沒(méi)有誠(chéng)實(shí)納稅,對(duì)其他339家企業(yè)的納稅情況進(jìn)行初步判定,希望借助本課題組建立的模型進(jìn)行輔助稽查判斷.

3 投影尋蹤分類(PPC)建模原理

Friedman等[11]于1974年提出了一種適用于非線性、高維和非正態(tài)分布數(shù)據(jù)處理的新興統(tǒng)計(jì)建模方法——投影尋蹤分類(PPC)模型,即把高維數(shù)據(jù)投影到低維(1~3維)子空間上,通過(guò)分析低維子空間上的數(shù)據(jù)規(guī)律以達(dá)到揭示高維數(shù)據(jù)特征的目的.由于在常用的一維PPC模型建模過(guò)程中須確定合理的窗口半徑R值,而如何確定合理、有效的R值,迄今還缺乏理論依據(jù)和指導(dǎo)[11-14],并且不同的R值,往往得到不同的建模結(jié)果.因此,為避免出現(xiàn)PPC模型結(jié)果的不確定性和非唯一性,消除R值對(duì)建模結(jié)果的不利影響,本文采用另一種投影尋蹤目標(biāo)函數(shù)型式.

根據(jù)稅務(wù)專家的先驗(yàn)知識(shí)和經(jīng)驗(yàn),已經(jīng)事先判定了部分企業(yè)的納稅情況y(i)(即誠(chéng)實(shí)納稅或非誠(chéng)實(shí)納稅).因此,根據(jù)要使所有樣本點(diǎn)盡可能形成若干個(gè)團(tuán)(類)(誠(chéng)實(shí)納稅類或非誠(chéng)實(shí)納稅類),類與類之間盡可能分散和類內(nèi)樣本點(diǎn)盡可能密集的要求,可以構(gòu)建如下投影尋蹤目標(biāo)函數(shù)[12]:

(1)

4 建立中小企業(yè)稅務(wù)稽查PPC模型

4.1 輸入數(shù)據(jù)歸一化預(yù)處理和模型輸出期望值的設(shè)定

為了消除各指標(biāo)量綱不同對(duì)建模結(jié)果的不利影響,應(yīng)對(duì)各評(píng)價(jià)指標(biāo)的輸入數(shù)據(jù)進(jìn)行線性歸一化預(yù)處理,轉(zhuǎn)化為 [0, 1]區(qū)間內(nèi)的值.考慮到分類要求的對(duì)稱性,筆者設(shè)定誠(chéng)實(shí)納稅和非誠(chéng)實(shí)納稅樣本的模型理論期望輸出值分別為-0.5和0.5.

4.2 篩選出對(duì)稅務(wù)稽查具有重要影響的評(píng)價(jià)指標(biāo)

大量研究表明,如果模型中包含不重要的(或者稱為不相關(guān)的)指標(biāo),不僅不能提高模型的精度(性能),反而會(huì)降低模型的精度,并無(wú)畏增加建模和收集樣本數(shù)據(jù)的成本,可以說(shuō)是有害無(wú)益的[1, 3,4,6 , 15,16].本文采用簡(jiǎn)單、實(shí)用和有效的靈敏度分析法來(lái)篩選重要評(píng)價(jià)指標(biāo)[6, 15,16],借助于Statsoft公司出品的商品化軟件STATISTICA Neural Network (以下簡(jiǎn)稱SNN)軟件GRNN模型的靈敏度分析功能[6, 9],刪除了x13、x8、x9、x12和x14共五個(gè)指標(biāo),即從15個(gè)指標(biāo)中篩選出了對(duì)稅務(wù)稽查具有重要影響的10個(gè)評(píng)價(jià)指標(biāo).

4.3 把樣本數(shù)據(jù)進(jìn)行合理分組提高模型的泛化能力和魯棒性

建立的模型是否可靠和有效,必須用非建模樣本(或稱測(cè)試樣本)的性能(精度和有效性)來(lái)衡量,因此,必須把樣本數(shù)據(jù)分成建模樣本和測(cè)試樣本.如果樣本數(shù)量足夠多,無(wú)論采用什么方法,隨機(jī)抽取就能確保各組樣本具有相似(同)的性質(zhì)(即均值和方差基本相等),但如果樣本數(shù)量不是很多,隨機(jī)分組就可能出現(xiàn)偏差,這樣建立的模型很可能就是無(wú)效和不可靠的.因此,國(guó)外文獻(xiàn)早在1960年代就開(kāi)始研究如何分組才能確保各組樣本具有相似的性質(zhì),其中SOM方法分組效果較好,也便于實(shí)現(xiàn)[6,15,16].為此,本課題組選用SNN的SOM方法進(jìn)行樣本分組.一般地,模型的內(nèi)插性能總是好于外插性能,即要求建模樣本必須包含每個(gè)指標(biāo)的最大值和最小值(包括誠(chéng)實(shí)納稅和非誠(chéng)實(shí)納稅兩種情況).對(duì)于本例,包含10個(gè)誠(chéng)實(shí)納稅樣本和10個(gè)非誠(chéng)實(shí)納稅樣本.據(jù)此,將上述386個(gè)樣本分成了具有相似性質(zhì)的建模樣本和測(cè)試樣本(174個(gè),約占45%),數(shù)據(jù)特征值如表1所示.

表1 用SOM方法進(jìn)行分組的兩類樣本的均值和標(biāo)準(zhǔn)差

*注:“1”和“2”分別表示誠(chéng)實(shí)納稅和非誠(chéng)實(shí)納稅樣本,Tr和Te分別指建模樣本和測(cè)試樣本;誠(chéng)實(shí)納稅樣本211個(gè),其中Tr和Te分別為117和94個(gè),非誠(chéng)實(shí)納稅樣本175個(gè),其中Tr和Te分別為95和80個(gè).

4.4 建立中小企業(yè)稅務(wù)稽查PPC模型

(2)

再次調(diào)用筆者編制的最優(yōu)化程序,求得全局最優(yōu)解,目標(biāo)函數(shù)值Q(b)=16.378 6,b1=1.233 1,b2=-6.229 3.

5 結(jié)果與分析

5.1 PPC建模結(jié)果及其樣本屬性的判定(誠(chéng)實(shí)納稅或非誠(chéng)實(shí)納稅)

PPC模型每個(gè)樣本的輸出值是一個(gè)實(shí)數(shù),因此,必須采用某種規(guī)則來(lái)判定每個(gè)樣本究竟屬于誠(chéng)實(shí)納稅還是非誠(chéng)實(shí)納稅.對(duì)于結(jié)果基本服從(右半支)正態(tài)分布N(μ1,σ1)(誠(chéng)實(shí)納稅樣本),和(左半支)正態(tài)分布N(μ2,σ2)(非誠(chéng)實(shí)納稅樣本)的兩類樣本來(lái)說(shuō),區(qū)分他們的分界值μF可用下式確定[12]:

(3)

因此,如果模型輸出值小于分界值μF,就可判定該樣本為誠(chéng)實(shí)納稅,離分界值越遠(yuǎn),誠(chéng)實(shí)納稅的概率就越大,反之為非誠(chéng)實(shí)納稅.根據(jù)上述判斷準(zhǔn)則,可以判定本例212個(gè)建模樣本和174個(gè)測(cè)試樣本屬性,其I類、II類和平均分類錯(cuò)誤率如表2所示.

表2 不同建模方法得到的兩類樣本的分類錯(cuò)誤率

注:*I類錯(cuò)誤率是指把誠(chéng)實(shí)納稅的樣本判定為非誠(chéng)實(shí)納稅的百分率,反之是II類錯(cuò)誤率;**采用MDA、MLR和Logistic建模時(shí),刪除了共線性變量x1、x3、x7、x10和x15;&為改進(jìn)型PPC模型的結(jié)果.

從PPC模型建模樣本和測(cè)試樣本的I類和II類錯(cuò)誤率可以看出,本例的樣本分組是合理和有效的.如果分組不合理,就會(huì)導(dǎo)致建模樣本和測(cè)試樣本的分類錯(cuò)誤率相差很大,從而導(dǎo)致模型沒(méi)有泛化能力和實(shí)用價(jià)值.

5.2 與MLR、MDA、Logistic和SVM等模型計(jì)算結(jié)果的對(duì)比

針對(duì)上述兩類樣本數(shù)據(jù),筆者也建立了MDA、MLR、Logistic和SVM模型,其I類、II類和平均分類錯(cuò)誤率也列于表2中.

由表2可知, PPC模型的分類錯(cuò)誤率最低,MDA、MLR和SVM模型的分類錯(cuò)誤率都出現(xiàn)了大于10%的情況,尤其是MDA和SVM模型的II類錯(cuò)誤率較高,危害更大.PPC模型的分類錯(cuò)誤率與Logistic模型基本相當(dāng).但從原理上講,MDA、MLR、Logistic和SVM模型只有對(duì)服從正態(tài)分布規(guī)律數(shù)據(jù)的建模結(jié)果才具有較好的可靠性,否則可靠性難以保證.顯然,本例的各個(gè)評(píng)價(jià)指標(biāo)數(shù)據(jù)都不服從正態(tài)分布,因此,這些傳統(tǒng)統(tǒng)計(jì)模型是否能用于企業(yè)實(shí)際納稅情況的判定,還有待進(jìn)一步研究分析.

犯II類錯(cuò)誤的危害性(即把非誠(chéng)實(shí)納稅企業(yè)判定為誠(chéng)實(shí)納稅,將導(dǎo)致稅收流失)遠(yuǎn)遠(yuǎn)大于犯I類錯(cuò)誤.因此,II類錯(cuò)誤率低于I類錯(cuò)誤率的模型較為合理.

5.3 其他339家木制家具制造企業(yè)納稅情況的判定

根據(jù)前述,另有339家企業(yè)的納稅情況還有待判定.339家企業(yè)各個(gè)指標(biāo)的均值和方差如表3所示,作為對(duì)比,上述212個(gè)建模樣本及其誠(chéng)實(shí)納稅樣本與非誠(chéng)實(shí)納稅樣本的均值和方差也列于表3中.顯然,這339家企業(yè)的均值與建模樣本中誠(chéng)實(shí)納稅樣本和非誠(chéng)實(shí)納稅樣本的均值都相差較大,說(shuō)明這339家企業(yè)中肯定既有誠(chéng)實(shí)納稅的,也有非誠(chéng)實(shí)納稅的.為此,把上述339家企業(yè)10個(gè)評(píng)價(jià)指標(biāo)的歸一化數(shù)據(jù)導(dǎo)入上述建立的PPC模型,得到了PPC模型的輸出值,其中190家企業(yè)的輸出值小于分界值μF(-0.096 2),這些企業(yè)被判定為誠(chéng)實(shí)納稅,另外149家企業(yè)被判定為非誠(chéng)實(shí)納稅.為了進(jìn)一步驗(yàn)證PPC模型的有效性、泛化能力和魯棒性,表3也列出了339家企業(yè)中被判定為誠(chéng)實(shí)納稅和非誠(chéng)實(shí)納稅企業(yè)的各個(gè)指標(biāo)的均值和標(biāo)準(zhǔn)差.從表3可以看出,對(duì)于指標(biāo)x1、x2、x7和x15來(lái)講,339家企業(yè)與212個(gè)建模樣本的性質(zhì)是矛盾的(如339家企業(yè)中,誠(chéng)實(shí)納稅樣本x1的均值顯著大于非誠(chéng)實(shí)納稅樣本,而212個(gè)建模樣本的情況,則正好相反).

5.4 建立稅務(wù)稽查改進(jìn)型PPC模型

表3 建模樣本和339家企業(yè)及其被PPC模型判定為誠(chéng)實(shí)納稅、非誠(chéng)實(shí)納稅樣本各個(gè)評(píng)價(jià)指標(biāo)的均值和標(biāo)準(zhǔn)差

表4 建模樣本和339家企業(yè)及其被改進(jìn)型PPC模型判定為誠(chéng)實(shí)納稅、非誠(chéng)實(shí)納稅樣本指標(biāo)的均值和標(biāo)準(zhǔn)差

5.5 各個(gè)評(píng)價(jià)指標(biāo)的重要性排序和分類

從公式(1)和(2)可知,權(quán)重越大的指標(biāo)對(duì)納稅情況的影響就越顯著,在這六個(gè)指標(biāo)中,x11最重要,其次是x10,然后依次是x4、x3、x5,x6最不重要,這些指標(biāo)的數(shù)值越大,改進(jìn)型PPC模型的輸出值越大,即企業(yè)存在非誠(chéng)實(shí)納稅的可能性也越高.因此,在判斷研究企業(yè)納稅情況時(shí),首先要重點(diǎn)考察其總資產(chǎn)周轉(zhuǎn)率數(shù)據(jù)是否過(guò)高,其次是考察流動(dòng)資產(chǎn)周轉(zhuǎn)率數(shù)據(jù)是否過(guò)高,然后是依次考察成本費(fèi)用利潤(rùn)率、銷售成本率、銷售利潤(rùn)率及其總資產(chǎn)收益率等指標(biāo)數(shù)據(jù)是否過(guò)高.根據(jù)各個(gè)指標(biāo)的權(quán)重大小,也可以對(duì)他們的重要性進(jìn)行分類,由于x11和x10的權(quán)重大于0.50,其屬性可以歸為“最重要”一類,x4、x3和x5的權(quán)重在[0.3, 0.4]范圍內(nèi),其屬性可以歸為“重要”一類,x6的權(quán)重小于0.30,其屬性可以歸為“次重要”一類.

6 結(jié)束語(yǔ)

針對(duì)上海市某區(qū)386家木制家具制造企業(yè)納稅申報(bào)的15項(xiàng)指標(biāo)數(shù)據(jù),首先采用靈敏度分析方法篩選出對(duì)企業(yè)納稅情況具有重要影響的10個(gè)指標(biāo),再采用SOM方法把樣本分成具有相似性質(zhì)的建模樣本和測(cè)試樣本(174個(gè),約占45%),以確保后續(xù)建模的魯棒性和泛化能力.

采用可用于非線性、高維、非正態(tài)分布數(shù)據(jù)處理的投影尋蹤分類(PPC)技術(shù),針對(duì)212個(gè)建模樣本,建立了求得真正全局最優(yōu)解的PPC模型,建模樣本和測(cè)試樣本的平均分類錯(cuò)誤率僅為4.72%和4.60%,均低于MLR、MDA、SVM等模型.同時(shí)發(fā)現(xiàn),對(duì)339家實(shí)際企業(yè)納稅情況的判定表明,有4個(gè)指標(biāo)的性質(zhì)是相互矛盾的,為此建立了刪除該四個(gè)指標(biāo)后僅包含六個(gè)指標(biāo)的改進(jìn)型PPC模型,建模樣本和測(cè)試樣本的平均分類錯(cuò)誤率分別為6.13%和4.60%,而且與339家實(shí)際企業(yè)誠(chéng)實(shí)納稅和非誠(chéng)實(shí)納稅樣本的評(píng)價(jià)指標(biāo)性質(zhì)完全一致,說(shuō)明建立的改進(jìn)型PPC模型具有很高的精度、泛化能力和魯棒性,而且模型包含的評(píng)價(jià)指標(biāo)更少,實(shí)用性更強(qiáng),可用于實(shí)際企業(yè)納稅情況的判定.

采用MLR、MDA和SVM方法建模,不僅模型的平均識(shí)別錯(cuò)誤率高于PPC模型,而且兩類錯(cuò)誤率差異也較大,說(shuō)明模型存在一定的偏態(tài)性,再者,從原理上講,在數(shù)據(jù)不服從正態(tài)分布規(guī)律時(shí),無(wú)法保證這些模型的可靠性和魯棒性.

PPC模型采用一維連續(xù)實(shí)數(shù)輸出方式,便于研究?jī)深惒煌瑯颖据敵鲋档姆植家?guī)律,從而為分析、判定真實(shí)樣本屬性提供便利,可同時(shí)完成樣本的分類和排序研究.改進(jìn)型PPC模型建模過(guò)程簡(jiǎn)捷,意義清晰,無(wú)須人為確定某些參數(shù)的合理值,可最大程度規(guī)避人為因素的影響.

[1]RSWU,CSOU,HYLIN,etal. Using data mining technique to enhance tax evasion detection performance [J]. Expert Systems with Applications, 2012, 39(10): 8769-8777.

[2] 何輝, 侯偉. 我國(guó)納稅評(píng)估存在的問(wèn)題與路徑選擇[J]. 稅務(wù)研究, 2013,29(2):75-77.

[3] 樓文高, 婁元英, 尹淑平. 基于廣義回歸神經(jīng)網(wǎng)絡(luò)的稅務(wù)稽查選案實(shí)證研究[J]. 廣東商學(xué)院學(xué)報(bào), 2013, 28(6):74-80.

[4] J ALM. Measuring, explaining, and controlling tax evasion: lessons from theory, experiments, and field studies [J]. International Tax Public Finance, 2012, 19(1):54-77.

[5] 葉藝勇. 基于支持向量機(jī)和領(lǐng)域知識(shí)的納稅評(píng)估預(yù)警模型[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí), 2014, 44(1):72-77.

[6] P C GONZALEZ, G D VELASQUEZ. Characterization and detection of taxpayers with false invoices using data mining techniques [J]. Expert Systems with Applications, 2013, 40(5):1427-1436.

[7] C LIN, I LIN, C WU,etal. The application of decision tree and artificial neural network to income tax audit: the examples of profit-seeking enterprise income tax and individual income tax in Taiwan [J]. Journal of the Chinese Institute of Engineers, 2012, 35(4):401-411.

[8] 夏輝, 李仁發(fā). 基于SVM與SOM的稅務(wù)稽查選案模型研究[J]. 科學(xué)技術(shù)與工程, 2009, 9(11):4027-4031.

[9] STATSOFT Inc. Electronic Statistics Textbook [EB/OL].Tulsa ( http://www.statsoft.com/textbook ) , 2011.

[10]D F SPECHT. A generalized regression neural network [J]. IEEE Transactions on Neural Networks, 1991, 2(6):568-576.

[11]J H FRIEDMAN, J W TUKEY. A projection pursuit algorithm for exploratory data analysis [J]. IEEE Transactions on Computers, 1974, 23(9):881-890.

[12]樓際通, 樓文高, 于秀榮. 商業(yè)銀行個(gè)人信用風(fēng)險(xiǎn)評(píng)價(jià)的投影尋蹤建模及其實(shí)證研究[J]. 經(jīng)濟(jì)數(shù)學(xué), 2013, 30(4):27-33.

[13]H CAUSSINUSS, A RUIZ-GAZEN,G GOVAERT. Exploratory projection Pursuit [C]// G GOVAERT.Data Analysis,London: ISTE Ltd,2009:67-92.

[14]樓文高, 喬龍. 投影尋蹤聚類建模理論的新探索與實(shí)證研究[J]. 數(shù)理統(tǒng)計(jì)與管理, 2015, 34(1):47-58.

[15]W WU, R J MAY, H R MAIER,etal. A benchmarking approach for comparing data splitting methods for modeling water resources parameters using artificial neural networks [J]. Water Resources Research, 2013, 49(11):7598-7614.

[16]R J MAY, H R MAIER, G C DANDY. Data splitting for artificial neural networks using SOM-based stratified sampling [J]. Neural Networks, 2010, 23(2):283-294.

Tax-Checking Assessment of Small and Medium-Sized Enterprises Applying Projection Pursuit Clustering Technique and Its Positive Research

LOU Wen-gao1,LOU Ji-tong2,SONG Lei-juan1, WANG Lang-qing1

(1.Faculty of Fiscal and Financial, Shanghai Business School, Shanghai 200235,China; 2. The University of North Carolina at Chapel Hill, NC 27514,USA)

Based on the 15 variables’ (indexes’ ) tax-reporting data of 386 wooden-furniture manufacturing small- and medium-sized enterprises (WFMSMEs) located in some districts of Shanghai city, the ten variables mainly influencing the tax-checking situation (tax evasion or compliance) of the 386 WFMSMEs were obtained by applying sensitivity analysis method (SAM) for selecting input variables. The modelling set data and testing set data (about taking up 45%) with similar characteristics - similar mean values and variance-were divided using self-organizing map (SOM) approach. The practical, feasible and effective projection pursuit clustering (PPC) model for tax-checking assessment was thus established. Compared with the multivariate linear regression (MLR), the multivariate discriminant analysis (MDA), Logistic and the support vector machine (SVM), the established PPC model possesses the most accurate and the lowest classification-error percentage (CEP) of the models. The mean CEP of modelling set data and the testing set data is lower than 6%. The improved PPC model including fewer variables is thus suitable to tax-checking assessment and research. The tax-checking situation of the other 339 WFMEs was also assessed and judged, and the results show that the established improved PPC model possesses high generalization and robustness.

tax-checking assessment; projection pursuit clustering (PPC) model; classification-error percentage; samples splitting

2015-07-02

上海高校知識(shí)服務(wù)平臺(tái)“上海商貿(mào)服務(wù)業(yè)知識(shí)服務(wù)中心”建設(shè)子項(xiàng)目“稅收風(fēng)險(xiǎn)管理信息系統(tǒng)設(shè)計(jì)及開(kāi)發(fā)”(ZF1226);上海地方本科院校“十二五”內(nèi)涵建設(shè)上海商學(xué)院重點(diǎn)學(xué)科專業(yè)建設(shè)“金融學(xué)人才培養(yǎng)模式改革與創(chuàng)新”;2013年國(guó)家大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(CXGJ-13-002)資助

樓文高(1964—), 男,教授,博士

E-mail: wglou@sbs.edu.cn;wlou64@126.com

TV139.1; N945.12

A

猜你喜歡
分類模型企業(yè)
一半模型
企業(yè)
企業(yè)
企業(yè)
分類算一算
重要模型『一線三等角』
敢為人先的企業(yè)——超惠投不動(dòng)產(chǎn)
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
主站蜘蛛池模板: 狠狠躁天天躁夜夜躁婷婷| 999福利激情视频| 一级成人a做片免费| 国产在线专区| 在线99视频| 国产一区二区丝袜高跟鞋| 国产91丝袜在线播放动漫 | 成年女人a毛片免费视频| 欧美日韩在线成人| 午夜电影在线观看国产1区| 免费一级成人毛片| 99热这里只有成人精品国产| 看你懂的巨臀中文字幕一区二区 | 欧美人人干| 亚洲无码91视频| 亚洲色偷偷偷鲁综合| 性69交片免费看| 免费看一级毛片波多结衣| 亚洲天堂精品视频| 欧美亚洲一区二区三区导航| 欧美中文字幕一区| 97国产精品视频自在拍| 日韩在线中文| 久久亚洲国产一区二区| 久久精品无码一区二区国产区| 露脸一二三区国语对白| 尤物国产在线| 欧美在线精品一区二区三区| 乱人伦中文视频在线观看免费| 欧美日韩国产在线人| 蜜桃视频一区二区| 亚洲中文字幕av无码区| 91青青草视频在线观看的| 免费看黄片一区二区三区| 在线另类稀缺国产呦| 午夜视频免费试看| 欧美精品一二三区| 三级国产在线观看| 香蕉99国内自产自拍视频| 久青草免费视频| 国产真实乱子伦视频播放| 女人爽到高潮免费视频大全| 成人精品视频一区二区在线| 一本大道无码日韩精品影视| 又大又硬又爽免费视频| 久久久久久久久亚洲精品| 欧美日韩亚洲综合在线观看| 精品国产毛片| 无码中文AⅤ在线观看| 美女被操91视频| 国产欧美在线观看一区| 91免费在线看| 欧洲成人在线观看| 国产午夜人做人免费视频| 国产av一码二码三码无码| 国产精品美人久久久久久AV| 九九热精品视频在线| 亚洲一欧洲中文字幕在线 | 成人国产一区二区三区| 巨熟乳波霸若妻中文观看免费| 欧美一级在线播放| 99久久99视频| 中文字幕人成人乱码亚洲电影| 久久人人妻人人爽人人卡片av| 91小视频版在线观看www| 99精品影院| 国产91成人| 伊人色婷婷| 国产真实自在自线免费精品| 久久免费视频6| 青青国产视频| 国产精品自在自线免费观看| 国产综合无码一区二区色蜜蜜| 国产小视频a在线观看| 国产精品yjizz视频网一二区| 国产交换配偶在线视频| 91色老久久精品偷偷蜜臀| 亚洲不卡无码av中文字幕| 九九视频在线免费观看| 无码中文字幕精品推荐| 国产乱子伦手机在线| 一级毛片中文字幕|