錢(qián) 音
(云南財(cái)經(jīng)大學(xué) 云南 昆明 650221)
良好的營(yíng)商環(huán)境是吸引外商投資,促進(jìn)經(jīng)濟(jì)發(fā)展的基礎(chǔ)。近年來(lái),黨中央和國(guó)務(wù)院高度重視營(yíng)商環(huán)境建設(shè)工作。評(píng)價(jià)各地區(qū)的營(yíng)商環(huán)境,目的并不僅僅是為了評(píng)判地區(qū)營(yíng)商環(huán)境的差異,以給投資者提供指導(dǎo),更重要的是讓地方政府認(rèn)識(shí)到自己的優(yōu)勢(shì)及存在的問(wèn)題,以利于對(duì)其改善。為了更全面、科學(xué)、客觀(guān)地認(rèn)識(shí)各地區(qū)營(yíng)商環(huán)境的現(xiàn)狀和問(wèn)題 ,進(jìn)一步明確改善和優(yōu)化的方向,對(duì)營(yíng)商環(huán)境進(jìn)行科學(xué)評(píng)價(jià)就顯得非常必要。
通過(guò)查閱文獻(xiàn)可知,在以往對(duì)營(yíng)商環(huán)境的研究中,幾乎都是采用因子分析的方法進(jìn)行綜合評(píng)價(jià),再通過(guò)聚類(lèi)分析的方式來(lái)劃分等級(jí),最后根據(jù)因子分析得出的綜合排名和聚類(lèi)分析的結(jié)果給出一些合理的投資建議和改進(jìn)方法。本文將利用充分降維方法中的一種算法,即切片逆回歸(Sliced inverse regression for dimension,簡(jiǎn)稱(chēng)SIR)來(lái)對(duì)指標(biāo)進(jìn)行優(yōu)化,這種方法對(duì)變量的提取幾乎是不損失信息,并且相比因子分析來(lái)說(shuō),SIR加入了因變量Y,而因變量對(duì)降維后的聚類(lèi)結(jié)果有著重要的影響。
根據(jù)營(yíng)商環(huán)境的國(guó)內(nèi)外相關(guān)理論,以及借鑒世界銀行提出的指標(biāo)體系和其他文獻(xiàn)中的指標(biāo)構(gòu)建體系,本文在選取評(píng)價(jià)指標(biāo)時(shí)遵循了全面性、系統(tǒng)性、可比性、可量化性原則。在指標(biāo)選取的過(guò)程中,首先對(duì)指標(biāo)項(xiàng)的相關(guān)性進(jìn)行了檢驗(yàn),在排除了相關(guān)性較弱的指標(biāo)后,最終構(gòu)建了我國(guó)27個(gè)省會(huì)城市評(píng)價(jià)的指標(biāo)體系(由于西藏、寧夏、海南、青海四個(gè)省因省會(huì)城市未進(jìn)入經(jīng)濟(jì)總量前100名城市排行,故不對(duì)其進(jìn)行評(píng)價(jià)),包括5個(gè)一級(jí)指標(biāo)和15個(gè)二級(jí)指標(biāo),由于部分?jǐn)?shù)據(jù)缺失嚴(yán)重,因此選取2017年數(shù)據(jù),其中人均GDP由于數(shù)據(jù)缺失,因此重慶和長(zhǎng)春采用均值插補(bǔ)法,即2016年和2018年數(shù)據(jù)的平均值代替。數(shù)據(jù)主要來(lái)源于EPS全球統(tǒng)計(jì)數(shù)據(jù)/分析平臺(tái)《中國(guó)城市數(shù)據(jù)庫(kù)》 和《中國(guó)城鄉(xiāng)建設(shè)數(shù)據(jù)庫(kù)》以及《中經(jīng)網(wǎng)統(tǒng)計(jì)數(shù)據(jù)庫(kù)》,具體見(jiàn)表1。

表1 我國(guó)27個(gè)省會(huì)城市營(yíng)商環(huán)境評(píng)價(jià)指標(biāo)
上述15個(gè)指標(biāo)是解釋變量X的選取,因?yàn)镾IR方法還需加入響應(yīng)變量Y的影響,綜合考慮影響營(yíng)商環(huán)境的因素,選取由《中國(guó)城市營(yíng)商環(huán)境指數(shù)報(bào)告》中的營(yíng)商環(huán)境指數(shù)得分來(lái)作為響應(yīng)變量Y,它是由中國(guó)戰(zhàn)略文化促進(jìn)會(huì)、中國(guó)經(jīng)濟(jì)傳媒協(xié)會(huì)、萬(wàn)博新經(jīng)濟(jì)研究院和第一財(cái)經(jīng)研究院在營(yíng)商環(huán)境研討會(huì)上聯(lián)合發(fā)布的。
(一)營(yíng)商環(huán)境評(píng)價(jià)方法
1、切片逆回歸(SIR)
本文采用的方法是充分降維方法,該方法的思想是:考慮一維響應(yīng)變量Y關(guān)于P維解釋變量X的回歸問(wèn)題,在不假定任何參數(shù)模型以及不損失條件分布中所含有的信息的前提下,通過(guò)原始數(shù)據(jù)中高維自變量的一些線(xiàn)性組合來(lái)達(dá)到降維的目的。切片逆回歸降維算法(Sliced Inverse Regression,SIR)是最經(jīng)典的充分降維方法。SIR是李克昭教授在19991年提出的一種非參數(shù)降維方法,該方法與傳統(tǒng)的因子分析、主成分分析等降維方法相比有極大的優(yōu)勢(shì),采用切片逆回歸的方法避免了維數(shù)災(zāi)難問(wèn)題,逆回歸是將X相對(duì)于Y進(jìn)行回歸,相當(dāng)于處理一維到一維的回歸問(wèn)題。這樣交換X和Y的好處就在于我們可以避開(kāi)維度的問(wèn)題。通過(guò)考察自變量的每個(gè)特征與因變量進(jìn)行回歸,將傳統(tǒng)的高維問(wèn)題轉(zhuǎn)化成多個(gè)較為容易解決的一維問(wèn)題,并使用切片方法融合了自變量與因變量的相關(guān)關(guān)系。
對(duì)于一維響應(yīng)變量Y關(guān)于P維解釋變量X=(X1,X2,X3,……,XP)T的回歸問(wèn)題,SIR基于如下降維模型:
(1)
其中,β1,β2,β3,……,βk是未知的P維列向量,ε是均值為0的隨機(jī)變量并且與X相互獨(dú)立,f是定義在R(k+1)空間上的一個(gè)任意未知的函數(shù)。SIR方法的具體算法步驟如下:
(1)對(duì)響應(yīng)變量Y進(jìn)行排序;
(2)對(duì)解釋變量X進(jìn)行標(biāo)準(zhǔn)化,用Z表示,即
(2)



(3)

(4)
(6)令K個(gè)最大特征向量(行向量)為(k=1,2,…,K),輸出原始比例,是用于確定有效降維(e.d.r)的方向

(5)
上述步驟中,(3)(4)產(chǎn)生標(biāo)準(zhǔn)化逆回歸曲線(xiàn)E(Z/Y)的粗略估計(jì);(5)是對(duì)主成分分析的權(quán)重進(jìn)行調(diào)整,將考慮不同切片中樣本大小可能不等的情況;(6)是將比例重新轉(zhuǎn)回到原始比例。
2、聚類(lèi)分析
聚類(lèi)分析相比因子分析而言,沒(méi)有產(chǎn)生新的變量,它是把研究對(duì)象視作多維空間中的許多點(diǎn),并合理地分成若干類(lèi),因此它是一種根據(jù)變量域之間的相似性而逐步歸群成類(lèi)的方法,它能客觀(guān)地反映這些變量或區(qū)域之間的內(nèi)在組合關(guān)系。聚類(lèi)分析方法在很多多元統(tǒng)計(jì)書(shū)里面都有詳細(xì)的介紹,在這里就不做詳細(xì)介紹。
本文主要是在切片逆回歸分析后基于分析得到的因子得分矩陣再做聚類(lèi)分析,將27個(gè)省會(huì)城市合理地進(jìn)行分類(lèi),以發(fā)現(xiàn)各個(gè)城市在營(yíng)商環(huán)境建設(shè)發(fā)展過(guò)程中的差異所在。
(二)實(shí)證分析
在對(duì)所選取的15個(gè)指標(biāo)進(jìn)行分析之前,首先,需要對(duì)其15個(gè)變量進(jìn)行KMO值檢驗(yàn)Bartlett球形檢驗(yàn),KMO檢驗(yàn)統(tǒng)計(jì)量是用于檢驗(yàn)各個(gè)變量間相關(guān)性強(qiáng)弱的,當(dāng)這個(gè)值越接近1時(shí)說(shuō)明變量之間的相關(guān)性就越強(qiáng),一般KMO值大于0.5就認(rèn)為通過(guò)檢驗(yàn),可以用來(lái)做降維分析。利用SPSS20.0軟件得到這15個(gè)變量的KMO統(tǒng)計(jì)值為0.796,大于0.5 ,Bartlett球形檢驗(yàn)P值接近于0,所以原始數(shù)據(jù)通過(guò)了檢驗(yàn)。
根據(jù)前面所介紹的切片逆回歸的方法,對(duì)變量進(jìn)行降維,運(yùn)用matlab2014.a軟件運(yùn)行出最優(yōu)結(jié)果。表3給出了降維后的2個(gè)方向及特征值,其它方向上特征值近似為0,Dir1表示第一主方向,Dir1表示第二主方向,因此可以得到通過(guò)SIR方法將維數(shù)降到了2維。

表2 有效降維方向及特征值
由于降維后的累計(jì)方差貢獻(xiàn)率目前尚未有好的辦法計(jì)算得到,對(duì)于特征值,我們是這樣來(lái)定義的:
設(shè)A是一個(gè)n階方陣,若存在著一個(gè)數(shù)和一個(gè)非零n維向量x,使得
AX=λX
(6)
則稱(chēng)λ是方陣A的特征值,非零向量X稱(chēng)為A對(duì)應(yīng)特征值的特征向量。因此我們近似地可以將特征值看作是降維后的累計(jì)方差貢獻(xiàn)率即89.89%,高于因子分析選取主成分82.86%的標(biāo)準(zhǔn)。進(jìn)而利用標(biāo)準(zhǔn)化后的原始矩陣與有效降維后得到的特征向量矩陣做矩陣變換,得到因子得分矩陣,最后利用因子得分矩陣做聚類(lèi)分析,聚類(lèi)分析的方法選擇“ward.D2”法。根據(jù)聚類(lèi)結(jié)果和各地區(qū)之間的相似性,可以將其分為四類(lèi),結(jié)果如下表4。

表3 27個(gè)省會(huì)城市聚類(lèi)分析結(jié)果
從聚類(lèi)的結(jié)果來(lái)看,和《2019年中國(guó)城市營(yíng)商環(huán)境指數(shù)報(bào)告》中的結(jié)果吻合。營(yíng)商環(huán)境排名前10的分別是上海、北京、廣州、南京、武漢、杭州、天津、成都、西安、合肥,與本文分析的結(jié)果一致。并且從降維效果上來(lái)看,SIR降維方法將維數(shù)降到了2維,而因子分析方法將其降到了3維,且SIR方法所能解釋的變量部分更多,因此可以認(rèn)為SIR方法在相比傳統(tǒng)降維方法上分析結(jié)果更為精確。
以上基于SIR的數(shù)據(jù)降維算法和聚類(lèi)分析來(lái)對(duì)中國(guó)27個(gè)省會(huì)城市的營(yíng)商環(huán)境進(jìn)行分析,結(jié)果顯示北上廣深一線(xiàn)城市營(yíng)商環(huán)境排名靠前,且有良好的營(yíng)商環(huán)境,二線(xiàn)城市次之,三四線(xiàn)城市排名較為靠后一些。由于中國(guó)地理因素,人文環(huán)境和經(jīng)濟(jì)發(fā)展之間的差異,導(dǎo)致東、中、西三大地區(qū)的省會(huì)城市營(yíng)商環(huán)境有著明顯的差異,營(yíng)商環(huán)境與經(jīng)濟(jì)發(fā)展之間的關(guān)系是相互作用的,相對(duì)來(lái)說(shuō)東部沿海城市的營(yíng)商環(huán)境會(huì)更好一些,更能吸引外商投資,并且在政府效率、人力資源、市政環(huán)境等方面都占據(jù)一定的優(yōu)勢(shì),因此排名大都相對(duì)靠前一些。而相對(duì)于排名靠后的烏魯木齊市、呼和浩特市和蘭州市來(lái)說(shuō),這幾個(gè)城市在政府辦事效率和人力資源方面相對(duì)弱一些,使得整體的經(jīng)濟(jì)總量排名靠后。
總的來(lái)說(shuō),省會(huì)城市營(yíng)商環(huán)境各具特色,其中昆明、貴陽(yáng)、鄭州的后發(fā)優(yōu)勢(shì)相對(duì)較為明顯。此外,除寧夏、西藏、海南、青海這四個(gè)地區(qū)的省會(huì)城市未進(jìn)入經(jīng)濟(jì)總量排名前100外,其他27個(gè)地區(qū)的省會(huì)城市排名都在前一半。優(yōu)化營(yíng)商環(huán)境是一項(xiàng)需要付出長(zhǎng)期行動(dòng)的艱巨任務(wù),不但要注重自然環(huán)境等的改善,同時(shí)也要全面提升人才的競(jìng)爭(zhēng)力、改善政府政策的實(shí)施,提高要素質(zhì)量,降低企業(yè)經(jīng)營(yíng)成本 ,為企業(yè)發(fā)展創(chuàng)造一個(gè)有利的條件,為人民辦事提供一個(gè)便利的服務(wù)。