[摘要] 商品交易市場(chǎng)專(zhuān)業(yè)化指數(shù)是用來(lái)衡量某地區(qū)各類(lèi)商品交易市場(chǎng)經(jīng)濟(jì)總量在各類(lèi)交易市場(chǎng)之間的集中程度。基于前人的研究基礎(chǔ),作者給出了億元商品交易市場(chǎng)專(zhuān)業(yè)化指數(shù)計(jì)算公式,并將空間關(guān)聯(lián)規(guī)則分析引入商品交易市場(chǎng)專(zhuān)業(yè)化水平與其他經(jīng)濟(jì)因素的關(guān)聯(lián)分析中。在指定的最小支持度和可信度閾值下,獲得了3條有意義的商品交易市場(chǎng)專(zhuān)業(yè)化水平與其他經(jīng)濟(jì)因素之間關(guān)聯(lián)規(guī)則。通過(guò)這些關(guān)聯(lián)規(guī)則,可以對(duì)一地區(qū)商品交易市場(chǎng)的專(zhuān)業(yè)化水平進(jìn)行預(yù)測(cè),為市場(chǎng)合理規(guī)劃和建設(shè)提供決策支持。
[關(guān)鍵詞] 億元商品交易市場(chǎng) 專(zhuān)業(yè)化 關(guān)聯(lián)規(guī)則 數(shù)據(jù)挖掘
億元商品交易市場(chǎng)是指年成交額為1億元及以上的大型和特大型市場(chǎng)(以后億元商品交易市場(chǎng)簡(jiǎn)稱(chēng)商品交易市場(chǎng))。經(jīng)過(guò)幾十年的發(fā)展,中國(guó)商品交易市場(chǎng)呈現(xiàn)出規(guī)模化、規(guī)范化、專(zhuān)業(yè)化、信息化和高效益化等特征,豐富了人們的物質(zhì)、精神生活,增強(qiáng)了區(qū)域合作,推動(dòng)了城鄉(xiāng)的立體化發(fā)展。目前有關(guān)商品交易市場(chǎng)的研究多集中于政策研究和基于統(tǒng)計(jì)數(shù)據(jù)的發(fā)展趨勢(shì)分析。在專(zhuān)業(yè)商品交易市場(chǎng)方面,更多的學(xué)者是不同區(qū)域的專(zhuān)業(yè)市場(chǎng)進(jìn)行統(tǒng)計(jì)分析,以發(fā)現(xiàn)其發(fā)展變化的規(guī)律。游產(chǎn)業(yè)的發(fā)展,加強(qiáng)區(qū)域合作,形成高度區(qū)域一體化,合作立體化。尋找專(zhuān)業(yè)化水平高低和相應(yīng)的區(qū)域其他因子之間關(guān)聯(lián)關(guān)系對(duì)區(qū)域商品交易市場(chǎng)的規(guī)劃和建設(shè)都有著重大的意義。商品交易市場(chǎng)專(zhuān)業(yè)化的影響因素是分布于一定的區(qū)域內(nèi),同時(shí)具有屬性信息和空間信息,并且相互之間存在一定相關(guān)性。影響因素分析的方法,一般是多元回歸分析或經(jīng)驗(yàn)?zāi)P汀J紫冗@些方法不能處理空間信息,其次它們要求數(shù)據(jù)要滿足統(tǒng)計(jì)獨(dú)立性。因此,傳統(tǒng)的分析方法無(wú)法反應(yīng)它們之間一種共生或因果關(guān)聯(lián)模式。鑒于以上原因,本文將可以同時(shí)處理空間和非空間信息的空間關(guān)聯(lián)分析引入?yún)^(qū)域商品交易市場(chǎng)的專(zhuān)業(yè)化研究中,通過(guò)分析相應(yīng)影響或者共生因素,挖掘其與區(qū)域商品交易市場(chǎng)專(zhuān)業(yè)化之間的關(guān)聯(lián)模式,為我國(guó)億元商品交易市場(chǎng)的合理規(guī)劃和建設(shè)提供參考依據(jù)。
一、數(shù)據(jù)來(lái)源
本文所用有關(guān)億元商品交易市場(chǎng)數(shù)據(jù)來(lái)源于2001年到2007年中國(guó)商品交易市場(chǎng)統(tǒng)計(jì)年鑒(該統(tǒng)計(jì)年鑒最早起始于2001年)。此統(tǒng)計(jì)數(shù)據(jù)包括中國(guó)大陸地區(qū)的省、地區(qū)和直轄市,缺少西藏自治區(qū)、香港、澳門(mén)、臺(tái)灣地區(qū)的相關(guān)統(tǒng)計(jì)數(shù)據(jù)。市場(chǎng)成交額反應(yīng)了市場(chǎng)的規(guī)模,被用于進(jìn)行商品交易市場(chǎng)專(zhuān)業(yè)化指數(shù)計(jì)算。專(zhuān)業(yè)化指數(shù)是指一個(gè)地區(qū)所有類(lèi)型專(zhuān)業(yè)化市場(chǎng)的成交額或其他指標(biāo)在該地區(qū)中所有類(lèi)型專(zhuān)業(yè)市場(chǎng)中的分布情況。因此,專(zhuān)業(yè)市場(chǎng)的分類(lèi)對(duì)專(zhuān)業(yè)化指數(shù)有著很重要的影響。本文采用中國(guó)商品交易市場(chǎng)統(tǒng)計(jì)年鑒對(duì)專(zhuān)業(yè)化市場(chǎng)的分類(lèi)方法將億元商品專(zhuān)業(yè)市場(chǎng)分成,紡織品服鞋帽裝市場(chǎng),食品飲料煙酒市場(chǎng),家具市場(chǎng)等21類(lèi)市場(chǎng)(詳見(jiàn)中國(guó)商品交易市場(chǎng)統(tǒng)計(jì)年鑒)。
參與億元商品交易市場(chǎng)專(zhuān)業(yè)化關(guān)聯(lián)分析的要素主要包括,城鎮(zhèn)居民恩格爾指數(shù),農(nóng)村居民恩格爾指數(shù),人口密度,公路密度,鐵路密度,個(gè)私經(jīng)濟(jì)發(fā)展水平,貿(mào)易競(jìng)爭(zhēng),城市化水平,第二產(chǎn)業(yè)占所有產(chǎn)業(yè)比重,市場(chǎng)化水平,鄰域?qū)I(yè)化水平。這些數(shù)據(jù)主要來(lái)源于2001到2007年的中國(guó)統(tǒng)計(jì)年鑒和中國(guó)人口統(tǒng)計(jì)年鑒。其中有些因素是通過(guò)計(jì)算得到,例如貿(mào)易競(jìng)爭(zhēng)水平是通過(guò)出口額與進(jìn)口額的比值得到。
二、研究方法
1.商品交易市場(chǎng)的專(zhuān)業(yè)化測(cè)度方法。在產(chǎn)業(yè)經(jīng)濟(jì)學(xué)中,區(qū)位商常被用于衡量區(qū)域內(nèi)部的某一部門(mén)專(zhuān)業(yè)化水平的高低,如商建初等利用區(qū)位商研究了長(zhǎng)三角地區(qū)工業(yè)的行業(yè)專(zhuān)業(yè)化程度;宗剛等利用?指數(shù)及區(qū)位商對(duì)北京產(chǎn)業(yè)結(jié)構(gòu)進(jìn)行研究。區(qū)位商反映的是一個(gè)研究區(qū)域內(nèi)某一產(chǎn)業(yè)是否具有比較優(yōu)勢(shì),但無(wú)法反映各種產(chǎn)業(yè)在空間上聚集后專(zhuān)業(yè)化的程度。賀燦飛等在研究中國(guó)制造業(yè)的省區(qū)專(zhuān)業(yè)化時(shí),引入了一個(gè)專(zhuān)業(yè)化測(cè)度方法來(lái)度量各省區(qū)的諸產(chǎn)業(yè)相對(duì)集中指標(biāo)。當(dāng)研究區(qū)域中所有產(chǎn)值或其他考察變量集中于一個(gè)產(chǎn)業(yè)時(shí),專(zhuān)業(yè)化指數(shù)應(yīng)該最高,理論上應(yīng)該是1,然而該公式測(cè)算的結(jié)果為(n-1)/n,只有當(dāng)n趨于無(wú)窮大時(shí)才能得到1。當(dāng)專(zhuān)業(yè)化水平較高時(shí),n越大,計(jì)算的專(zhuān)業(yè)化指數(shù)就越精確。商品交易市場(chǎng)專(zhuān)業(yè)化指研究區(qū)域內(nèi)所有類(lèi)型交易市場(chǎng)的交易額或從業(yè)人口總數(shù)在各類(lèi)交易市場(chǎng)間的集中程度。當(dāng)交易額或其他參數(shù)在各類(lèi)交易市場(chǎng)之間平均分布,專(zhuān)業(yè)化指數(shù)最小,是0;當(dāng)交易額或其他參數(shù)集中于某一類(lèi)市場(chǎng),專(zhuān)業(yè)化指數(shù)最高,是1。為了正確衡量商品交易市場(chǎng)的專(zhuān)業(yè)化水平,本文對(duì)賀燦飛等人提出的模型進(jìn)行改進(jìn),并用其對(duì)中國(guó)億元商品交易市場(chǎng)的專(zhuān)業(yè)化水平進(jìn)行度量。商品交易市場(chǎng)專(zhuān)業(yè)化指數(shù)的計(jì)算公式如下:
(1)
(1)式中,S是研究區(qū)域中商品交易市場(chǎng)類(lèi)型的個(gè)數(shù); 為研究區(qū)域中每類(lèi)交易市場(chǎng)占所有類(lèi)型交易市場(chǎng)的總成交額的比重的平均值;VAjn,VAkn 為研究區(qū)域n中j,k兩種類(lèi)型商品交易市場(chǎng)的成交額;VAn為研究區(qū)域n中所有類(lèi)型商品交易市場(chǎng)的成交額。當(dāng)研究區(qū)域中的商品交易市場(chǎng)類(lèi)型個(gè)數(shù)為1時(shí),不采用該計(jì)算公式,專(zhuān)業(yè)化指數(shù)為1。
2.空間關(guān)聯(lián)規(guī)則。Agrawal等于1993年首先對(duì)顧客交易數(shù)據(jù)中購(gòu)買(mǎi)物品之間的關(guān)聯(lián)問(wèn)題進(jìn)行研究,提出了關(guān)聯(lián)規(guī)則的概念,并給出了相應(yīng)挖掘的算法。Koprski K對(duì)傳統(tǒng)的關(guān)聯(lián)規(guī)則進(jìn)行了拓展,并成功地將其引入了空間數(shù)據(jù)挖掘領(lǐng)域。從此諸多地學(xué)工作者和區(qū)域經(jīng)濟(jì)學(xué)家對(duì)空間關(guān)聯(lián)規(guī)則挖掘進(jìn)行了大量的研究,主要包括概念,挖掘過(guò)程,挖掘算法等。這些基礎(chǔ)性的研究工作大大地促進(jìn)了空間關(guān)聯(lián)規(guī)則在各領(lǐng)域中的應(yīng)用。空間關(guān)聯(lián)規(guī)則是通過(guò)蘊(yùn)含表達(dá)式來(lái)進(jìn)行描述,如A→B(c%,s%)。A和B是交集為空(A∩B=φ)的謂詞集合,且二者中至少包含一個(gè)空間謂詞。s%,是規(guī)則的支持度,指A和B在所有空間事務(wù)中同時(shí)發(fā)生的概率,P(A∩B)。c%,規(guī)則的可信度,指在所有空間事務(wù)中A發(fā)生的前提下B發(fā)生的概率,P(B/A)。非空間謂詞,指常規(guī)的邏輯謂詞。空間謂詞是包含空間關(guān)系的邏輯謂詞。除了可信度和支持度,很多學(xué)者還開(kāi)發(fā)出了其他的指標(biāo)對(duì)空間關(guān)聯(lián)規(guī)則進(jìn)行衡量。蘊(yùn)含表達(dá)形式直觀、簡(jiǎn)單、明了。如規(guī)則,is-a(x,house)∧close-to(x,urban center)→is-expensive(x)(100%,95%)。該規(guī)則表明:95%靠近市中心的房子價(jià)格都高,該規(guī)則的正確率為100%。
3.鄰域?qū)I(yè)化空間滯后。一個(gè)研究區(qū)域的商品交易市場(chǎng)專(zhuān)業(yè)化的水平不但與該區(qū)域中的經(jīng)濟(jì)因素有關(guān),而且還受到其鄰域商品交易市場(chǎng)專(zhuān)業(yè)化程度的影響。本文中通過(guò)專(zhuān)業(yè)化指數(shù)滯后來(lái)反映鄰域?qū)I(yè)水平對(duì)當(dāng)前研究區(qū)域商品交易市場(chǎng)專(zhuān)業(yè)化的影響。專(zhuān)業(yè)化指數(shù)滯后計(jì)算公式如式(2)所示。
(2)
S是鄰域億元商品交易市場(chǎng)專(zhuān)業(yè)化指數(shù)空間滯后,N是研究區(qū)域的鄰域個(gè)數(shù),pn和λn分別是第n相鄰區(qū)域的專(zhuān)業(yè)化指數(shù)和相應(yīng)的權(quán)重。
三、億元商品交易市場(chǎng)區(qū)域?qū)I(yè)化關(guān)聯(lián)分析
1.億元商品交易市場(chǎng)區(qū)域?qū)I(yè)化計(jì)算。關(guān)聯(lián)規(guī)則分析要求數(shù)據(jù)表中的屬性是離散的數(shù)值或符號(hào)。在進(jìn)行關(guān)聯(lián)分析之前,應(yīng)該將連續(xù)的專(zhuān)業(yè)化指數(shù)轉(zhuǎn)換成離散的專(zhuān)業(yè)化水平。本文將商品交易市場(chǎng)專(zhuān)業(yè)化劃分成三個(gè)等級(jí):高專(zhuān)業(yè)化水平,中等專(zhuān)業(yè)化水平和低專(zhuān)業(yè)化水平。下圖展示了2005年各省區(qū)億元商品交易市場(chǎng)專(zhuān)業(yè)化水平的分布情況。
說(shuō)明:①(a)是億元商品交易市場(chǎng)專(zhuān)業(yè)化指數(shù)(連續(xù))分布圖,(b)是離散化億元商品交易市場(chǎng)專(zhuān)業(yè)化水平分布圖②統(tǒng)計(jì)數(shù)據(jù)主要包括大陸省區(qū)億元商品交易市場(chǎng)成交額數(shù)據(jù)。西藏地區(qū)和港澳臺(tái)地區(qū)沒(méi)有統(tǒng)計(jì)數(shù)據(jù),專(zhuān)業(yè)化指數(shù)設(shè)為0。③為統(tǒng)一數(shù)據(jù),專(zhuān)業(yè)化計(jì)算過(guò)程中沒(méi)有包含計(jì)算機(jī)市場(chǎng)、通訊器材市場(chǎng)和花卉市場(chǎng)。
連續(xù)型專(zhuān)業(yè)化指數(shù)可以更精確地表示商品交易市場(chǎng)的專(zhuān)業(yè)化水平,但是其不符合人們的思維習(xí)慣,比較抽象不易理解。離散型的專(zhuān)業(yè)指數(shù)很容易被人們接受和理解,但精度不是很高。由于關(guān)聯(lián)分析的需要,我們需要將連續(xù)的專(zhuān)業(yè)化指數(shù)進(jìn)行離散化處理。
2.億元商品交易市場(chǎng)區(qū)域?qū)I(yè)化關(guān)聯(lián)因素分析。關(guān)聯(lián)規(guī)則分析可以發(fā)現(xiàn)專(zhuān)業(yè)化水平和區(qū)域其他因素之間讓人感興趣的關(guān)聯(lián)知識(shí)。關(guān)聯(lián)規(guī)則的支持度反映該規(guī)則在挖掘數(shù)據(jù)中的覆蓋度;可信度反映規(guī)則的正確度。在對(duì)挖掘規(guī)則沒(méi)有限制的情況下,會(huì)有大量的關(guān)聯(lián)規(guī)則成為挖掘結(jié)果,但其中只有很小的一部分是有意義的。最小置信度和支持度分別設(shè)置為80%和10%。除了規(guī)則模版、最小支持度和置信度,我們通過(guò)專(zhuān)業(yè)知識(shí)對(duì)的挖掘結(jié)果進(jìn)行分析評(píng)估來(lái)得出最終有意義的關(guān)聯(lián)規(guī)則,如表1所示。
結(jié)合中國(guó)億元商品交易市場(chǎng)的專(zhuān)業(yè)背景知識(shí),這里我們得到了3條有用的規(guī)則。它們的支持度和置信度分別在14%和81%以上。其中第一規(guī)則說(shuō)明:如果一個(gè)地區(qū)的城市化水平中等,第二產(chǎn)業(yè)占所有產(chǎn)業(yè)的比重高,市場(chǎng)化水平低,人口密度低,高速公路密度低,該地區(qū)的億元商品交易市場(chǎng)專(zhuān)業(yè)化是中等水平,該規(guī)則的支持度是14.29%,置信度是90%。
四、討論與結(jié)論
商品交易市場(chǎng)專(zhuān)業(yè)化影響因素是分布于一定的區(qū)域空間中,具有屬性信息和空間信息,且相互之間存在一定的相關(guān)性。由于空間信息的存在和統(tǒng)計(jì)獨(dú)立性假設(shè)的無(wú)法滿足,從而使得傳統(tǒng)的分析方法無(wú)能為力。空間關(guān)聯(lián)規(guī)則可以反映要素的空間、非空間信息之間的關(guān)系,適合進(jìn)行商品交易市場(chǎng)專(zhuān)業(yè)化關(guān)聯(lián)分析。空間關(guān)聯(lián)規(guī)則分析要求數(shù)據(jù)表中的數(shù)據(jù)項(xiàng)是離散的,然而專(zhuān)業(yè)指數(shù)和影響因素?cái)?shù)據(jù)都是連續(xù)的。連續(xù)數(shù)據(jù)離散化是空間關(guān)聯(lián)分析的第一步工作。上圖顯示了2005年中國(guó)億元商品交易市場(chǎng)省區(qū)專(zhuān)業(yè)化指數(shù)連續(xù)值和離散值的空間分布情況。通過(guò)對(duì)比我們可以發(fā)現(xiàn):連續(xù)數(shù)據(jù)表達(dá)更精確;離散數(shù)據(jù)表達(dá)更易理解。上表顯示了空間關(guān)聯(lián)分析獲得的強(qiáng)關(guān)聯(lián)規(guī)則。在指定的最小置信度和最小支持度下,我們只能獲得后件為商品交易市場(chǎng)專(zhuān)業(yè)化是中等水平的關(guān)聯(lián)規(guī)則。不同的關(guān)聯(lián)規(guī)則前件,對(duì)應(yīng)的置信度和支持度也各不相同。連續(xù)數(shù)據(jù)離散化是關(guān)聯(lián)分析前最為重要的數(shù)據(jù)處理過(guò)程。不同的離散化方法得到的離散化結(jié)果存在很大的差異,最終影響關(guān)聯(lián)分析的結(jié)果。本文中采用的等距離離散化方法將所有連續(xù)數(shù)據(jù)轉(zhuǎn)換成三個(gè)等級(jí)的離散值:高、中和低。由于專(zhuān)業(yè)化指數(shù)和影響因素的連續(xù)數(shù)值集中于一個(gè)很窄的數(shù)據(jù)范圍內(nèi),從而導(dǎo)致了離散化后數(shù)據(jù)集中于中水平等級(jí)。如最終的挖掘結(jié)果所示,所有強(qiáng)規(guī)則的后件都是專(zhuān)業(yè)化水平中,其他兩個(gè)等級(jí)為后件的規(guī)則都被最小支持度和可信度過(guò)濾掉了。同時(shí)缺失數(shù)據(jù)的插值算法和統(tǒng)計(jì)數(shù)據(jù)本身的精度對(duì)離散化的結(jié)果也有著重要的影響。商品交易市場(chǎng)專(zhuān)業(yè)化是衡量一個(gè)地區(qū)所有商品交易市場(chǎng)的經(jīng)濟(jì)總量在各類(lèi)交易市場(chǎng)之間的集中程度,其反映了經(jīng)濟(jì)總量的一種分布模式。基于前人的研究基礎(chǔ),作者給出了商品交易市場(chǎng)專(zhuān)業(yè)化指數(shù)的計(jì)算公式。空間關(guān)聯(lián)規(guī)則被用于對(duì)商品交易市場(chǎng)專(zhuān)業(yè)化與其影響因素之間關(guān)聯(lián)分析,如最后分析結(jié)果所示,我們得到了三條有趣的關(guān)聯(lián)規(guī)則。這些規(guī)則可以用來(lái)預(yù)測(cè)一個(gè)地區(qū)商品交易市場(chǎng)專(zhuān)業(yè)化的水平,也可以為商品交易市場(chǎng)的規(guī)劃與建設(shè)提供決策支持。
注:張雪伍為通訊作者
參考文獻(xiàn):
[1]任興洲:我國(guó)商品批發(fā)交易市場(chǎng)的發(fā)展現(xiàn)狀與趨勢(shì)[J].經(jīng)濟(jì)縱橫, 2000, (8): 26~27
[2]王克臣李敏:入世五年我國(guó)億元商品交易市場(chǎng)快步走過(guò)[J].數(shù)據(jù), 2007, (7): 28~30
[3]楊松:北京商品交易市場(chǎng)的發(fā)展模式及管制方式 (一) [J]. 中國(guó)市場(chǎng), 2007, (30): 24~27