陶 洪, 徐福緣
(1.紹興文理學院經濟與管理學院,紹興 312000;2.上海理工大學管理學院,上海 200093)
勞動生產率是指勞動者在一定時期內創造的勞動成果與其相適應的勞動消耗量的比值.勞動生產率因計算簡便、含義直觀,以其固有的優勢一直在經濟管理的理論和實踐領域保持著重要的地位.勞動生產率作為衡量勞動生產效率的方法之一,不僅可以反映技術進步所造成的效率提高,也可以衡量其它替代生產因素對生產效率的影響.勞動生產率既是衡量組織競爭力的一項重要的經濟統計指標,又可幫助決策者分析經濟狀況、預估所需勞動力以及了解促進組織成長的方法.但勞動生產率指標又是一項非常綜合的指標,包含了豐富的經濟信息,通過對影響勞動生產率變動的因素進行分類和規則提取,有助于更好地把握勞動生產率的增長規律.
設D1(X0,Y0)為規模報酬不變的相對效率,則規模報酬不變的C2R模型為[1]

式中,θ是相對效率;X0是投入向量;Y0是產出向量.
設D2(X0,Y0)為規模報酬可變的相對效率,則規模報酬可變的BC2模型為[2]

Kumar等[3]利用規模報酬不變模型,將勞動生產率變動分解為技術進步、技術效率和資本深化3方面的影響因素.
設由C2R模型確定的前沿面為純前沿生產面,由BC2模型確定的為前沿生產面.t時期的前沿生產面和純前沿生產面分別為ft,gt;t+1時期的前沿生產面和純前沿生產面分別為ft+1,gt+1(如圖1).從gt到gt+1表明從t時期到t+1時期所有決策單元不考慮規模報酬變化情況下,生產技術水平提高對生產效率的影響.

圖1 勞動生產率四重分解Fig.1 Duadruplicity decomposed to labor productivity
設k表示人均資本,t期人均資本為kt,t+1時期人均資本為kt+1,t期和t+1期對應的實際勞動生產率、前沿勞動生產率和純前沿的勞動生產率分別為st,ft(kt),gt(kt)和st+1,ft+1(kt+1),gt+1(kt+1).gt+1(kt)表示t+1時期人均資本為kt時,其純前沿的勞動生產率;gt(kt+1)為t期人均占有資本為kt+1時,其純前沿的勞動生產率.如果以st為參照,st和ft(kt)的差距為技術效率,這指標反映了該決策單元和人均資本占有量相同的決策單元對現有技術利用能力的差異.技術效率主要表現為管理能力、對新技術的運用能力和資源的配置能力.某一決策單元從t期到t+1期勞動生產率的變化率記為LP.技術效率的變化對勞動生產率的影響為記為TP.該指標大于1,表明可通過挖掘生產潛力提高生產效率.規模效率對生產效率的影響是記為SP.該指標度量在t期和t+1期該決策單元人均資本占有量達到最佳人均資本占有量時對生產效率的影響.處于kt和kt+1的純技術進步變化率分別是和其幾何平均是記為TC.該項指標度量從t期到t+1期技術變化對生產效率的影響,大于1,說明整體的技術水平得到提升并促進了生產效率的提高.對純前沿生產面gt,人均資本由kt變為kt+1,勞動生產率的變化為對純前沿生產面gt+1,人均資本由kt變為kt+1,勞動生產率的變化為資本深化對勞動生產率影響的幾何平均為,記為KP.該項指標度量了在t期和t+1期人均資本的變化對生產效率的影響.由此得到勞動生產率的四重分解式

決策樹算法是一種歸納分類算法,它通過對訓練集的學習,挖掘出有用的規則.C4.5是目前廣泛使用的決策樹算法,該算法使用信息增益比例的概念,以信息增益比例作為選擇屬性的標準,在每個節點上選擇具有最高信息增益比例的屬性對數據集進行劃分.這種理論方法使得對一個對象分類所需的期望測試數目最小,以確保找到一棵簡單的樹[4].
設S是s個數據樣本的集合.假定類標號屬性具有m個不同值,定義m個不同類Ci(i=1,…,m),設si是類Ci中的樣本數.對一個給定的樣本分類所需的期望信息為

其中,pi為任意樣本屬于Ci的概率,并用估計.
設屬性A具有v個不同值{a1,a2,…,av},可以用屬性A將S劃分為v個子集{s1,s2,…,sv}.其中,sj包含S中這樣一些樣本,它們在A具有值aj,設sij是子集sj中類Cj的樣本數.根據由A劃分成子集的熵(entropy)或期望信息為


在A上分枝將獲得的編碼信息,即信息增益為

G(A)是由于知道屬性A的值而導致的熵的期望壓縮.
一個屬性的增益比例為

研究的產出數據用1988~1992年工業凈產值作為產出指標,1992年之后選擇了工業增加值.由于是相鄰兩年指標的比,《中國統計年鑒1993》提供了1992年工業凈產值和工業增加值的數據,故1991~1992年的變化率按照這兩年的工業凈產值計算,而1992~1993年的變化率按照這兩年的工業增加值計算.分析表明前期使用工業凈產值和后期使用工業增加值在整個分析年度具有很強的一致性.為消除價格影響因素,對1992~2006年的工業增加值數據、1988~1992年的工業凈產值數據,按統計年鑒提供的“工業品出廠價格指數”以1988年為基期進行平減.
選擇各省的工業從業人員平均人數和固定資本存量作為投入指標,固定資本存量是以1988年為起點,利用永續盤存法計算而得,公式為

式中,Ki,t和Ki,t-1表示第i個省在t年和t-1年的固定資本存量;δ表示固定資產的折舊率,采用代表幾何效率遞減的余額折舊法得出其值為9.6%[5];Ii,t表示第i個省在第t年的固定資產投資;Pt為固定資產投資在第t年的價格指數(1988年為1).所用數據來自于《中國工業經濟統計年鑒》和《中國統計年鑒》.
運用式(3)基于DEA的勞動生產率四重分解模型和中國工業統計的省份數據,對中國30個省1988~2006年的勞動生產率的變化率進行了分解,在計算過程中采用了DEAP2.1軟件[6],各省域的平均結果如表1所示.

表1 省域工業勞動生產率的變化率四重分解結果Tab.1 Annual average of change for Chinese industrial labor productivity
本研究中將勞動生產率作為分析目標,總結技術進步、技術效率、規模效率、資本深化4個因素對它的影響,所以將勞動生產率作為類別屬性,其它4個屬性稱為非類別屬性,提取勞動生產率變動影響規則.在決策樹分析過程中,首先分別對30個省勞動生產率、純技術效率、技術進步、人均資本的規模效率、資本深化這5個指標共18個跨年度變化率的數據進行加權平均,然后利用決策樹提取影響省域勞動生產率的規則.
2.3.1 勞動生產率指標的離散化分類
由于勞動生產率指標是連續數據,首先需要對30個省的工業勞動生產率變動率的平均數據進行離散化處理,本文使用SPSS統計軟件的層次聚類分析將勞動生產率增長率的數據作離散化處理,結果見表2.

表2 省域工業勞動生產率聚類分析結果Tab.2 Cluster analysis result of provincial industrial labor productivity
在用決策樹分析軟件Clementine對勞動生產率影響因素規則提取過程中,分別對2,3,4,5類聚類結果給予了分析,發現純技術進步是對勞動生產率影響最小的因素,幾乎不對勞動生產率指標產生影響;而且由4個聚類類別增加到5個聚類類別,分類的準確率由90%下降到86.7%,所以本次分類選取4個分類作為規則提取的分類標準.
2.3.2 基于決策樹的影響省域勞動生產率變動規則提取結果
根據以上步驟,在計算過程中運用SPSS Clementine11軟件,得到勞動生產率影響因素決策表的一個規則集,共包括4條規則:
a.中國工業勞動生產率增長率處于高位的省份有21個,占總數的70%;處于中上水平的省份有5個,占總數的16.7%;處于中下水平的省份有3個,占總數的10%;處于低位的省份有1個,占總數的3.3%.
b.資本深化是影響省域工業勞動生產率差異最主要的因素.資本深化以1.165作為臨界點,處于臨界點以上(包括臨界點)和臨界點以下的省份各占50%,均為15個.而工業勞動生產率增長率處于高位的21個省份中,資本深化大于等于1.165的省份有14個,占資本深化大于1.165的省份的93.3%.另外,工業勞動生產率變化率處于低位的1個省份資本深化也大于等于1.165.資本深化小于1.165的15個省份中,處于高位的省份有7個,占資本深化小于1.165的省份的46.7%;處于中上水平的省份有5個,占資本深化小于1.165的省份的33.3%;處于中下水平的省份有3個,占資本深化小于1.165的省份的20%.
c.對省域工業勞動生產率差異的影響處于第二位的指標是技術效率.從決策樹分析可以知道,技術效率只對資本深化小于1.165的省份的勞動生產率變化率具有顯著影響.對資本深化小于1.165的15個省份,可以按照技術效率是否大于1.003進行劃分.資本深化小于1.165而技術效率大于等于1.003的省份總共有6個,并且全處于勞動生產率增長率的高位.資本深化小于1.165,技術效率也小于1.003的省份總共有9個,其中1個處于勞動生產率增長率的高位,5個處于勞動生產率增長率的中上水平,3個處于勞動生產率增長率的中下水平.
d.對工業勞動生產率影響的最后一個指標是人均資本的規模效率,并且這一指標只對資本深化小于1.165而且技術效率也小于1.003的省份具有顯著影響.滿足資本深化小于1.165而且技術效率也小于1.003的省份共有9個,可以按照人均資本的規模效率是否大于等于1.19分為兩類.人均資本的規模效率大于等于1.19的省份有6個,其中有5個省份的勞動生產率增長率處于中上水平,有1個省份的勞動生產率增長率處于中下水平.人均資本的規模效率小于1.19的省份有3個,其中有1個省份的勞動生產率增長率處于高位,有2個省份的勞動生產率增長率處于中下水平.
利用決策樹分類和規則提取方法,提取了勞動生產率各影響因素對省域工業勞動生產率增長差異的影響、影響方式以及影響規則.以上研究顯示,中國省域間工業勞動生產率差異的決定因素是投資,即1988~2006年期間,中國工業增長仍然是依靠外延的擴展,而非依靠技術、管理等方面提升的內涵式增長.當然,由于使用的數據是多年的平均數據,無法反映時間趨勢的變化,結論的精確性將不可避免受到影響,但本研究是將決策樹算法用于勞動生產率分析的一次有益嘗試,其結論也符合中國省域工業勞動生產率增長的現狀,并對揭示中國省域工業勞動生產率增長的規律也具有一定的指導意義.
[1] Charnes A,Cooper W W,Rhodes E.Measuring the efficiency decision making unites[J].European Journal of Operational Research,1978,2(6):429-444.
[2] Banker R,Charnes A,Cooper W W.Some models for estimating technical and scale inefficiencies in data envelopment analysis[J].Management Science,1984,30(9):1078-1092.
[3] Kumar S,Russell R R.Technological change,technological catch-up,and capital deepening:relative contributions to growth and convergences[J].American Economic Review,2002,92(3):527-548.
[4] Han J,Kambr M.數據挖掘概念與技術[M].范明,孟小峰,譯.北京:機械工業出版社,2003.
[5] 張軍,吳桂英,張吉鵬.中國省際物質資本存量估算:1952—2000[J].經濟研究,2004(10):35-44.
[6] Coelli T.A guide to DEAP version 2.1:a data envelopment analysis program[R].Armadillo:University of New England,1996.