王 燦
(成都師范學院 數學學院,四川 成都 611130)
就業是民生之本.綜合分析就業基本狀況、發展基礎和潛力等因素,科學劃分就業功能區,客觀評價不同區域的功能特點,確定就業功能主導方向,對深化引進人才政策調整、形成人才分配合理、促進特色區域發展的格局具有重要意義.
就業的基本功能體現在四個方面:保障功能、激勵功能、融入功能和協作功能[1].其中,保障功能是指居民通過就業獲得物質、精神文化等,以滿足基本的社會生存所需;激勵功能是指就業崗位提供相應激勵措施,使就業者的主觀能動性得到最大程度的發揮,以實現就業者的的自身價值;融入功能是指就業崗位提供或具備使就業者融入社會的良好因素;協作功能是指居民通過就業,能夠在此過程中提升自身與社會他人之間的協作能力.功能分區基本思路是:首先確定各功能的衡量指標,搜集、統計整理、分析對應數據及資料,建立指標體系并對數據進行處理,以消除指標量綱的影響,確定功能分區的指標量化集,通過這些處理后的描述指標把全國劃分成若干類別,做好聚類分析的前期工作;然后構造關系數據陣,選定聚類方法并運用SPSS進行具體的聚類分析,以確定各類別包含的具體省區;最后計算各各類別各功能的權重系數,對各功能的主導作用和輔助作用進行排序,以明確最終就業功能區劃分的結構.
聚類的基本思想就是根據觀測指標之間的親疏關系進行分類[2],而我國大陸地區31個省級行政單位是就業功能分區的對象,因此應該選擇每個省(自治區、直轄市)都具有并且能用以衡量各就業功能特點的統計指標.結合各省區與就業功能密切相關的經濟、政策、社會和自然環境,對這些統計資料進行多次論證,最后確定了4大類別、共30個具體指標作為就業功能分區的依據.為確保所構建的指標體系更加符合實際情況,之后將使用專門業務標準量化各指標,力求最終能夠準確的描述各類別的就業功能的特點.
社會保障制度是促進我國社會發展穩定發展的依托之一,因此以社保額、醫療體系數目、教育培訓、食住行等四組指標描述就業的保障功能,共12個變量.其中,社保額主要值各地區參保人數與額度;醫療主要指各地區醫院和床位數;教育培訓主要通過各地區中小學、高等學府個數衡量;食住行主要參考各地區的消費指數、房價等.
激勵功能指標主要反映和評價各省區的就業市場環境、戶籍和政府服務制度的實施,共8個變量.其中,市場競爭環境是根據各省區政策的實施和促進力度,由專家打分賦值,就業政策的量化主要依據各省區再就業的投入數額;戶籍檔案制度的量化是根據各地對戶籍、檔案的限制條件,由專家打分得到[3].
以各地區的生活習俗、自然環境等因素來衡量就業者的融入情況共.其中,生活習俗以少數民族數和有關民俗文化的學術研究為標準進行量化[5];自然環境的量化主要根據《中國統計年鑒》中的平均溫度、濕度、污染指數等衡量,此類指標共6個變量.
用價值觀教育和文化傳承指標描述就業的協作功能,它們的量化[5]主要采用了抽樣調查,對數據進行相關分析,根據相關性打分而得.
將31個省區的30個指標收集、量化、整理后,即得到需要的31×30的樣本矩陣.
所建立指標體系中,有些變量雖然是同量綱但差距很大,更有一些變量的量綱都是不同的,這在很大程度上削弱了變量間的可比性,為了消除量綱的負面影響,首先需要對數據進行標準化處理.
通過建立指標體系構造的樣本矩陣表示為:

目前有很多方法對聚類分析所需的數據進行標準化處理,常見的極值化方法、標準化方法、均值化方法、標準差化方法[6]等.結合所構建的指標體系,發現各變量的重要性是一致的,為避免消除量綱時影響變量間的地位,本文選擇標準差化方法處理數據.

設標準化后的量為X'ij,則有:

其中,i=1,2,…,31,j=1,2,…,30.
這樣,就得到無量綱影響且保持穩定性的新的樣本矩陣,記為:

為描述樣本之間的親疏關系,對標準化后的樣本矩陣進行關聯關系的梳理時采用“歐式距離”測度個體間的差異,即把每個省區都看成是n維(n=30)空間中的一個點,X'ij的值為對應的點坐標,則關聯數據陣中的距離計算公式就為:

式(6)中的 i、j=1,2,…是參與聚類的省區,m=1,2,…,n是系統指標數.通過距離模型的計算,得到了一個31×31的方陣,描述了任意兩個省區之間的親疏程度,距離越小說明兩個聚類對象越親密,反之亦然.此關聯數據陣記為:

顯然,該關聯數據陣是方陣,且關于對角線對稱.
聚類方法很多,比如常用的有層次聚類或快速聚類(K-Means聚類)法.其中,層次聚類法的基本思路是由根據關聯數據陣,首先構造31個類,即每個省區自成一類,然后根據兩個省區的距離di和dj,根據最近原則把其合并成新的類dr(dr={di,dj}),之后計算新類dr與未被合并的各省區的距離,重復此步驟,直至所有省區全部聚為一類,最后畫出聚類過程圖,根據聚類圖決定全國31個省區就業功能所需的分類個數及對應的具體省區.
層次聚類法能夠得到多個分解類,但對樣本的距離數據陣進行聚類時,重新計算距離過程中會使樣本空間擴張或濃縮,造成樣本數據的失真或遲鈍,該方法對我國就業功能分區的執行效率不甚理想.因此確定采用K-Means聚類法[7]進行分析,該聚類方法的基本步驟如圖1所示:

圖1 聚類算法步驟
根據上述梳理的K-Means聚類法,運用SPSS軟件對標準化后的相關數據實現聚類分析.具體操作過程是導入數據后,選擇分析→分類→K-均值聚類,其中迭代次數為10,類中心點偏移程度為0.02時終止聚類,把我國31各行政省區聚分為了四大類,當然這只是初步聚類結果.
為了得到更加符合實際、科學的分類,請工作在就業指導第一線的專家們進行定性分析,稍微調整聚類結果.這樣由指標選取時的定性到聚類時的定量,再到微調的定性研究,把我國大陸31個省區按就業功能分為四類,結果如表1所示.

表1 我國行政省區就業功能聚類結果
由聚類結果已把全國劃分成4個類別,然而各類別的功能排序還不明確,因此需要對各類功能的主導和輔助關系的結構加以完善.
為確定各類別就業功能的主輔結構,首先考慮利用指標平均值的大小來衡量,通過直接計算發現由于各類別的指標都比較復雜,會對排序結果造成較大偏差.因此最終采用指標權重來確定各功能排序,思路是把各類別功能總系統看成整體1,先計算單個指標的權重,再計算各類別各功能指標的總權重,最后計算單權重與總權重的比值,比例越大說明對應的就業功能的主導作用越明顯,其計算公式為:

式(8)中,i=1,2,3,4表示類別,j=1,2,3,4為功能編號,rij表示第i類第j個功能的權重,Rij為第i類第j個功能的綜合權重.最終得到的按就業功能進行聚類、排序的結果如表2所示.

表2 就業功能分類及排序結果
由表1、表2,得到我國各類別就業功能的基本結構:第Ⅰ類以北上廣為代表,其醫療、教育、社會保險等保障體系優勢突出,形成了以保障功能為主導→激勵功能→融入功能→協作功能的結構;第Ⅱ類主要是西、北部地區環繞線,在國家大政策方陣的指引下,該類省區以人才政策為突出吸引力,形成了以激勵功能為主導→保障功能→融入功能→協作功能的結構;第Ⅲ類分為南北兩派,且以人口眾多為類,顯示了該類別以融入功能為主導→保障功能→激勵功能→協作功能的結構;第Ⅳ類顯然很有區域特色,因此形成了其以協作功能為主導→融入功能→激勵功能→保障功能的結構.
上述聚類及排序結果以就業功能為研究基礎,首先根據就業的保障、激勵、融入和協作四大功能建立指標體系,并對數據進行消除量綱的標準化處理,由K-Means聚類法,運用SPSS軟件進行快速聚類,把我國按就業功能劃分為4類.進一步的功能權重的計算及排序確定了各類別的就業功能的主導和輔助結構.下一步可在指標體系的建立、政策制度的量化上進行可靠性驗證,從而使分類和功能排序更加合理,為我國就業、擇業等相關政策的制定提供數據支撐.