任冉+張彥松+齊潔


【摘要】問卷調查法是直接了解民生需求的有效手段。面對海量的問卷信息,傳統的統計方法在主要信息的提取上存在著定性有余而定量不足的困難。此外,簡單的線性相關系數研究不僅弱化了單個指標在整體信息庫中的作用,而且忽略了多個因子之間的協同變化規律。本文利用經驗正交分解技術EOF,基于信息學的原理,選取八卦洲民生需求問卷信息對其進行主成分提取,力求用需求場的主成分這一嶄新概念定量表征當地民生需求,取得了良好的效果。這不僅具有重要的科學意義,更為未來社會工作需求的定量分析提供了全新的思路。
【關鍵詞】民生需求 正交經驗模態分解技術 需求場 主成分
社會指標最早是由美國學者雷蒙德·鮑爾在1966 年提出的。他指出:社會指標是用來“判斷社會在準則、價值和目標等方面的表現的依據,是作為具有普遍社會意義的社會狀況的指數”。此后,社會指標被廣泛地應用于社會結構、社會發展狀況、社會生活環境等多方面的評估。隨著社會學和統計學的發展,社會指標逐漸由理論研究走向實際應用,逐漸在社會運行狀態和發展進程的評估中發揮起重要的作用。
社會指標的建立離不開海量的數據信息,但在面對大量的數據信息時,傳統的社會學統計方法難以滿足實際應用的需求。究其根本原因是因為社會信息的因子維度過大,無法進行全面考慮;此外,單一使用回歸方法往往又會因過度強調了擬合效果而忽略相關系數較低的因子的貢獻。
針對上述問題,本文在社會學研究中提出了場的概念,利用八卦洲各類民生需求數據組成需求場,基于經驗正交函數分解(EOF)技術對民生需求場進行降維并提取主成分,以期全面考慮全場因子信息。最后,用需求場的主成分這一客觀指標定量表征當地民生需求狀況,為當地的社會發展和政府決策提供了客觀的參考指標,取得了良好的效果。
一、資料與方法
(一)資料
八卦洲街道位于南京市棲霞區西北部,與六合區、浦口區組成南京江北新區,面積56平方公里,是長江中的第三大島,八卦洲街道是南京市棲霞區2個農村街道之一,該街道下轄1個社區(八卦花園社區)、7個村(七里村、上壩村、下壩村、中橋村、新閘村、外沙村、東江村),農村街道特點鮮明。
本次研究以南京市棲霞區八卦洲街道居民為對象, 采取問卷調查法,共發問卷105份,有效問卷102份,男女比例為 1:1 ,各年齡層次均有覆蓋。問卷內容涉及:性別、年齡、學歷、收入、各類社會需求滿意度等。運用李凱爾特量表,將調查對象對居住地生活環境、老年人群體醫療服務、兒童青少年教育服務、文化娛樂活動以及鄰里關系的滿意度評價分為五個維度:非常滿意、滿意、一般、不滿意、非常不滿意,以此獲得不同年齡段群體的五類民生需求集合。
之后本文通過需求場概念的提出和EOF的跨領域應用得出居民需求的主成分情況,以客觀表征該地民生需求。
(二)EOF概述
經驗正交函數(EOF)方法最早由統計學家pearson(1902)提出,由Lorenz(1956)引入氣象問題分析中。該方法以場的時間序列為分析對象,由于對計算條件要求甚高,直到20世紀60年代后期才在實際工作中得到廣泛應用。近30年來,出現了適合于各種分析目的的EOF分析方法,如擴展EOF(EEOF)、旋轉EOF(REOF)、風場EOF(EOFW)、復變量EOF(CEOF)。
與其他統計方法相比,EOF無需設定固定的函數,更難能可貴的是其展開收斂快,很容易將變量場的信息集中在幾個模態上,分離出的特征結構意義明顯。EOF方法不但用于氣象觀測資料場的分析,現在,EOF方法早已作為一種基本的分析手段頻繁地出現在工程制造、水文地理等學科的文獻中。EOF的基本原理如下:
將某變量場資料以矩陣形式給出:
X=x11 x12 … x1nx21 x22 … x2n … …xm1 xm2 … xmn (1)
令A=XXT (2)
則根據實對稱矩陣分解原理,一定有:
VTAV=∧ (3)
其中,V的列就是A的特征向量,∧是A的特征值組成的對角矩陣。則有:
Z=VTX (4)
Z就是主成分矩陣。
原始場就展開為主成分Z和空間向量V兩部分,即:
X=VZ (5)
即:
xit=■vikZkt=vilZ1t+vi2Z2t+…+vipZpt (6)
由(6)可知,將所有的主成分Z和空間向量V對應相乘并求和就可以反演出原始場的所有信息。
二、八卦洲民生需求情況的分析
(一)八卦洲民生需求的基本情況
為量化需求的程度及基本情況,本研究借用“場”這一普適概念,提出了居民需求場這一嶄新概念。其基本原理為,初步分別將非常滿意、滿意、一般、不滿意和非常不滿意分別參數化為5、4、3、2、1分;對同一年齡段的人數的單一滿意度進行算數平均,得需求場如表1,以矩陣表示:
(二)民生需求場的主成分提取
考慮到需求場中涉及了不同層面的信息,矩陣的維數較大,對其直接研究存在一定困難;同時,逐批選取一對信息進行相關分析不僅會忽視這兩個變量在整個場中的表現情況,更難以準確表征整個場的信息情況。故運用EOF技術對整個需求場進行分解展開并進行主成分提取,以達到降維的目的,得特征向量(模態)V1-V5和主成分α1-α5,如表2:
將表2中的5個特征向量和5組主成分按式(6)反算即可達到原始場(表1),各個模態的方差貢獻率如表3所示:
其中,第一模態的方差貢獻率達99.3%。也就表明,用第一模態特征向量V1和時間系數α1(主成分)就可以表征原始需求場99.3%的信息。因此,用V1和α1表征整個需求場,可以使大量的需求信息被提取進入第一模態。這樣一來5×5的需求場被簡化為V1(5×1)和α1(5×1),而僅僅損失了0.7%的信息。很顯然,這0.7%的信息損失率是完全可以接受的。endprint
而從EOF的算法可知,各個模態之間彼此正交,互不干擾,這樣既保證了很高的信息完整度,更解決了傳統統計方法對同一變量的影響進行重復考慮的問題。此外,該方法更能全面地,量化地考慮所有信息的作用,這是傳統的回歸方法力所不及的。
從主成分α1的實際意義上看,α1成為5類需求的綜合表征指數,代表著5類需求的共同作用。α1隨年齡的變化正是反映了不同年齡段人群對社區狀況的綜合滿意度。從表2,可以看出, 61到75歲年齡段人群綜合滿意度最低,為6.17。因此,61-75年齡段的居民應是該區域內開展社會工作的重點服務對象。而如果不考慮整個需求場各個數據之間的內在聯系,單純從各自分值上去分析,則61-75歲年齡段的特點就被影藏了。
而V1則表征著各類需求滿意度的協同變化情況,對于綜合所有年齡段的某一需求的滿意度來看,以居住環境滿意度為例,其與醫療服務、教育服務、文娛活動和鄰里關系的協同變化率依次為:0.49/0.45、0.49/0.46、0.49/0.43、0.49/0.39。由表2可以推知,這5類需求問題具有很大的協同性,而鄰里關系的放縮效應最為明顯。因此,可將提升鄰里熟悉度,改善鄰里關系作為重點問題進行突破以期起到落一子而滿盤活的效果。同樣,如果簡單地從鄰里關系滿意度自身的數值上看,鄰里關系的放大器效用就被完全忽視了。
三、結論與討論
(1)在社會工作中,將海量的問卷信息用場的形式來表征,可以為信息的保存與處理提供一個標準可靠的環境。
(2)對于一些收斂性較強的社會工作信息場,通過EOF進行主成分提取不失為一種是壓縮信息量的有效手段。此外,從算法和運算效果上看,EOF方法不僅可以對整個場中的信息進行通盤考慮,而且可以在整個場的大背景中找出局部數據信息的內在聯系,為建立各類社會指標提供一種嶄新的途徑。
(3)從EOF的分解結果上看,無論是從促進經濟發展角度,還是社會和諧發展角度入手,八卦洲地區61-75年齡段的民生需求問題應引起社會各界的重視。其中提升鄰里關系水平的迫切性最大。
(4)鑒于此次樣本較小,EOF的降維作用還比較有限。相信隨著原始場維度的擴大,EOF的作用將越發明顯。而對于得到的主成分,對其如何進行閾值評估將成為下一步研究的重點。
參考文獻:
[1]余少謙.和諧社會內涵、特征與評價指標體系研究綜述——多學科、多指標視角[J].福建行政學院福建經濟管理干部學院學報,2006,(06).
[2]陳黎明,向書堅,李炳林.和諧社會評價指標體系與評價模型及其應用[J].中南財經政法大學學報,2008,(02).
[3]李堂軍,王建奎,李菁.區域經濟、社會與環境協調發展模糊評價模型與應用[J].山東科技大學學報(自然科學版),2008,(02).
[4]丁裕國.EOF在大氣科學研究中的新進展[J].氣象科技,1993,(03).
[5]文道松.基于改進主元分析的工業過程故障檢測與診斷[D].哈爾濱理工大學,2011.
[6]龔文平,吳家信,莫李帥.用EOF方法分析海口灣東部淺灘區的泥沙來源與泥沙運動[J].泥沙研究,2004,(01).endprint