胡動剛,劉 忻,李春洋
“均勻設計”是我國獨創的有巨大應用潛力的科學統計方法[1],經過近30年的實踐檢驗和不斷完善,在生產和科研等領域獲得了廣泛應用,產生了很大的經濟、技術和社會效益。它的特點是所選擇的實驗點在實驗范圍內均勻分布,且實驗點的數目遠遠小于其他的實驗方法(如:正交設計),這正好符合土地調查中抽樣方案設計的要求,能夠在較少的抽樣調查樣本的情況下,獲取比較準確的多指標信息結果,不僅避免了大量人力、物力和財力的消耗,而且也實現了土地資源信息的社會化服務,滿足經濟社會發展及國土資源管理的需要。
均勻設計是中國科學院王元院士和香港浸會大學方開泰教授在1978年提出的。其基本思想是,在實驗范圍內選出有代表性的試驗點,使其盡量多地攜帶實驗信息。均勻設計運用數論方法使實驗點在實驗范圍內“均勻分散”,而不考慮“整齊可比”(即:實驗處理按水平數重復多次),故在保證實驗準確反映實驗內部規律的同時,使得實驗次數比其他實驗設計方法大大減少。因此,利用均勻設計的方法研究多指標土地抽樣調查方案,以期用盡可能小的樣本來相對高精度地估計總體多指標的數量特征。
均勻設計表是一個n行m列的矩陣,每一列是{1,2,…,n}的一個置換,表的第一行是{1,2,…,n}的子集,可以是真子集,記為Un(qt),其中U表示均勻設計,n表示試驗次數,q表示每個因素的水平個數,t表示最大的獨立因素個數。由此得出的均勻設計表數量太多,下面介紹用最好格子點法構造的均勻設計表[3]。
步驟1:確定第1行。實驗次數n為奇數時,尋找比n小的且互素的所有正整數,構成第1行(h1,…,hm)。
步驟2:其余各行由第1行生成。表的第i行(i<n)第j列的元素uij=ihj[mod n],而unj=n。
步驟3:表Un*(qt)的生成。當n為偶數時,由n+1確定的表Un+1(qt)去掉最后一行得到。
(1)每個因素的每個水平做一次且僅做一次實驗。
(2)任兩個因素的實驗點描在平面的格子上,每行每列有且僅有一個實驗點。
(3)每一個均勻設計表需要由統計學家編制的使用表配套使用。
(4)均勻設計在穩健回歸模型而非方差分析模型下達到最優[4]。
抽樣調查是指從研究對象的總體中按照隨機原則抽取一部分個體作為樣本進行調查,并以對樣本進行調查和統計的結果來推斷總體,據此推斷有關總體的數字特征一種非全面調查的統計方法。在實際抽樣調查工作中,對所要研究的總體進行某一項指標進行調查,稱之為單指標抽樣調查,它在現實生活中比較少見;而更多的是多指標抽樣調查,即在對某一研究總體進行抽樣調查時,人們總是多個指標同時進行,從而同時可獲得多個指標的樣本數據,對總體進行統計分析[3]。
在研究多指標抽樣方案時,需要首先搞清楚指標屬性是連續型還是離散型,對總體指標做出下面兩點假設:
(1)n個指標x1,x2,…,xm相互獨立。如果不獨立,可以通過主成分變換的方法選擇樣本;
(2)n個指標x1,x2,…,xm均為定量變量。特別的,若部分為定性變量亦可。
為了方便起見,用矩陣形式表示總體容量為n,指標數為m的樣本數據。

值得注意的是,當抽樣指標xj不滿足均勻分布時,需要對密度函數f(xj;·)進行均勻化處理,將之等概率的q分位,分為區間分別為:

f(xj∣k,·)在水平k∈(1,q)下的概率密度為

武漢城市圈,又稱“1+8”城市圈,是指以武漢市為圓心,包括黃石、鄂州、黃岡、孝感、咸寧、仙桃、天門、潛江周邊8個城市所組成的城市圈,并以武漢市為城市圈中心城市,黃石市為城市圈副中心城市,其國土面積達58051.9平方公里,占湖北省的31.23%,承擔著超過全省一半以上的人口和財政收入以及60%以上的經濟總量和80%以上的對外貿易。因此,面對發展和建設必然要占用土地這一無可回避的現實,在武漢城市圈城市化進程中,有必要對其土地節約集約利用狀況進行多指標抽樣調查,為武漢城市圈“兩型社會”建設提供持續有力的資源保障和優質高效的服務,實現武漢城市圈的可持續發展。

表1 武漢城市圈9市行政區劃表
根據近幾年的《湖北省統計年鑒》,本文選取了武漢城市圈9個市的總共47個區縣為樣本,建立抽樣框(見表1),并可以依據各市的統計資料查閱相關指標值。
從土地節約集約利用的內涵入手,考慮調查過程中資料和數據搜集的可操作性,綜合“經濟-社會-生態”和“集約-高效-協調”等因素,參考《湖北省人民政府關于推進土地管理改革促進武漢城市圈“兩型”社會建設的意見》,從武漢城市圈土地集約利用的強度、投入和效益等實際情況出發構建了下面的評價指標體系表[4](見表2)。

表2 土地節約集約利用評價指標體系表
根據表1、表2,我們可以將多指標抽樣調查問題轉化為一個U9(312)的均勻設計問題。因此,我們通過U9(312)的均勻設計表得到關于武漢城市圈的土地節約集約利用的抽樣調查方案,即抽樣調查方案(見表3)。

表3 均勻設計表U9(312)
不難發現,利用均勻設計表建立的多指標抽樣調查實質上一種特殊的分層整群抽樣調查,其優越性表現在以下幾個方面:
(1)調查成本可控且較低。我們知道,樣本容量直接與調查費用相關,容量越大,調查費用越高。用下面的線性函數表示調查成本
C=C0+cn
其中,C0是與樣本容量n無關的固定成本,包括組織、宣傳、抽樣摳的準備等;而c是平均每抽一個單元的費用,包括調查本身的費用、旅費以及數據處理費等[10]。均勻設計理論告訴我們,對于同一個指標體系,可以選擇抽樣次數較少的不同的設計表,比如,上述的土地調查方案不僅可以選取U9(312),也可以選擇U8(412),它們的區別在于要求的水平以及對應的實驗次數和精度不同,使用者可以根據自己的需要來。但是,無論哪一種,其容量都不大,當然,調查成本是較低的。
(2)抽樣調查的誤差較小。利用U9(312)的均勻設計抽取12個單元,指標xi在水平q=3下的樣本均值估計

每個水平q下的抽樣比例為

在指標均勻化處理且相互獨立的情況下,抽樣誤差完全來自于同一水平q下的不同單元隨機抽樣誤差,即有指標xi的均值方差

進而有指標xi的均值估計總方差為

(3)進行適當的列變換可以達到更好的效果。比如,對調任意兩列即變換指標次序不改變均勻設計表,那么,我們在抽樣調查中,可以根據實際情況調整指標的先后順序以降低難度和成本等;再如,選取第7和8列,可以得到“土地集約利用投入”的抽樣結果,因此,選擇其中適當的列能夠考察對應的評價準則層的抽樣結果。
[1] 王元.均勻設計—一種試驗設計方法[J].科技導報,1994,(5).
[2] 方開泰,馬長興.正交與均勻試驗設計[M].北京:科學出版社,2001.
[3] 馬樹才,韓云虹,陳謹玫.對多指標抽樣調查及其統計推斷進行[J].數據分析,2007,(4).
[4] 王業僑.節約和集約用地評價指標體系研究[J].中國土地科學,2006,(3).
[5] 馮士雍.抽樣調查——理論、方法與實踐[M].上海:上海科學技術出版社,1996.