許承龍
(晉江市統計局,福建 晉江 362200)
隨著信息化時代的不斷發展,代表著信息化時代的主體是統計信息,所要獲取統計信息,則先要進行統計調查。統計調查搜集到的個體信息資料的真實、準確與否將直接影響信息化時代信息的質量。統計調查獲取個體信息資料的方式方法的不同決定了不同種類的統計調查獲取個體信息資料質量的差異。
統計調查按是否對構成總體的全部個體進行調查,可以劃分為全面統計調查與非全面統計調查兩類。全面統計調查指的是對構成總體的所有個體進行的調查,即要搜集總體中所有個體的個體信息資料的一種調查。再按對總體中個體信息資料收集方式的不同,全面統計調查又可以劃分為普查和全面統計報表兩種。普查通常通過調查員借助普查表直接向個體搜集其信息資料的一種調查方式。
非全面統計調查指僅從構成總體的全部個體中選取部分個體進行的調查。非全面調查又因從全部個體中所選部分個體的方式不同,分為抽樣調查和非抽樣調查。所謂抽樣調查指從構成總體的所有個體中按照隨機性原則選取部分個體的調查。同時,抽樣調查又根據隨機性原則在具體使用上的差異可以將抽樣調查劃分為簡單隨機抽樣、系統隨機抽樣、分層隨機抽樣、整群隨機抽樣以及多階段隨機抽樣等。另一方面,若從構成總體的所有個體單位中沒有遵循隨機性原則而選取部分個體單位進行調查,則這樣的統計調查稱之為非抽樣調查。生活中常用的非抽樣調查主要有重點調查、典型調查和滾雪球調查等。所以,抽樣調查,無論是理論研究還是實際應用,都已經受到人們的很大重視。
人們對統計調查的理解,通常為把由統計調查獲取個體信息并綜合得到的總體規律性與總體實際客觀規律性之間的差異稱之為統計誤差。這種統計誤差反映在統計調查指標上,就是由調查個體所得總體指標數值與總體實際指標數值之間的差別。
統計誤差通常可以分為登記性統計誤差和代表性誤差兩大類。所謂登記性誤差就是指由于調查者或被調查者的主觀原因而導致調查所得總體指標與總體實際指標之間的差異。
登記性統計誤差是存在的,其具體的主要特征分為以下兩個方面:一是登記性統計誤差從理論上而言是可以完全避免的,但是,在實際統計調查中,登記性統計誤差又不可避免。二是登記性統計誤差一旦產生,誤差的大小又不可以計量。從理論上來說,只要被調查者提供了真實、準確的個體信息資料,而且調查者能準確記錄與整理分析這些個體信息資料,就可以避免登記性統計誤差的產生。事實上,統計總體中的個體可能會基于各種考慮或顧慮不愿提供真實、準確的個體信息資料。根源在于被調查者可能根本不理解統計調查的真實目的,或者把統計調查混同于非統計調查。在我國當前國民參與統計調查意識比較薄弱、基本統計常識比較缺乏以及保護統計個體信息資料的法律、法規還不健全的現實條件下,出現登記性誤差是在所難免的。
再者,即使調查總體中的個體主觀想提供真實、準確的個體信息資料,但是由于被調查的個體缺少必要的數據記錄,或沒有相關數據,或個人信息資料記憶有誤也可能無法提供真實、準確的個人信息資料。如在我國農村居民年收支情況的調查中,有些農村居民不是不想告訴你某年收支的準確數據,而是有些農村居民從來就沒有對自己的年收支核算過,也沒有詳細的收支記錄。
另一方面,即使被調查的個體提供了真實、準確的個體信息資料,也可能因調查者數據記錄不熟練、責任心不強造成記錄錯誤,或者發生數據丟失以及分析、整理個體信息資料有誤等,也會產生登記性統計誤差。
以上所述,對構成總體的個體進行獨立地調查是統計調查區別于非統計調查的特征之一,所以,不論是全面還是非全面的統計調查,或者是抽樣還是非抽樣的調查都會出現登記性的誤差。這個是不可避免的。
代表性誤差既是指僅對構成總體的所有個體中部分個體進行調查,且僅僅根據這部分個體提供的信息資料綜合提煉出關于這部分個體的一般數量特征(如部分個體的均值),并據此對總體實際均值做出判斷所產生的一種差異。
代表性統計誤差可以根據它是來自抽樣調查還是非抽樣調查區分為抽樣誤差(也稱隨機誤差)和系統性誤差兩類。由抽樣調查所產生的代表性誤差稱之為抽樣誤差,由非抽樣調查所產生的代表性誤差稱為系統性統計誤差。
抽樣誤差具有如下基本特征:從理論上來說抽樣誤差無法避免,但是,在實際抽樣調查中,抽樣誤差不僅可以采取一定手段加以防范和控制而且其大小也可以計算。一方面,代表性誤差產生的根源在于構成總體的所有個體的普遍規律性不可能由其中的部分個體完全顯現,否則,它就違背了部分與整體的基本哲學關系。另一方面,抽樣調查從總體中選取部分個體時,盡管確保了每一個個體都有同等被選中的可能性,使得所選中的部分個體的構成與總體中所有個體的構成趨于一致,由此保證了選中的部分個體的數量特征能反映總體中所有個體的數量特征。然而,總體中的某個個體能否最終被選中又具有一定的隨機性,從而使得所選中的部分個體數量特征又不能完全反映總體中所有個體的數量特征。由此表明,抽樣誤差不可避免。
數理統計關于抽樣的原理已經表明:只要采用適當的方法對構成總體中的所有個體先做適當的編排或分組,然后再遵循隨機性原則抽選個體,就可以有效地降低抽樣誤差的大小。即在樣本容量一定的前提下,對同一現象總體分別采用分層隨機抽樣、系統隨機抽樣、整群隨機抽樣和簡單隨機抽樣,其抽樣誤差是有顯著差異的。另外,在其他條件相同的情況下,變重復抽樣為不重復抽樣也可以適當減小抽樣誤差。系統性代表誤差具有如下基本特征:從理論上來說系統性代表誤差是完全可以避免的,但是,系統性代表誤差一旦產生其大小又是不可計量的。系統性代表誤差產生的根源在于:在從構成總體的所有個體中選取部分個體時沒有遵循隨機性原則,而是主觀地、或部分主觀地從總體中選取個體作為調查單位。
因此,人們在實際統計調查中,如果能有意識地不受主觀因素的影響、自覺地遵循隨機性原則抽選部分個體,就可以避免系統性誤差的產生。
目前我國的社會經濟改革的開放程度不斷的發展和深入,社會主義市場經濟體系也逐漸的完善,社會各個階層及個人對信息的種類、數量和質量的需求也在不斷改變。統計調查作為各種信息的根本來源勢必會越來越受到人們更多地關注,也勢必會有越來越多的人參與到統計調查活動中來。通過分析不同調查現象總體的具體特征,根據統計調查的實際需要選擇適當的調查方式方法,分析各種統計調查誤差產生的可能原因,就可以有針對性地采取必要的手段防范某些統計調查誤差的產生,從而實現在調查成本不變的情況下,有效地提高統計調查的數據質量。