馬銳敏

摘? ?要:針對微觀經濟主體的調查數據為健全貨幣政策調控框架、完善宏觀審慎管理體系提供了高效的微觀信息保障,在中央銀行的決策中發揮著重要作用。國外部分中央銀行開展微觀居民調查起步較早,逐步建立了比較成熟和系統的調查體系,通過科學規范的設計實施方案確保了數據質量準確可靠,調查成果在深化學術研究和服務宏觀決策方面成效突出。本文對國外央行居民調查項目的設計框架、實施機制、數據運用等進行了深入分析比較,相關經驗對我國完善微觀調查有重要借鑒作用。
關鍵詞:微觀居民調查;抽樣設計;數據價值
DOI:10.3969/j.issn.1003-9031.2022.05.008
中圖分類號: F833;F837? ? ? ? ? 文獻標識碼:A? ? ? ?文章編號:1003-9031(2022)05-0080-08
一、引言
居民是社會最基本的行為主體,是宏觀政策決策的出發點和落腳點。自20世紀80年代以來,美國等發達國家陸續啟動了針對微觀居民個體的調查項目,主題涵蓋消費者金融狀況、家庭經濟生活、民眾社會預期等多個方面。數據成果不僅填補了針對微觀主體的學術研究空白,還產生了廣泛而積極的社會效應。在學術方面,居民調查發布的數據豐富了研究視角,拓寬了學術研究的廣度和深度。在社會效益方面,調查數據為重大政策問題的研究與討論提供了有效信息參考,如相關國家借助調查成果在家庭資產負債配置與消費行為、收入分配與經濟發展、公眾經濟預期與央行貨幣政策操作等諸多宏觀經濟政策方面進行了深入探究。
國外部分國家開展微觀居民調查起步較早,經過長時間發展,逐步建立了比較成熟和系統的調查體系,在抽樣設計、指標選取、組織實施、數據運用等方面形成了一套科學詳細的方案。本文詳細歸納了國外居民調查項目的抽樣設計框架,全面總結了調查組織實施過程中的主要做法,并結合國際經驗提出了我國開展微觀調查的一些借鑒和啟示。
二、抽樣方案的設計
(一)構建完備的抽樣名錄和選擇合格的填答者是保證數據質量的基礎
一是充分依托各類資源和輔助信息構建完備的抽樣名錄。居民調查面對數量眾多、層次豐富的個體單元,根據調查主題在龐大的群體中精準識別目標單元是構建優良抽樣框的前提,這就需要充分借鑒已建立的各類名錄以及個體多維度的識別特征。一類是依托現有的其他抽樣名錄。如美聯儲理事會主管的居民經濟和決策調查(SHED)的初級樣本框選擇了由調查執行機構GfK公司基于地址抽樣(ABS)方法建立的、具有全國代表性的商業樣本庫Knowledge Panel。紐約聯儲負責的消費者預期調查(SCE)的受訪者均來自消費者信心調查(CCS)。另一類是選擇合理的個體識別特征建立樣本框。如紐約聯儲建立的消費者信用面板數據庫選擇對初級樣本單元覆蓋全的美國居民社會安全號碼(SSN)作為抽樣名錄。SSN對居民的廣覆蓋和一一對應性,賦予了其作為輔助信息構建完備樣本框的特性。
二是根據調查目的和內容,在選擇主要受訪者方面均有要求。美聯儲的消費者金融調查(SCF)要求由調查家庭的戶主、或者是家庭中財務知識較豐富的成員受訪。消費者信用面板數據庫的目標人群僅包括擁有信用記錄的美國公民,18歲以下沒有信貸需求或機會以及從未申請過貸款或沒有資格申請貸款的消費者不包括在內。英格蘭銀行的公眾通脹態度調查(IAS)受訪對象為年齡超過16周歲的成年人,借助年齡門檻鎖定目標人群。
三是兼顧數據需求和實施成本設計樣本輪換周期。固定樣本設計能夠持續跟蹤相同個體,建立面板數據庫滿足多方面研究的需要,但面訪方式下固定監測的實施成本較隨機抽取通常更高。一般而言,區域跨度較大、間隔周期較長、以面訪為主要方式的項目在每期調查前樣本會重新抽取更換,而高頻調查為減少抽樣波動對數據序列的影響,更傾向于設計較長的樣本輪換周期。如按年度開展的全國性家庭或個人調查項目(HFCS、SCF等),每期樣本會根據抽樣設計重新抽取。而SCE這類旨在收集及時、高頻數據的項目,為了提升調查結果的精確性,抽樣設計采取輪換小組(每一個家庭在連續12個月參加調查后將被輪換出樣本),以便能夠跟蹤同一個體、減輕月度間樣本變動帶來的數據波動;同時,持續一段時間跟蹤同一家庭,能夠準確了解家庭內部敘事和預期,還可以研究消費、收入等關鍵變量預期的交互影響。
(二)主要采用分層抽樣和補充抽樣來確保各子群體的入樣概率
針對居民或居民家庭的問卷調查,抽樣設計主要采用了分層多階段概率抽樣和補充抽樣兩種方式來確保樣本對總體的代表性。
一是分層多階段概率抽樣。分層抽樣適合于變量值差異較大的總體,其基本原理是異質性較強的總體分成若干個同質性較強的子總體,從中分別抽取樣本合并后代表總體。其優勢在于,每層抽樣的獨立進行,每層可選擇適合本層的不同抽樣方法,同時也可對各層進行參數估計,而不單是對整個總體的估計。因此,分層技術在區域跨度較大的項目中,如全球性、全國性調查中被廣泛應用。
紐約聯儲的消費者信用面板數據庫、CCS、以及歐央行的家庭金融與消費調查(HFCS)均采用了分層隨機抽樣方法。首先,采取符合各國實際的方式確定廣泛的初級抽樣單元,再根據調查意義確定各個階段的分層指標,同時通過控制分層指標權重或引入附加指標的方式來控制抽樣中的誤差問題,從而保證各子群體的入樣概率。如消費者信用面板數據庫每季使用相同標準對居民社會安全號碼進行5%的隨機抽樣,由于個人社會保險號碼最后4位數字是按申請的時間順序隨機分配,此種抽樣方法能夠自動捕獲進出目標人群的新流量,從而避免了靜態面板隨著時間推移代表性弱化的缺點。CCS的初級抽樣框依靠美國郵政服務地址庫①建立,再根據性別、收入、地域和年齡指標分層,并選擇權重,以最大限度地增強樣本的代表性。HFCS調查各國在分層指標的選擇上,均使用了地區、區劃單位人口規模等主要指標,部分國家還引入了其他一些附加指標,如盧森堡和芬蘭使用個人收入、就業狀態,西班牙使用個人應稅財富數據等,以滿足每個參與國家的樣本能夠代表本國以及整個歐元區總體分布特征的要求。
二是補充抽樣。各國在關于居民或家庭金融調查的抽樣設計中,對于富裕群體都給予了特別關注。原因在于:家庭財富分布存在不均衡現象,導致分位點較高的家庭占社會總財富的比例更高;資產配置結構有其特性,由于財富分布是傾斜的,因而某些類型的資產只有一小部分頂端家庭擁有。從理論研究角度看,等概率抽樣由于每一單元都有已知的被選概率,對于偏態分布的總體并不適用,而不等概率抽樣通過調整入樣概率來平衡樣本分布,因此對于具有群結構的總體而言,在初級抽樣單元層次上的不等概率抽樣比等概率抽樣對總體有更好的代表性。
從實踐操作看,SCF和參與HFCS的部分國家采用了不同策略對富裕家庭進行補充抽樣,抽樣設計是先通過技術手段構建針對富裕家庭的抽樣框,再按照一定方式進行補充抽樣。如SCF的額外樣本框稱為列表樣本,該方式下的抽樣是基于美國稅務局收入統計司(SOI)從個人所得稅申報表②中提取的關于個人收入稅收的信息文件,該份文件覆蓋范圍是包括高收入群體在內的極有可能成為富人的納稅者,因而將其作為富裕家庭的樣本框是適當的。SCF建立了從應稅收入到財富的映射函數來測算所有稅務申報人的“財富指數”,再通過“財富指數”的百分比分布將抽樣地區的樣本劃分為七個層次,其中頂層抽樣階層(第4、5、6、7層)覆蓋了前1%富裕的樣本,接下來每層再根據收入和年齡進行次分層的PPS抽樣設計。HFCS開展的兩輪調查中有相當比例的國家對富裕家庭進行了補充抽樣。各國雖在抽樣標準的選擇上差別很大,但都高度依賴于現存的數據,主要以區域一級的收入和(或)財產價格信息為基礎(見表1)。
(三)采用技術手段事后修正數據提高樣本代表性。
一是針對無回答現象,采用插補技術估算缺失值或后分層方法調整調查無響應。如SCF依據外部渠道的可得數據構建模型來補充項目無回答的內容。具體做法是對丟失的數據進行多次重復估算,以估計這種類型的無響應導致的不確定性,再采取插值法加以彌補。德國家庭金融調查(PHF)通過重復提取數據條件分布的估值來模擬單個插補值,估算所有主要缺失變量的觀測值。SHED則選取年齡、性別、人種、族裔等指標作為權重調整變量,通過后分層方法來調整由于研究特定樣本而產生的調查無響應以及非覆蓋或欠采樣和過采樣。
二是根據數據使用需求來調整樣本權重提升估計值精度。如消費者信用面板數據庫若僅針對被抽樣的個體消費者進行分析,則不需要引入權重調整,因為該個體樣本組是代表目標人群5%的隨機樣本。但以家庭為單位進行分析時,考慮到采用的抽樣方法可能對人口多的家庭進行過度抽樣的事實,就需要使用權重保證樣本家庭能夠代表一國的目標人群家庭,并獲得對人口特征的無偏估計,家庭層面分析時的權重等于目標群中給定家庭被包括在樣本中的概率的倒數。
三、問卷題目的設置
(一)保持問卷核心內容穩定,提高數據的縱向可比性
SCF問卷會隨著每次調查不斷修改,新問題不斷增加,但自1989年以來,調查問卷的核心內容變化不大。2016年的調查對教育程度、教育貸款和支付方式部分進行了修訂,并新增關于受訪者財務知識、父母教育程度和假設不同財務狀況下的決策問題,新增問題的設置盡力確保數據在一段時間內具有最大程度的可比性。日本央行的民意調查自1993年啟動以來,問卷在宏觀經濟形勢看法、家庭經濟狀況感受、物價走勢判斷和央行政策信譽四大板塊的結構一直保持穩定,從而形成了極具研究價值的調查時序數據。
(二)適當引入定量問題提供有價值的信息/觀點
過去習慣使用的定性問題(“非常滿意”“基本滿意”“可以接受”“不滿意”)雖易于理解,但具有選項設計粗略、缺乏對不確定性的精確衡量、缺少個體之間和個體內部可比性的缺陷。為提高估計值的精度,SCE引入了關于概率預期的定量問題。定量問題大致分為三類:對雙邊結果產生預期的問題(如股市在12個月內增長的可能性);對未來持續結果的逐點期望問題(如未來12個月的通貨膨脹率);引起受訪者對未來連續結果預測的概率密度問題。這三類問題能夠對受訪者整體的不確定變化性提供一種量化方法:點預測能夠獲得具體的調查結果,這對宏觀決策部門的參考意義重大;對未來持續事件的雙邊結果概率預期和密度預測則為不確定性提供了更清晰全面的度量維度。
四、調查項目的組織開展
(一)調查訪談方式高度契合調查項目需求
調查訪談方式是影響數據質量重要的方面,國外居民調查主要采取面訪和網絡在線調查兩種方式。對于問卷設置較為復雜、非高頻的調查項目,普遍采取的是目前公認質量控制較好的計算機輔助面訪(CAPI)方式,如SCF、HFCS和PHF第一階段等。專業的面訪官能有效減少單元無回答和項目無回答現象發生、降低受訪者理解偏誤、同時在當面交流過程中獲取更多調查信息。而計算機程序系統的實時校驗功能則最大程度保證了一手數據的準確性。因此,CAPI從根本上滿足了大樣本復雜問卷調查對樣本配合性、操作規范性和數據真實性的要求。
對于高頻調查或是出于持續跟蹤樣本的需要,調查主要依靠網絡進行。如SHED是完全網絡在線進行的。除成本優勢外,在線采訪可以相對輕松地持續追蹤同一受訪者,此外網絡調查能夠保存受訪者的歷史數據信息,通過以往的填答情況自動跳過不相關問題,減輕受訪者的負擔。SCE作為月度調查項目,采用的是美國需求研究所開發的互聯網平臺開展調查,平臺借助視覺輔助工具等手段方便受訪者理解和填答特定問題。
(二)提高調查公信力和知曉度、提升訪員專業性、爭取受訪者應答是降低拒答率的主要舉措
一是多舉措提高調查公信力和知曉度。如韓國家庭金融福利調查在開展期間,政府官網上會出現動態標語,基層政府部門的辦公大樓懸掛橫幅,電子屏幕上展現宣傳標語,并在調查區發放傳單。SCF在調查啟動階段,會通過郵件向受訪者簡要介紹調查項目,同時附上聯儲主席簽署的邀請函。在開展HFCS期間,意大利央行會首先向受訪家庭發送預先通知信,告知調查的目的和重要性;同時提供央行工作人員的聯系方式,解答受訪家庭疑慮。西班牙家庭金融調查在邀請郵件中同時提供了確認調查合法性的網站和電話號碼。
二是確保訪員的專業水準。如SCF的數據收集工作由社會專業調查機構NORC執行;參與HFCS的20個國家中,訪員是政府統計部門職員或指定的專業外部調查機構工作人員。在各項調查中,對訪員的專業化培訓均是調查執行前必要的步驟。
三是盡力爭取受訪者應答。如SCF將訪問過程分為三個階段,第一階段,訪員當面拜訪受訪家庭,通過介紹項目意義、提供獎金激勵等方式獲取受訪許可;若未獲得認同,在第二階段,仍通過當面拜訪或郵件方式,采取增加獎金額等手段,再次爭取受訪同意;在第三階段,允許訪員采取任何認為有效的方法獲得調查同意,這一階段對受訪者完成調查的激勵也從基礎的50美金提升到300美金的上限。PHF對于第一階段未完成調查的家庭,6個月后啟動第二階段,在第二階段要求訪員每周至少要與每個待調查家庭聯系一次,同時對在該階段完成調查的訪員提供額外獎金。奧地利的家庭金融調查中,訪員在邀請函發出后,需至少兩次實地拜訪樣本家庭,其中至少有一次是在周末。
(三)對無回答樣本的替換較為謹慎
在抽樣理論中,無回答現象會對概率樣本造成損害,從而影響調查質量。因此對于單元無回答現象,各調查項目均要求了嚴格的換樣步驟以減少無應答誤差。如HCFS為降低無回答造成的偏差,會嘗試再次聯系拒訪家庭。西班牙家庭金融調查為樣本中的每個原始家庭提供最多4個替換家庭,替代家庭必須與樣本家庭屬于相同的財富階層,且在抽樣框中緊挨抽樣家庭前后兩位,同時替換家庭地址與原始樣本家庭的距離不能太遠。意大利央行對于調查過程中無法聯系到的家庭由同一城市中隨機選擇的其他家庭替代,但樣本替換有嚴格制度來規定何時可以更換,并指定要調查的新家庭。
五、調查數據成果的運用及價值
(一)靈活、實時的數據來源,為宏觀政策決策提供了重要信息保障
宏觀經濟數據能夠翔實記錄國民經濟發展狀況,但數據生產流程長、耗時多、時效慢。調查工作憑借組織實施的靈活性和數據發布的時效性,為經濟前景評估和政策決策提供了一手高效的信息支撐。如新冠疫情反復導致投資、就業和消費等指標出現較大波動,微觀主體對經濟前景的不確定性作為解釋經濟邊際變化的重要補充指標,受到了政策制定者的關注。基于此,歐盟委員會在其月度商業和消費者經濟調查(BCS)中,通過在問卷中增加受訪者對經濟運行和家庭收入狀況的預測難度問題,合成了經濟不確定性指數,此類指數較傳統的離散度指標不僅更客觀合理地反映了經濟走勢邊際變化,還能揭示結構性的分類信息,為宏觀部門出臺前瞻性的政策舉措提供了極強的信息保障。
(二)豐富學術研究視角,拓寬了學術研究的廣度和深度
微觀調查數據庫數據條目多、指標種類豐富、結構性特征多樣,與宏觀數據相比,為學術探究提供的視角更廣泛。如SCE通過收集居民對各類經濟生活預期和決策的數據,不僅填補了家庭部門預期和行為之間關聯性數據的空白,也為政策預期管理提供了重要信息參考。因為只有準確掌握居民預期的形成路徑和機理,才能有效監測并做好預期管理。學術界借助SCE搜集的消費者對某些具有連續結果事件(如未來通貨膨脹、收入和房價)的主觀概率分布數據,構建中心趨勢(如密度平均值或中值)、不確定性和感知尾部風險的個體度量(如極端積極或消極結果的概率)等一系列指標,來刻畫預期與行為之間的聯系,為宏觀決策部門做好政策預期管理、提高政策效能提供了寶貴的智力支撐。再如,美聯儲在其網站上公布了一系列基于歷年SCF數據所撰寫的工作論文,主題涵蓋社會居民財富分配狀況、稅收制度的再分配效應、富裕人群收入和財富積累途徑等多個領域,相關研究成果為促進經濟社會發展提供了極具價值的微觀視角。
六、啟示
(一)積極發揮微觀居民調查數據在深化學術研究和服務宏觀決策方面的作用
住戶部門既是消費者、又是投資者、也是社會資金的主要供給者之一,因此與微觀居民個體相關的數據在學術探索、政策管理和社會治理等方面意義重大。居民調查數據的指標體系豐富多樣,既拓展了數據視角,又憑借時效性發揮了重要的信息保障作用。
一是居民調查項目作為重要的基礎性資源,能夠填補居民或家庭的微觀數據空白。來自調查的一手數據蘊含廣泛信息,具有重要的經濟價值、社會價值和學術研究價值。特別是在當前共同富裕的戰略背景下,與居民個體息息相關的民生數據對于實施路徑探索、政策效果評估都發揮著極強的信息參考價值。
二是調查數據憑借深入刻畫總體內在結構性趨勢的優勢,與宏觀數據有機結合,能夠全面真實地揭示經濟社會發展的趨勢和規律。單一的宏觀數據并不能客觀反映各子群體的真實情況,借助調查觸角的延展性,宏、微觀相結合的數據在對總體以及各子群體上的畫像,以及把握形勢變化上將更加精準有效。
(二)調查設計科學合理,夯實數據質量,提升數據研究價值
一是抽樣設計科學,確保樣本代表性。抽樣方法上,合理的分層通過實現層間方差盡可能大、層內方差盡可能小,從而能夠保證各層抽到的樣本單位對本層具有較好代表性。考慮到居民調查目標多、總體單位差異大,因此多目標分層抽樣技術被普遍采用;在各層間的抽樣中,由于不同單元在總體中所占地位不一致,PPS系統抽樣在實踐中有著廣泛的應用。抽樣方式上,初級抽樣單元的廣泛性決定了是否需要針對兩端人群補充抽樣。若調查設計的單一抽樣框未能基本實現對目標總體完整覆蓋、或是總體具有明顯偏態分布特征,則需要采取額外抽樣方式補充兩端小規模群體的樣本,以保證樣本結構與總體一致。
二是問卷設置合理,聚焦調查目的。問題選擇上,緊扣調查意義設置與研究主題密切相關的題目;同時在保持核心板塊穩定的前提下,通過靈活增加新問題增強數據靶向聚焦能力。問卷測試上,充分借鑒認知心理測試實驗論證、專家審查評估和田野試訪實踐反饋等多種形式,不斷完善問卷以增強受訪者填答的精確性,盡可能減少因受訪者未能正確理解問題、疊縮效應等原因產生的非抽樣誤差。
三是調查實施有效,避免執行偏差。通過精細化流程控制提升調查質量,減少因無法從樣本單元獲取調查信息引起的無回答誤差、或是由受訪者或測量手段所引起的計量誤差。
四是借助技術手段提升數據準確性。利用插補技術修正無回答現象對樣本質量的損害,引入權重提高估計值的精度。■
(責任編輯:張恩娟)
參考文獻:
[1]Arthur B Kennickell.The Good Shepherd: Sample Design and Control for Wealth Measurement in the Survey of Consumer Finances[EB/OL].[2021-12-03].https://www.federalreserve.gov/econresdata/scf/files/samplingperugia052.pdf.
[2]Arthur B Kennickell.Wealth Measurement in the Survey of Consumer Finances: Methodology and Directions for Future Research[EB/OL].[2021-12-05].http://www.federalreserve.gov/econres/scf_workingpapers.htm.
[3]Bank of England.Bank of England/Kantar Inflation Attitudes Survey[EB/OL].[2022-01-12].http://www.bankofengland.co.uk/inflation-attitudes-survey/2020/november-2020.
[4]Bank of Japan.Results of the 88th Opinion Survey on the General Public’s Views and Behavior[EB/OL].[2022-01-12].http://www.boj.or.jp/en/research/o_survey/data/ishiki2201.pdf.
[5]De Heer W,De leeuw E.Trends in household survey nonresponse:A longitudinal and international comparison[J].Survey Nonresponse,2002(41):41-54.
[6]European Central Bank.The Household Finance and Consumption Survey:methodological report for the second wave[EB/OL].[2020-06-05].http://sdw.ecb.europa.eu/reports.do?node=1000004952.
[7]Gosselin M Khan.A Survey of Consumer Expectations for Canada[J].Bank of Canada Review,2015(8):14-23.
[8]Harkness J A,Braun M,Edwards B.Comparative Survey Methodology[J].Survey methods in multinational, multiregional and multicultural contexts,2010(5):1-16.
[9]Iannacchione V G,Staab J M,Redden D T.Evaluating the use of residential mailing addresses in a metropolitan household survey[J].Public Opinion Quarterly,2003(2):202-210.
[10]Jesse Bricker,Richard Windle.Contacting Strategies and Increased Incentives during the Field Period:Evidence from the SCF[EB/OL].[2021-12-22].http://www.federalreserve.gov/econres/scf_workingpapers.htm.
[11]Natalie Shlomo,Chris Skinner.Barry Schouten Estimation of an indicator of the representativeness of survey response[J].Journal of Statistical Planning and Inference,2011(1):142-145.
[12]Olivier Armantier,Giorgio Tbpa,Wilbert van der Klaauw,Basit Zafar.An Overview of the Survey of Consumer Expectations[J].FRBNY Economic Policy Review,2017(12):51-72.
[13]PA Glasow.Fundamentals of survey research methodology[J].Retrieved January,2005(1):47-64.
[14]Pradeep Chintagunta,Ekaterini Kyriazidou,Josef Perktold.Panel data analysis of household brand choices[J].Journal of Econometrics,2011(1):103-108.
[15]Shelley Andrew,Horner Keith.Questionnaire surveys-source of error and implications for design,reporting and appraisal[J].British Dental Journal,2021(4):251-258.