孫鈴 辛自強



摘 要 財經知識是公民日常生活中處理好財經事務的必備素養,對公民的財經知識水平進行有效評估是財經素養研究和教育的基礎性工作。本研究通過對現有關于財經素養測評的文獻資料進行梳理,并結合專家訪談,提出我國公民應該具備財經視野、收支平衡、財富增長、風險防范這四個內容領域的財經知識。以這一概念框架為基礎,針對每個領域編制財經知識題目,經過兩輪施測和一輪專家評估,形成了一個由20個選擇題組成的財經知識測驗。最終版測驗正式施測結果表明:所編制的中國公民財經知識測驗的難度適中,項目區分度較好,內部一致性信度、重測信度、結構效度和效標關聯效度均符合心理測量學的要求,是一項高質量的財經知識評估工具。
關鍵詞 財經知識;財經素養;測驗;信度;效度
分類號 B84-05
DOI: 10.16842/j.cnki.issn2095-5588.2020.12.002
1 前言
隨著經濟社會的發展和個人財富的積累,公民接觸到的財經事務越來越多,越來越復雜。在日常生活中,無論是正確理解財經信息,還是恰當處理涉及金錢的事務,都離不開財經知識。公民的財經知識水平不僅關系到個人財經福祉,也影響著經濟社會的平穩運行。財經知識(financial knowledge)是財經素養的一個重要組成成分,它是指公民通過教育或者經驗了解和掌握的,涉及財經領域的,與個人生活息息相關的重要概念和原理(Huston, 2010)。了解公民的財經知識水平,是對其財經行為做出合理預測與解釋的基礎。
財經素養研究和教育領域歷來重視對財經知識的評價,有些研究甚至直接用財經知識的掌握程度來代表財經素養(Hastings, Madrian, & Skimmyhorn, 2013; Knoll & Houts, 2012)。但是,財經知識所涵蓋的內容十分廣泛,現有研究對其內涵和外延并沒有形成統一認識。我們對國內外財經知識領域的文獻進行梳理,從個人財經活動目標或功能的角度出發提出了財經知識的四領域模型(孫鈴, 宋曉星, 周戰強, 孟祥軼, 辛自強, 2018)。財經素養本質上是個體的心理特征,財經知識作為財經素養的重要成分,并非指經濟學、財政學、金融學等方面的純專業知識,而是指個體在各種具體財經活動中可能需要的知識。這些知識可以來自專業學習,但更多地出自日常經驗,尤其是財經活動經驗。基于這一思路我們區分了四類財經知識,其中三個方面直接對應于旨在實現特定功能或目標的財經活動。第一,收支平衡知識。為了維持日常生活需求,人們應該做到基本的收支平衡,要確保這一活動目標就需要涉及到有關收入、借貸、消費方面的財經知識。第二,財富增長知識。在現代社會,財富的獲取和積累不僅依賴于直接的勞動回報,還可以通過利用金融途徑實現財富增長,這一類活動主要涉及投資理財的相關知識,包括儲蓄、股票、基金、債券等。第三,風險防范知識。無論是維持良好的日常生活,還是實現財富增長,都需要有效防范生活中的風險和各類金融活動中的風險,這就需要個體擁有保險和金融安全方面的知識。第四,財經視野知識。個體財經活動的成敗得失,總是會受到宏觀經濟形勢的影響,也取決于人們對基本經濟規律的認識,因此,個體對于基本經濟規律和宏觀經濟政策的理解,雖然不直接對應于具體財經活動,但卻對各種財經決策有普遍性的、彌散性的影響。借鑒PISA項目的概念(OECD, 2013),我們將這方面的知識命名為“財經視野”知識??傊?,財經知識就是個體參與財經活動、滿足個人財務目標所需要的知識,這些知識包括反映一般性財經視野的知識,也包括以收支平衡、財富增長和風險防范為目標的各類財經活動所需要的專門知識。本研究將以財經知識的四領域模型為基礎,編制涵蓋財經視野、收支平衡、財富增長和風險防范四方面知識的測評工具。
財經知識是個體在財經活動和決策行為中所使用的知識,財經知識水平會直接影響財經活動和行為的結果,預測個體的財經福祉(financial well-being),因此,對財經福祉的預測力可以作為檢驗財經知識測驗效標關聯效度的指標。美國消費者金融保護局(Consumer Financial Protection Bureau, CFPB, 2017)提出的財經福祉定義和測量工具已得到了廣泛認可和使用。CFPB的財經福祉理論主張從兩個維度來評價財經福祉:一個是時間的維度,財經福祉既包括滿足當下的財經需求也涉及滿足未來的財經需求;另一個是心理需求的維度,包含安全感和自由選擇兩個方面,較高的財經福祉既體現為滿足基本的安全需求,不會被財務狀況所困,還體現為讓個體有自由選擇的能力,能夠享受生活。本研究正式施測時將采用CFPB的財經福祉量表作為檢驗財經知識測驗有效性的效標工具。
本研究的目的是在上述財經知識內容框架基礎上,編制適用于我國公民的財經知識測驗,并通過大樣本調查與專家評估相結合的方法,考察測驗的難度、區分度、信度、效度指標,評估測驗的可靠和有效性。該測驗的編制可以為今后的財經素養研究、教育和培訓活動提供標準化的評估工具。
2 財經知識測驗的編制
2.1 測驗的初步編制
根據對財經知識內容框架的理論構想,我們結合專家訪談和已有財經素養或財經知識評價工具中的題目,編制了48道財經知識測驗題目。這些題目具體包括:第一,財經視野知識11題,考察對基本財經概念和原理以及常識的理解;第二,收支平衡知識11題,考察個體為實現收支平衡保證自身不會陷入財務危機所需要具備的知識,主要是有關收入、消費和借貸方面的知識;第三,財富增長知識17題,考察為了實現財富增長所需要具備的知識,主要是儲蓄、債券、股票和基金知識;第四,風險防范知識9題,考察應對未來不確定性和金融風險所需要的財經知識,包括保險、養老和金融安全方面的問題。在這48個題目中包含了Lusardi等人編制的經典財經知識問卷中的全部16個題目(Rooij, Lusardi, & Alessie, 2011),并盡可能保留了原題的表述,以便于將新編題目與Lusardi問卷題目的測試結果進行比較。Lusardi問卷的題目多集中在財富增長領域,因此在初測版測驗中,財富增長領域的題目數量偏多。本測驗的每個題目均為客觀的四選一單項選擇題,有唯一正確答案,選擇正確得1分,錯誤計0分,將所有題目得分相加得到財經知識總分,得分越高,代表對財經知識的掌握程度越好。
2.2 測驗的試測和修訂
利用網絡調查平臺隨機抽取被試,初步探討財經知識測驗的可靠性和有效性。共發放網絡測驗520份,根據答題時間超過平均時間兩個標準差的原則剔除無效作答后,共回收有效測驗498份,有效率為95.77%。被試中男性215人,女性283人;年齡在20~71歲之間,平均年齡31.79,標準差7.15。
我們通過項目分析和結構效度分析對題項質量進行評估,同時分析了新編題目與Lusardi等人所使用題目的相關等指標。
(1)項目分析。通過單題分數與總分數的相關,確定是否所有題目都適合保留在財經知識測驗中。結果表明,第6題與總分相關不顯著,剔除該題;其余47個題項分數與總分的相關均達到顯著水平,相關系數在0.14~0.58之間。
將這47個題項得分相加,形成新的財經知識總分,進一步分析題項難度和區分度。以每個題項的通過率作為該題項的難度指標,通過率越高意味著該題項的難度越低。題項的通過率在29%~89%之間,整體測驗平均的通過率(正確率)為63%,測驗難度適中。將所有被試按財經知識總分從高到低排序,得分前27%者(共134人)為高分組,后27%者(共134人)為低分組,計算兩組被試在每個題項上各自的通過率P高與P低。然后計算每個題項的區分度指標,區分度=P高-P低,代表了高分組和低分組通過率的差異,差異越大說明題目的區分度越高。區分度在0.4以上代表題目質量非常優良,0.30~0.39之間代表良好,0.20~0.29之間代表尚可,0.20以下表明題目質量低劣,必須淘汰。據此刪除區分度在0.20以下的題項3個,剩余題項44個。
(2)結構效度分析。采用驗證性因素分析考察財經知識測驗(44題)的結構效度。首先根據題目編制的理論構想建構初始測驗模型。模型的擬合指數需要滿足以下標準,χ2/df<5,RMSEA<0.05,CFI>0.90,TLI>0.90。從初始模型的擬合數據來看,模型接近但是未達到可接受的水平,CFI、TLI指標不理想(表1)。
根據驗證性因素分析提供的修正指數,精簡測驗題項。首先,考慮每個題項在其所在維度上的因素載荷,刪除載荷不顯著的項目1項。其次,根據數據分析得到的修正指數,刪除2道多重載荷的題目。最后,刪除2道內容有部分重復的題目。精簡后剩余題目39項,再次進行驗證性因素分析,結果表明,修正后的測驗其模型對數據的擬合程度可以接受(表1)。
(3)效標關聯效度。根據項目分析和驗證性因素分析刪除9個題項后,財經知識測驗還保留了39個題項,這其中包括了Lusardi等人的財經知識問卷的16個題項,我們統計了新編的23題的總分與目前使用度最高的Lusardi等人的問卷題目總分的相關,二者相關系數為0.69,這說明本研究新編的題目質量較高,具有良好的效標關聯效度。
(4)信度分析。包含39個題項的總測驗的克隆巴赫 α系數為0.85,說明其內部一致性信度良好,符合測量學要求。四個內容領域的克隆巴赫 α系數分別為0.53、0.67、0.64、0.66,各領域題項的內部一致性信度大體可以接受。
2.3 測驗項目的專家評估和修訂
經過第一輪試測,初步形成了信效度較為良好的包括39個題項的財經知識測驗。課題組五位專家對每個題項又逐一進行了討論和評估,結合題項的內容和初測的測量學指標對題項做了進一步篩選。初測中為了檢驗新編題目的效標關聯效度,完整使用了Lusardi等編制的16個財經知識題目,但是這些題目主要集中考察理財投資知識(類似于本研究的財富增長領域的知識),并且有一些題目內容不完全適合中國國情,考慮到總體的題量不宜過多,各領域的題量要盡可能均衡,因此大量刪減了這部分題目,篩選之后的測驗保留了29個題項。
財經知識測驗作為一種知識測驗,其內容效度非常重要,測試題目的知識點與問題情景應該包括公民財經活動典型的、重要的方面。因此,本研究進一步采用專家評估的方式,檢驗測驗題目的內容質量。我們將29個測驗題目發送給15位熟悉財經素養領域的學術或行業專家來評估內容效度,其中5位為大學教授,分別從事經濟、金融和保險領域的教學科研工作,另外10位是來自商業銀行、政策銀行、保險公司、證券公司和金融科技公司的行業專家。首先,向各位外請專家解釋財經知識測驗四個內容領域的理論構想;接下來,請15位專家采用李克特5點量尺對每一個題項是否適合用于評估相應領域的財經知識進行評價(5=適合,4=較適合,3=一般,2=較不適合,1=不適合),并對認為不適合的題目給出書面的意見;最后,再請各位專家對測驗的整體結構和內容作出定性的評價。15位專家均給出了定性評價,他們都認為財經知識測驗四個內容領域的結構劃分是合理的,能夠反映財經知識的主要內容;有13位專家逐一對題項給出了評分(另外2位專家沒有打分),我們刪除了專家評分平均值在4分以下的5個題項,最后保留24個得到專家認可的題項,保留的題項均在4分以上,表示較適合或適合。
最后,課題組五位專家再次綜合初次試測和外請專家評估的結果逐一分析了這24個質量較好的題目,考慮到測驗的長度和各維度題目數量之間的均衡,最終從24個題目中挑選了區分度和專家評價較高的20個題目(每個維度5題),形成最終版本的財經知識測驗。
3 財經知識測驗的正式施測和測量學指標分析
3.1 被試
正式測驗的施測樣本為574人,來自全國16個省市自治區。其中,男性275人,女性296人,3人未填寫性別信息;被試年齡在17至79歲之間,平均年齡為38.58歲(SD=12.51)。城鎮戶口397人,農村戶口176人,1人戶口信息缺失;學歷分布為小學及以下學歷17人,初中104人,高中(及中專、技校)109人,大學???8人,大學本科210人,研究生及以上46人;個人月平均收入分布為2000元以下101人、2000~4999元249人、5000~9999元155人、10000~19999元53人、20000元以上15人,1人收入信息缺失。調查時間為2020年8月中上旬,由經過訓練的心理學專業本科生和研究生26人作為主試,在自己家鄉進行方便取樣,并要求他們注意被試性別、年齡、城鄉戶籍等人口學特征的平衡或兼顧,調查為一對一的當面調查。
此外,為考察測驗的重測信度,選取北京某大學的164名學生(本科生83人,研究生81人)為被試,其中男性占比33%,城鎮戶口占比67%,所有被試的平均年齡為21.86±2.39歲。在2020年9月到10月之間對其進行兩次測查,時間間隔為3周。
3.2 測量工具
(1)財經知識測驗。采用最終版的財經知識測驗,包含20個四擇一選擇題,分別考察了財經視野、收支平衡、財富增長和風險防范四個方面的財經知識,每個方面5題,每答對1題計1分,滿分20分,得分越高代表財經知識掌握情況越好。
(2)財經福祉量表。選用美國消費者金融保護局(CFPB, 2017)編制的財經福祉量表(Financial Well-being Scale)測量效標變量財經福祉。該量表共10個項目,如“我有錢支付意外的花費”“我的財務狀況入不敷出”,它采用5點量尺作答,1代表完全不符合,5代表完全符合。其中有6個項目需要反向計分,然后計算所有項目的均分,分值越高代表財經福祉越好。本研究中該量表的內部一致性信度系數為0.76。
3.3 研究結果
(1)題項與測驗總分的相關。將所有題項得分相加得到財經知識測驗20題的總分,然后計算每個題目得分與總分的相關(表2), 所有相關系數在0.25~0.59之間, 均達到顯著水平(p<0.001),這說明所有題項評估的內容一致性較高。將所有題項得分相加獲得財經知識總分的做法比較合理,總分能夠反映作答者對財經知識掌握的情況。
(2)題項與維度總分的相關。類似地,計算題項與各自維度(每個維度有5道題)總分的相關(表2),所有相關系數在0.48~0.64之間,均達到顯著水平(p<0.001),這說明每個題項評估的內容與維度的一致性較高,適合計算維度總分來代表被試對該領域知識掌握的情況。
(3)難度和區分度。計算每個題項的難度和區分度(表2)的方法與初測結果的計算方法相同。該測驗題項的通過率在29%到87%之間,平均通過率(正確率)為63%,這表明該測驗的難度適中。所有題項的區分度在0.31~0.64之間,表明測驗題項的區分度良好,能夠區分不同財經知識水被試的表現。
(4)結構效度。采用驗證性因素分析考察財經知識測驗的結構效度,模型的擬合指數為χ2/df=1.76,CFI=0.89,TLI=0.87,RMSEA=0.036,這說明財經知識四領域結構模型對數據的擬合程度達到了可接受水平。然而,需要指出的是,這一結果只有粗略的參照意義,因為有些測驗項目在各自“因素”(嚴格講算不上“因素”,只是知識的內容領域)上的載荷并不高,這可能是因為知識類測驗各題項的相關模式非常容易受到題目難度的干擾而未必具有很強的領域性(即未必受知識領域影響),導致題目的因素載荷不穩定,而且容易為多個因素同時解釋。
在這種情況下,我們考察了各維度得分及測驗總分之間的相關系數。表3顯示,四個維度的相關系數集中在0.40~0.48之間,均為中等相關;四個維度得分與測驗總分的相關系數集中在0.74~0.79之間,均為高相關。這些結果說明各維度之間的關聯度較為均衡,它們與測驗總分的關聯度(即對總分的貢獻度)也較為均衡,四個維度都不可或缺,但也不能相互替代。也就是說,四領域結構模型具有合理性,測驗有良好的結構效度。
(5)效標關聯效度。采用財經福祉量表得分作為效標,檢驗財經知識能否預測財經福祉,結果表明,二者相關為0.27(p<0.001),換言之,財經知識能解釋財經福祉7.51%(即相關系數0.274的平方)的變異,說明財經知識測驗有較好的效標關聯效度。
(6)信度。財經知識測驗的克隆巴赫α系數為0.76,分半信度為0.75,間隔三周的重測相關系數為0.68。總體來看,該測驗的信度良好。
4 討論
本研究以財經知識四領域結構(財經視野知識、收支平衡知識、財富增長知識和風險防范知識)為基礎編制測驗題項,經過初步試測、專家評估和正式測量三個階段,開發出一套由20個四擇一選擇題組成的中國公民財經知識測驗。總體來看,該測驗難度適中,區分度良好,內容結構獲得了專家認可,構想效度和效標關聯效度較好,具有較高的內部一致性信度和重測信度。因此,該測驗能夠可靠有效地評估我國公民的財經知識水平。
4.1 中國公民財經知識測驗的特點
第一,本測驗有清晰的理論框架。在財經知識的內容結構方面,以往的財經知識測驗中所包含的知識點有很大的重疊度,有關儲蓄、股票、基金的知識幾乎在所有財經知識測驗中都有涉及(余文建, 武岳, 華國斌, 2017; Chen, & Volpe, 1998; Knoll, & Houts, 2012; Rooij, Lusardi, & Alessie, 2011),但是幾乎所有研究都沒有對財經知識的內容領域進行清晰的結構分析,也很少基于某種理論框架自上而下地建構測量工具,致使測驗的編制缺乏理論導向,似乎是隨意湊了一些題目而已。與以往思路不同,本研究以財經知識四領域結構(孫鈴等, 2018)為理論框架,從個人財經活動的目標或功能出發,圍繞財經視野、收支平衡、財富增長和風險防范四個方面的知識,有目的地編制測驗題項。無論是專家評估還是結構效度分析的結果都說明這一理論模型具有合理性,表明測驗具有較好的結構效度。而且,與已有財經知識測驗相比,本測驗涵蓋的知識內容更為廣泛,特別是增加了體現個體財經視野的知識內容,結合我國社會現實考察了公民對宏觀經濟概念和基本經濟理論的理解水平。
第二,本測驗有良好的心理測量學特征。以往的財經知識測驗幾乎都是由經濟學或金融學領域的專家開發的,他們大多并不顧及,也不在意對測驗的心理測量學指標的考察,難以保證測量結果的可靠性和有效性(孫鈴等, 2018)。本研究編制的中國公民財經知識測驗遵循了嚴格的測驗開發程序,系統考察了各項測量學指標,能夠確保工具的可靠性和有效性,提高了測量的準確性和科學性。
The Development of the Financial Knowledge Test for Chinese Citizens
SUN Ling; XIN Ziqiang
(School of Sociology and Psychology, Central University of Finance and Economics, Beijing 100081, China)
Abstract
Financial knowledge is a necessary aspect for citizens to handle financial matters in their daily lives. An effective assessment of citizens financial knowledge is a fundamental work in the research and education of financial literacy. On the base of the existing literature and expert interviews, this study proposed that Chinese citizens should have financial knowledge in four content areas: financial vision, balance of payments, wealth growth, and risk prevention. Financial knowledge questions were compiled for each of these areas. After two rounds of administering the test and one round of expert assessment, a financial knowledge test consisting of 20 multiple-choice questions was developed. The final version of the test had moderate difficulty, good item differentiation, acceptable reliability, and fine validity. The test met psychometric requirements and was a high-quality financial knowledge assessment tool.
Key words:financial knowledge; financial literacy; test; reliability; validity