楊基瑜 徐欣蕾 權夢婭 柏 毅
(東南大學 學習科學研究中心,江蘇 南京 210096)
目前國際上普遍認為,科學素養(Scientific Literacy)是指運用科學知識,確定問題和作出具有證據的結論,以便對自然世界和通過人類活動對自然世界的改變進行理解和作出決定的能力[1]。而對科學素養的研究,最終還是要落實到科學素養的評測,所以科學素養的操作性定義就顯得尤為重要。國際上關于科學素養的操作性定義歷來就有多種說法,但普遍將科學素養分為三個維度。其中,影響較大、較為科學的有:“米勒”界定(科學素養的三個維度即科學知識、科學方法、科學意識),PISA組織的定義(科學方法和技能、科學概念和內容、科學語境),我國國務院頒布的《全民科學素質行動計劃綱要》(科學知識、科學能力、科學意識)。[2]而國際上有關科學素養評測的組織主要有:The National Assessment of Educational Progress(NAEP),The Programme International Student Assessment(PISA),The Trends in International Mathematics and Science Study(TIMSS)和National Assessment Programme(NAP),等等。
我們對學生科學素養及其評測體系進行國際比較研究的主要目的是對學生個人的創新意識培養及國家建立合理的科學素養評測體系提出合理建議。本文旨在對科學素養的維度及以上提及的四大評測組織的評測進行比較研究,按邏輯順序組織材料,所引文獻屬于教育學范疇,起于1966年,止于2013年,對適于我國的科學素養測評體系提出建議。
國際科學教育界普遍認為,在義務教育階段,科學素養教育應該是學校理科教育的首要目標。深入研究學生科學素養的操作性定義,有助于科學素質教育的落實。不僅如此,從長遠角度看,我們生活在高科技時代,與科技密不可分,如果不具備一定的科學素養,輕者降低其社會生存能力,重者甚至無法立足于社會。而對于一個國家,這種危害性影響甚至還會放大,影響社會發展。所以,學生科學素養的研究有著極其重要的意義,有了學生科學素養的評測體系,我們不僅可以提高學生的創新意識,還可以對教學改革提出建議,探索更適合科學素養培養的教育方式。
科學素養的維度即科學素養的操作性定義有多種。1966年,Pella和他的合作者系統地挑選了出版時間為1946年到1964年之間的100種報刊文章,從中檢索各種與科學素養有關主題的出現頻率。經統計發現,一個具有科學素養的人應了解以下這些方面的內容:(1)科學和社會的相互關系;(2)知道科學家工作的倫理原則;(3)科學的本質,等等。
而Showalter在1974年總結了50年代末至70年代初有關科學素養的文獻后,認為具有科學素養的人必須達到以下七個條件(seven dimensions):(1)明白科學知識的本質;(2)在和環境交流時,能準確運用合適的科學概念、原理、定律和理論;(3)采用科學的方法解決問題,做出決策,增進其對世界的了解;(4)和世界打交道的方式和科學原則是一致的;(5)明白并接受科學、技術和社會之間的相關性;(6)對世界有更豐富、生動和正面的看法;(7)具有許多和科學技術密切相關的實用技能。二人都認為科學素養是多維度概念。[3-4]
最早對科學素養做出定義并進行度量的是美國,素養促進中心主任喬恩·米勒博士(Dr.Jon Miller)提出了“米勒”界定[5],即認為科學素養具有三個維度:科學知識、科學方法、科學意識。
而目前國內外對學生科學素養維度的研究,大體見下表[2][6]。

組織或研究者 科學素養的維度J.D.米勒 科學知識、科學方法、科學意識OECD/PISA 科學方法和技能、科學概念和內容、科學語境J.杜蘭特 理解基本科學觀點、理解科學方法、理解科學研究機構的功能《全民科學素質行動計劃綱要》 科學知識、科學能力、科學意識
其中,OECD/PISA(the Organization for Economic Cooperation and Development/the Program for International Student Assessment,OECD/PISA)為世界經濟合作與發展組織開發的國際學生測評項目;J.杜蘭特為歐盟國家科學素養調查的領導人;《全民科學素質行動計劃綱要(2006-2010-2020)》[7]由我國國務院根據黨的十六大及十六屆三中、四中、五中全會精神,依照《中華人民共和國科學技術普及法》和《國家中長期科學和技術發展規劃綱要(2006-2020年)》,制定并實施。
NAEP是由美國全國教育進展評議中心組織的全國教育進展評估,1996年起定期實施,測評全美中小學生在多個科學領域的學術表現及發展趨勢。研究對象不僅為科學素養,還有閱讀素養、數學素養等。NEAP的評測形式包括:主評估(Main NAEP)、長期趨勢評估(Long-term Trend NAEP)和專項研究(Special Studies),這三種評估分別在不同時間,使用不同的評估和數據收集方式,對不同的學生樣本進行評估,其中主評估使用頻率最高。[8]NAEP主評估(以下簡稱NAEP)以四年級、八年級和十二年級的學生為測評對象,主要評估學校課程和國家課程共同包括的知識和技能,即特定的內容主題和廣泛的思考技能[9]。
而關于科學素養,美國于1990年開始在全國范圍內進行NEAP科學素養的評估。此后,1996、2000、2005、2009年NAEP都曾經測評過科學素養 (此處不包括NAEP長期趨勢評估測評的科學素養)。
NAEP2009科學評估框架相對于1996~2005年框架來說,在保持歷史連貫性的同時也作了一些調整,以適應時代的變化。首先,在科學知識維度上,具體內容都是物質科學、生命科學和地球空間科學這三個領域,只是維度方面不同;新框架對綜合性主題的評價側重于具體學科內容的交叉;1996~2005年框架提出“至少要有15%的評價內容圍繞科技發展史以及對科技發展有重大影響的科學本質的重視”。2009框架將科學本質歸類到科學能力的維度進行評價。第二,在科學能力維度的評價上,2009框架評價四類科學能力:識別科學原理、運用科學原理、運用科學探究、運用技術設計。而1996~2005年框架評價定義的概念理解、科學研究、實踐推理三類科學能力,更模糊不明確。2009框架結合學生的認知需求評價其能力,而1996~2005年框架對科學能力的考查大部分是基于學生經驗的。第三,2009框架增加了兩類評價項目——組合題和計算機交互式任務,更貼近學生的現實生活。
在美國2014年NAEP技術與工程素養框架的預出版稿中,這種歷史變化更為顯著[10]。技術與工程素養是科學素養的重要方面,它有三個評價要素——實踐、情境、評估區域。當對評估任務和項目做出響應時,學生應表現出一般類型的思維和推理,實踐環節正是通過清晰明確地表達出這些思維和推理,從而有助于該框架評估目標的實現;為確保學生有機會在基于問題的情境下展示出他們所知道的和能做的事情,該框架將技術和工程素養評估的任務和項目放在一系列情境中。本框架的重要特點就是強調實踐與情境、貼近生活、深入評價。
國際教育成就評價協會IEA(International Association for the Evaluation of Educational Achievement)主持的TIMSS,原為第三次國際數學和科學評測的縮寫,TIMSS于1995年開始實施。為了更好地延續這項有意義的研究活動,2003年TIMSS正式成為國際數學和科學測評趨勢的縮寫。TIMSS每四年開展一次調查,目的是比較不同國家的學生在數學和科學學科方面的學業成就。最近的一次評估是在2011年開展的,參與的國家有60多個,評估的對象是四年級和八年級的學生。[11][12]
如何把科學素養這個理念性的含義落實到科學素養水平的測試中是一個亟待解決的問題。TIMSS研究人員最初認為科學素養測試要集中于兩個方面:首先是科學概念和技能,其次是關于科學的信念和態度,因而科學素養的定義應為“科學內容及相應的社會影響、推理過程、社會/歷史發展和態度”。這個定義對科學的社會意義等重視不夠,于是,在各方面的建議下,認為科學素養應該包括:科學內容;數學、科學和技術中的推理;數學、科學和技術對社會的影響。
TIMSS2011科學評估框架主要由內容維度和認知維度兩部分構成。四年級和八年級的內容領域有所差異,反映了每個年級科學教育的重點和難點。四年級更重視生命科學;八年級更強調物理和化學。兩個年級認知維度的框架則相同。[13]
國際經濟合作與發展組織OECD主持的國際學生評價項目PISA于2000年開始,針對32個國家的15歲學生實施教育評價。PISA是一項多維度、實質性的國際教育調查研究,每三年一次。它的重要特征是“政策導向”性,服務于教育政策調整和教育改革[14]。PISA在閱讀素養、數學素養和科學素養領域內有各自的評估,每輪PISA評估都在這三個領域中選擇一個,并確定為主要領域,用大部分時間評估主要領域。2006年科學素養是主要領域。
1997年,經合組織設立“國際學生評估項目”(PISA),由其教育司教育統計處負責主持,各成員國教育部派代表組成了“PISA項目理事會”,由此正式啟動PISA測試,并隨即進入前期研究、設計和命題階段。經過三年的準備,經合組織于2000年正式舉行了第一次PISA測試,參加第一次測試的是來自32個國家共25萬名15歲學生。直到2009年,PISA參與國多達60個,還有其他5個教育組織參與。[15]
而關于科學素養,PISA2000和PISA2003中科學素養還處于次要領域地位。當時對科學素養的界定為:“科學素養是運用科學知識來界定問題,得出基于證據的結論的能力,以便理解并幫助作出關于自然界的決定,并且通過人類的活動作出調整”[16]。PISA2006中科學素養是指個體能夠:“掌握的科學知識,應用科學的知識來確定問題,獲得新知識,解釋科學現象,得出科學相關問題的有根據的結論;理解作為人類獲取知識和探究方式的科學的特征,關注科技塑造我們的物質、精神和文化生活的方式;認識科學技術如何塑造我們的物質、智力和文化環境;愿意從事科學相關事務,有科學觀念,成為會思考的公民”。PISA對科學素養的界定范圍越來越廣了。[17]
關于科學素養的評測,以PISA2006為例進行介紹。不同于傳統的學生科學素養評測,PISA不限于測量學生對具體的科學內容的掌握程度。它側重于衡量學生認識科學問題,科學地解釋現象與使用科學證據在科學技術方面解決問題和做出決定的能力。PISA以考察三種能力為特點:識別科學問題,解釋科學現象,使用科學證據。其評估框架如下圖所示。[18]

澳大利亞國家評估項目NAP(National Assessment Program)包括中小學信息素養評估、澳大利亞參與的PISA與TIMSS1等組成部分。信息素養Literacy with Information and Communication Technology(ICT Literacy)與科學素養密不可分,學校已在他們的教育計劃中使用信息和通信技術,幫助學生有效地學習。根據教育考試服務中心在2002年的報告,信息素養是指“使用數字技術、通信工具或網絡來訪問,管理,整合,評估和創造為了在知識型社會中發揮作用的信息”。[19]“中小學信息素養評估是該項目的一個組成部分,開始于2005年,隨后在2008年、2011年每隔三年進行一次評估。澳大利亞信息素養評估與傳統測試方式的最大區別在于,要求學生‘在真實的情境下完成真實的任務’,這被認為是澳大利亞信息素養評估設計的基礎,其評估系統正是基于這樣的理念進行設計的。強調在虛擬的真實情境中去完成日常生活中校內校外會發生的任務,在考查學生信息知識技能的同時,也考察了學生的信息意識、信息思維,同時還涉及與人交流、社會責任等問題,這無疑是信息素養評估的新的有力嘗試”。
第一,在評價目的方面,TIMSS和NAEP比較接近。PISA是在教育框架之外對教育成效的評價。而TIMSS和NAEP是對課程實施成效的評價。TIMSS更關注學校教育,了解學生對科學課程方面的掌握情況,PISA則更關注學生的實際能力,了解學生科學決策能力情況[13]。NAP評估要求模擬學生在“真實世界中”使用信息通信技術,展示信息素養水平,即關注實際能力。
第二,在評價設計的哲學基礎方面,TIMSS與NAEP有些類似。TIMSS是檢驗習得課程與目標課程之間的關系,而NAEP是以課程標準為主要依據設計題目。PISA則是以終身學習模型為基準設計題目考查學生為適應不斷變化的社會所應具備的能力。NAP是以真實生活情境為基礎的。
第三,在對內容領域和認知能力的考查方面,四者的表述和界定差異較大。TIMSS2007的科學測試中包括四個內容領域:生物、化學、物理、地理。考查的認知能力包括三個層次:了解、應用、推理。其中對應用能力和推理能力考查的比重較大。“PISA2006和NAEP2000&2005中都包括三個內容領域:物質科學、生命系統、地球和空間系統,其中PISA2006考查的科學能力包括三個方面:確立科學問題、解釋科學現象和運用科學證據。NAEP2000考查的三種過程技能包括:概念理解、科學研究、實際推理”。再比如,TIMSS2011與PISA2009科學評估框架雖然對科學知識具體的定義略有差異,但都很重視科學知識及其應用,都強調科學探究能力的評估。TIMSS2011科學評估框架與課程結合緊密,更具層次性,更加具體細致,每一階段的評估結構相對獨立和完整。而PISA2009科學評估框架與實際生活相結合,更強調不同生活情境中解決問題的能力,它的評估的領域關聯性更強[13]。而在最新的2014NAEP技術與工程素養框架中,其領域包括:技術與社會、設計與系統、信息與通信技術。很明顯,NAEP也包括了信息與通信技術,這與NAP中的信息素養有異曲同工之處。[20][21]
目前國內研究PISA與NAEP的研究者相對比較多。隨著PISA、TIMSS、NAEP與NAP的展開,研究者們越來越趨向把幾個國際學生評價項目聯系起來,比較評價。
至于目前科學素養評測所存在的問題就是,大部分測試還停留在紙筆化的階段,沒有充分利用計算機,因此大范圍的測試不方便普及開來。此外,沒有充分利用計算機進行人機交互式交流測評,也沒創設十分貼近生活的真實情境。雖然NAP信息素養的評估進行了這種嘗試,NAEP2009使用了計算機交互式任務,PISA2006也強調了情境的重要性,但是這些嘗試并沒有普及開來,或者說,沒有很好地將這些新特征融為一體的測評體系。我們認為,這種新型的嘗試將會是今后科學素養評估方式的發展方向。
雖然NAEP、NAP、TIMSS、PISA都有評估科學素養,它們制定的框架卻不盡相同。這是因為NAEP針對的只是美國特定年級的學生,NAP針對澳大利亞的公民,TIMSS、PISA都是基于國際組織,適用對象不同,對象們的年齡、學業水平、使用教材都不一樣,所以它們的框架、試題都不盡相同。因此,我們國家測評科學素養要根據國情,先明確測評目標和框架,在深入研究學生教材的基礎上設計相應試題。受國際上素養調查熱潮的影響,1990年,中國科學技術協會開始策劃全國性的科學素養調查。而這些調查都采用國際通用的科學素養評測標準。[22]
關于測評方法和工具,也應根據具體情況確定。國際項目都充分利用分層抽樣等測試工具,利用相似的心理測量學方法處理數據[18]。不僅如此,國際項目還通過循環測試和錨題設計,對學生學業成就進行縱向的趨勢研究,比如PISA每三年展開一次測評等。
收集數據固然重要,合理解釋也不容忽視。不僅要運用統計學知識,還要聯系測評對象的生活實際來解釋,從而對我國部分學生科學素養做出評價。
[1]OECD Publishing.Measuring Student Knowledge and Skills:The PISA 2000 Assessment of Reading,Mathematical and Scientific Literacy.2000.
[2]陳發俊.《公眾科學素養測度的困難——以科學素養的三維度理論模型為例》[J].自然辯證法研究,2009,25(3):67-71.
[3]Pella,Milton O;O'hearn,George T;Gale,Calvin W.“Referents to scientific literacy.”Journal of Research in Science Teaching,1966.
[4]郭元婕.《“科學素養”之概念辨析》[J].比較教育研究,2004,11:12-15.
[5]Miller,Jon D.“The Scientific Literacy:A Conceptual and Empirical Review”.Daedalus,1983,112(2),29-48.
[6]黃東有.中學生科學素養現狀與培養對策研究[DB/ OL].http://cdmd.cnki.com.cn/Article/CDMD-10270-2004061020. htm,2004-05-21.
[7]新華社.《全民科學素質行動計劃綱要(2006-2010-2020年)》[J].中國西部科技,2006,特稿:5-8.
[8]黃非非.美國NAEP公民教育評估發展研究[DB/OL]. http://cdmd.cnki.com.cn/Article/CDMD -10736-1011301476. htm,2011-05.
[9]黃慧娟.關于三項著名國際學生評價項目的比較[N].福建師范大學學報(哲學社會科學版),2004-127(4).
[10]WestEd.Technology and Engineering Literacy Framework for the 2014 National Assessment of Educational Progress(Pre-Publication Edition),2014.
[11]TIMSS&PIRLS[EB/OL].http://www.timss.org/.
[12]申梓剛.《NAEP和TIMSS教育評估體系的比較研究和啟示》[J].域外,2012,2:24-28.
[13]曾旋,柏毅,吳玉萍,楊基瑜.《TIMSS—2011與PISA— 2009科學評估框架的比較研究》[J].科教導刊,2013-10:5-6.
[14]張民選,陸璟,占勝利,朱小虎,王婷婷.《專業視野中的PISA》[J].教育研究,2011,6:3-10.
[15]Howard L.Fleischman,Paul J.Hopstock,Marisa P. Pelczar,Brooke E.Shelley.Highlights From PISA 2009:Performance of U.S.15-Year-Old Students in Reading,Mathematics,and Science Literacy in an International Context,2010.
[16]滕梅芳,盛群力.《評估科學素養培育關鍵能力——OECD/PISA科學素養之構想、設計與評估》[J].遠程教育雜志,2009,3:28-36.
[17]Troy D.Sadler,Dana L.“Zeidler.Scientific Literacy,PISA,and Socioscientific Discourse:Assessment for Progressive Aims of Science Education”.Journal of Research in Science Teaching,2009,8:909-921.
[18]姚霞.《國際科學素養測評對我國科學學科測評的啟示》[J].考試研究,2013,2:53-63.
[19]King Luu,John G.Freeman.“An analysis of the relationship between information and communication technology(ICT) and scientific literacy in Canada and Australia”.Computers&Education,2011,56:1072-1082.
[20]王洋,柏毅.《NAEP技術與工程素養評估簡述》[J].江蘇科技信息,2013:65-68.
[21]梁潤嬋.TIMSS、PISA、NAEP科學測試框架與測試題目的比較研究 [DB/OL].http://cdmd.cnki.com.cn/Article/CDMD-10602-2010035506.htm,2009-04.
[22]袁汝兵,吳循.《各省(市)公眾科學素養調查綜述》[J].中國科技論壇,2007,5:98-100.