王明其 張正嚴
(1.成都市樹德中學,四川 成都 610031;2.西南大學 科學教育研究中心,重慶 400715)
當前國際上評價學生科學探究能力的方式可以分為三大類:紙筆測驗、現場觀察和工作單.所謂現場觀察,就是讓學生動手探究,評分者通過觀察即時評分;而工作單也是讓學生動手探究,但要求學生同時把探究過程和結果寫在一張單子上,事后評分者對單子上的內容進行延時評分.[1]工作單又可以按照結構性強弱分為:開放式性工作單、結構性工作單和引導性工作單.[2]就目前而言,現場觀察是科學探究能力評價最有效的方式,但由于其人力、物力、時間成本高,在實際操作中推行起來比較困難.[2]
盡管國際上對各種科學探究能力評價的有效性做了一些有益的研究,[3]但中西方的科學探究教學處于不同階段,評價背景差異大.因此,在國內推行高中課程改革的背景下,檢驗現場觀察、紙筆測驗、開放式性工作單、結構性工作單和引導性工作單這五種評價方式對我國高中生科學探究能力評價的有效性,就自然進入了我們的研究視野之中.
國內學者羅國忠(2007)曾對紙筆測驗、工作單和現場觀察三種評價方式測評初中生的科學探究能力的有效性做了初步的討論.[3-4]在本研究中,我們采用現場觀察、紙筆測驗、開放式性工作單、結構性工作單和引導性工作單測評課改區高一學生的科學探究能力,深入研究不同性別、不同成長環境、不同性質學校、不同成績水平的學生群體的表現差異,進一步深入細致地揭示五種不同評價方式針對國內高中學生的評價有效性.對于五種科學探究能力評價方式有效性的研究,將有助于改變我國迄今還是采用單一的傳統紙筆測驗方式來評價高中生的科學探究能力的境況,有力地推動我國當前科學探究教學的順利開展.
被試對象選自重慶市西南大學附屬中學、重慶市魯能巴蜀中學、重慶市王樸中學和重慶市北碚區田家炳中學四所中學共118名課改實驗區的高一學生.這些學生在高一期間做過較完整的科學探究,有一定的探究經歷.被試對象具體分布如表1.

表1
2.2.1 紙筆測驗
紙筆測驗內容由與工作單探究任務相同的重慶市2007年一道高考物理題改編而成.這道試題反映了重慶市物理科學探究試題的典型特點.對于高一的學生來說,這道題既包含有學生在課堂教學中學過的實驗內容,也有學生沒有學過的實驗內容,但解決問題所需的物理知識都已學過.紙筆測驗中的每一小問評價一個探究要素,共七個小問,這些小問之間各不相干.這些小問除了不涉及動手實驗與收集數據、交流與合作外,涉及了提出問題、猜想與假設、制定方案、分析論證、評估等五項科學探究要素.
每個學校在進行工作單實驗之前利用20min的時間,由學生獨立完成紙筆測驗.之后,由評分教師評分.
2.2.2 工作單
工作單和現場觀察采用學生沒有做過的探究任務,探究內容是“探究修建橋梁時,采用了將鋼梁與水面成一定傾角出水的起吊方案”(根據重慶市2007年一道高考物理題改編而成).這個探究任務涉及提出問題、猜想假設、制訂計劃、進行實驗、概括結論、評估6個探究要素.
工作單包括3種工作單,即開放性工作單、結構性工作單、引導性工作單,第1種是開放性工作單,學生完全自主探究;第2種是結構性工作單,學生在工作單的框架結構下進行探究;第3種是引導性工作單,學生在具體引導下進行探究.根據3種工作單的特點,我們就同一探究任務制作了開放性工作單、結構性工作單和引導性工作單.
學生做完紙筆測驗后,開始進行工作單和現場觀察的測評.我們將每個學校的學生分成甲乙丙三組,每組約10名學生,分別安排在一個實驗室.學生單人單桌,每個學生要各自獨立完成一種工作單.具體安排如下:甲組學生探究開放性工作單,乙組學生探究結構性工作單,丙組學生探究引導性工作單.探究活動的時間為40min.評分時,一位教師自始至終負責一項探究任務的評分.每個教師各自評分,互不干擾.
2.2.3 現場觀察
現場觀察融入在學生做工作單實驗時進行,內容也是“探究修建橋梁時,采用了將鋼梁與水面成一定傾角出水的起吊方案”.現場觀察采取個別測試方式,每個學生獨立完成探究任務.一位教師自始至終負責一項探究任務的觀察、評價.每個教師各自獨立觀察,即時評分.
2.2.4 評分標準
工作單評分標準涵蓋“提出問題”、“猜想與假設”、“制定計劃”、“進行實驗”、“概括結論”和“評估分析”6個科學探究能力要素,并將6個要素做進一步細化,提煉出關鍵成分,對每項關鍵成分進行賦分.“進行實驗”要素是科學探究的核心要素,其分值最高,為30分,每個關鍵成分最高分值10分,其余要素最高分值為15分.整個工作單評分標準總分為100分.現場觀察評分標準由工作單評分標準中的“進行實驗”、“概括結論”和“評估分析”三大要素部分組成,滿分為57分.紙筆測驗少了工作單評分標準中的“進行實驗”一項,總分為70分.
為了檢驗不同評價方式間的相關程度,表2給出了在不同群體學生中兩兩評價方式之間的相關系數.
從表2可以看出,紙筆測驗和現場觀察這兩種評價方式,男生的得分相關性顯著,但女生的得分相關性不顯著,而且男生的相關程度大于女生的相關程度;城市學生的得分與農村學生的得分相關性均不顯著,但城市學生的相關程度大于農村學生的相關程度;物理成績不同的三類學生的得分相關性均不顯著,但物理成績高水平的學生、物理成績低水平的學生、物理成績中水平的學生相關程度逐漸遞減;三種性質的學校的學生得分相關性均不顯著,但市直屬、普通中學、農村中學的學生得分相關性逐漸遞減.
從上面的結果可以看出,紙筆測驗只是在測評男生群體時能替代現場觀察,測評其他類型群體的學生時則不能替代現場觀察.
由表2可知,對于現場觀察和開放性工作單測評結果而言,男女生得分相關性均極其顯著,而且男生得分相關程度低于女生得分的相關程度;城市、農村的學生得分相關程度均極其顯著,而且城市學生的相關程度高于農村學生的相關程度;物理成績高水平的學生相關性顯著,物理成績低水平的學生、物理成績中水平的學生相關性極其顯著;直屬學校學生的相關性顯著,普通學校學生的相關性不顯著,農村學校學生相關性極其顯著.

表2
由表2可知,對于現場觀察和結構性工作單測評結果而言,男女生得分相關性均極其顯著,而且男生得分相關程度大于女生得分的相關程度;城市、農村的學生得分相關程度均極其顯著,而且城市學生的相關程度低于農村學生的相關程度;物理成績高、中、低水平的學生得分的相關極其顯著;直屬學校學生的相關極其顯著,普通學校學生的相關顯著,農村學校學生相關性極其顯著.
也就是說,對于不同性別、家庭所在地、物理成績水平、學校性質的學生群體來說,現場觀察與結構性工作單這兩種評價方式相關都顯著,可以相互替代.
由表2可知,對于現場觀察和引導性工作單測評結果而言,男女生得分相關性均極其顯著,而且男生得分相關程度大于女生得分的相關程度;城市學生得分相關程度均極其顯著,農村的學生得分相關不顯著;物理成績高、中、低水平的學生得分的相關極其顯著;直屬學校和普通學校學生的相關極其顯著,農村學校學生相關性不顯著.
由表2可知,當針對不同性別、成長環境、物理成績水平、學校性質的學生,將其紙筆測驗測評結果與引導性工作單的測評結果做相關性分析時,其測評結果均無顯著性相關;當針對不同性別、成長環境、物理成績水平、學校性質的學生,將其紙筆測驗測評結果與結構性工作單的測評結果做相關性分析時,除城鎮學生在紙筆測驗與結構性工作單的測評結果上有顯著相關外,其余各種情況下紙筆測驗與結構性工作單均無顯著性相關;當針對不同性別、成長環境、物理成績水平、學校性質的學生,將其紙筆測驗測評結果與引導性工作單的測評結果做相關性分析時,除男學生在紙筆測驗與引導性工作單的測評結果上有顯著相關外,其余各種情況下紙筆測驗與結構性工作單均無顯著性相關;
也就是說,不同性別、成長環境、成績水平、年齡、學校性質的學生在紙筆測驗分別和3種工作單評價中得分的相關性在30種情形下只有2種情形存在顯著性相關.
不同評價方式總體之間的相關系數見表3.從表3可以看出,對于全體學生來說,紙筆測驗與現場觀察、開放性工作單、結構性工作單、引導性工作單的相關性都不顯著;開放性工作單、結構性工作單、引導性工作單三種表現性評價方式與現場觀察均具有極其顯著的相關性.這和前面的分類分析結果總體上一致,與國外 Woolnough等人(1990)的研究也相吻合.Woolnough等人的研究表明,開放性、結構性、引導性性這3種工作單與現場觀察的相關系數分別為0.67、0.8、0.7.[5]

表3
也就是說,不對學生做分群體考察,工作單和現場觀察這兩種評價方式可以相互替代;但是,紙筆測驗既不能和現場觀察相互替代,也不能和三種工作單相互替代.
現場觀察是目前公認的最有效的考察學生科學探究能力的方式.[2]在目前情況下,采用不同的評價方式測評學生的科學探究能力,如果其測評結果與現場觀察結果相關顯著,則我們就認為采用該方法測評學生學生的科學探究能力有效,可以與現場觀察相互替代.
研究表明,不同性別、成長環境、成績水平、年齡、學校性質的學生在紙筆測驗分別和三種工作單評價中得分的相關性在30種情形下只有2種情形存在顯著性相關.紙筆測驗只是在測評男生群體時能替代現場觀察,測評其他類型群體的學生時則不能替代現場觀察.對全體學生而言,紙筆測驗既不能和現場觀察相互替代,也不能和三種工作單相互替代.因此,可以認為紙筆測驗與現場觀察、三種工作單評價都不能相互替代.
研究表明,不對學生做分群體考察,對于全體學生而言,工作單和現場觀察這兩種評價方式可以相互替代.因此,可以說采用開放性工作單、結構性工作單和引導性工作單對于全體學生進行科學探究能力評價是有效的.采用工作單測評高中生的科學探究能力比紙筆測驗更加有效.
研究還表明,對于不同學生群體來說,現場觀察與結構性工作單這兩種評價方式相關都顯著顯著,可以相互替代.但開放性工作單和引導性工作單在個別學生群體的評價中出現了與現場觀察結果不顯著的情況.因此,比較而言,在三種工作單中,采用結構性工作單測評高中生的科學探究能力最為有效.
由于現場觀察成本太高,效率太低,難以大規模推行,可以在日常教學評價中為教師采用.在實驗條件允許的情況,工作單的工作效率和紙筆測驗差別不大,有較好的應用前景.在實踐層面,我們可以在高中會考和其他教育教學評價中,就使用工作單評價高中生的科學探究能力做些嘗試.特別是在教師日常教學中,可以將工作單作為高中生形成性評價的一種重要方式來實施,從而有效促進高中生科學探究能力全方位的培養.
1 羅國忠,張正嚴.基于公平視角的科學探究能力評價研究.課程·教材·教法,2008(8).
2 羅國忠.國外科學探究評價方法及其啟示.外國中小學教育,2009(12).
3 羅國忠.基于工作單的科學探究能力評價的有效性研究.課程·教材·教法,2007(11).
4 羅國忠.基于紙筆測驗的科學探究能力評價的有效性研究.上海教育科研,2007(10).
5 羅國忠.國外科學探究能力評價研究綜述.上海教育科研,2006(11).