摘要:學業評價已經成為課程改革中重要的研究領域,而對于學業評價工具的使用,國內學者鮮有研究。以國外三種最常用的學業評價工具: Webb評價,Achieve評價和SEC評價為例,介紹三種工具的思想與應用。
關鍵詞:學業評價 Webb評價 Achieve評價 SEC評價
1、引言
學業成就評價要著眼于課程標準,而基于標準的評價在國外已經十分成熟,我國還處于理論探討階段。在“學業評價為什么要依據課程標準”的問題上,崔允漷教授給出解答[1],他認為課程標準規范學業成就評價的設計理念,課程標準提供學業成就評價的維度框架,課程標準限定學業評價的內容范圍和認知要求。邵朝友等認為一致性是基于標準評價的核心[2],它首先是反映基于標準評價執行程度的依據,其次是基于標準評價價值追求的重要手段,并且邵朝友等也給出提高基于標準評價的一致性的策略,首先要進一步完善課程標準,其次提升教師的評價素養,最后還要基于我國教育實踐開發一套一致性檢驗的程序和工具。國內學者的評價都是依據國外依據成熟的評價方法,其中最著名的是Webb評價,Achieve評價和SEC評價。楊玉琴等學者在《美國課程一致性研究的演進與啟示》一文詳細闡述了Webb評價,Achieve評價和SEC評價工具的思想與應用[3]。
2、Webb評價的思想及應用分析
泰勒(Taylor,R.W)認為“評價過程的本質上是明確課程和教學大綱在實際上實現教育目標的程度的過程”。美國教育理論家諾曼·韋伯(Webb,N.L)是基于標準評價思想的代表性人物,他提出一整套基于課程標準的學業成就評價程序、方法與技術,被后來學者稱為“Webb評價模式”。1997年,韋伯博士撰寫的研究報告《數學與科學教育的期望和評估調整標準》[4]中指出12種評價的技術標準,并歸為5類:內容集中性、跨年級與年齡段的準確度、公平與公正、教學意義和系統可應用性,后來他從12個技術標準中抽取4個標準作為分析維度:知識類別一致性、知識深度一致性、知識廣度共同性和知識分布平衡性,成為后來學者評價與課程標準一致性的分析范式,焦少珍和陳淳使用webb分析維度評價了9套高考生物試卷試題與課程標準的一致性[5],朱行建和李勇使用這四維度分析新課程物理高考考試大綱與課程標準的匹配性[6],曹小旭與張慶霞使用Webb評價的四個維度進行小學語文學業水平考試與課程標準一致性的分析[7],岳喜騰和張雨強發表的文章《基于課程標準的學業成就評價:韋伯模式之研究》[8]詳細闡述了Webb評價模式的分析維度、分析程序、分析方法和基于網絡一致性分析工具。Webb評價模式對學業成就評價的研究具有里程碑式的作用,劉學智認為Webb模式是其他基于課程評價模式構建的母體,同時Webb模式在實踐應用中具有廣泛的價值[9],他提出Webb模式中國本土應用的構想,他認為中美兩國在基于標準評價一致性的基準、目的和內容形似,為Webb模式本土化應用提供良好的條件,同時Webb模式的中國本土化應用不能“照本宣科”,需要在以下方面進行調整:針對課程標準之間差異的調整,針對學業評價目標與評價項目類型差異的調整,針對韋伯分析模式局限性的調整。雖然Webb評價模式對基于課程評價的貢獻巨大,例如,加入知識深度、廣度和知識分布,從單純評價內容一致性擴展到多維評價,從單一“試題-內容”匹配發展到“試題-目標”匹配,增加了研究的精度。但是Webb評價在實際應用中也同樣存在一些問題,首先是什么樣的一致性水平才最有解釋力,其次是Webb提出的4種分析維度的知識深度如何界定,雖然目前也有學者使用泰勒的目標行為和布魯姆的認知目標分類作為知識水平認知的限定,但是這樣的研究自身也沒有考慮不同內容領域之間的復雜性和難度,也沒有回答具體某一課程的核心學業成就評價的表現。
3、SEC分析模式的思想與應用分析
威斯康星州教育研究中心Porter和Smithson在美國政府資助下,研發評價與課程標準一致性水平的程序和方法,被稱為SEC(Surveys of Enacted Curriculum)模式[10],SEC一致性分析模式把課程分為四類:預期課程、實施課程、達成課程和評價課程,SEC評價的本質是強調從多課程水平之間的一致性來理解課程運行本質,SEC分析模式重新吸收了Webb分析模式的四維度,并提出5種認知水平要求:識記、運算程序、解釋、推測和歸納、應用。SEC分析模式利用數據計算一致性指數作為分析一致性的重要標準,因此SEC分析程序需要以下幾步:第一步是構建內容矩陣,第二步是研究資料的統計分析,第三步是一致性計算與分析,其計算公式是A1=1-[∑|X-Y|/2]。之后,我國學者開始引進SEC分析模式,劉學智和馬云鵬撰文詳細闡述了SEC分析模式產生的背景,核心思想,程序與方法[11],陳嫻等用SEC測量方法測評物理課程標準與考試之間的一致性[12],柳秀峰等以美國紐約、新加坡和中國江蘇為研究對象,使用SEC工具分析三個地區學業評價與課程標準的匹配程度,得出結論:美國紐約州學業評價與課程標準的一致性水平要高于新加坡和中國江蘇省[13],李嫩使用SEC分析模式研究上海化學課程標準與中考試題一致性研究,并完成了自己的碩士論文。SEC模式與其他模式最大的不同的是,SEC模式創造性開發出一致性指數的計算方法,同時通過復雜工具計算的臨界水平增加研究的科學性,通過自建研究矩陣的形式增加了研究的范圍,使其不僅用于內容標準、教材內容和內容評價,也可進行不同國度的一致性評價研究,但是過于倚重編碼處理,也忽視了各要素之間學習目標的匹配。美國在課程標準方面已經詳細制定內容標準、評價標準和機會標準等多項標準,這是SEC分析模式的重要依據,但是我國的課程標準評價提供宏觀建議,其具體評價標準還需要研究者根據不同認知水平和不同研究項目自行設定。
4、Achieve分析模式的思想及應用
針對Webb分析工具存在的缺陷,美國非盈利的教育機構Achieve公司于2002年組織羅斯曼(R.Rothman)等人開發一種能考慮多方面因素的一致性研究工具,稱為Achieve分析模式。Achieve分析工具從三個維度構建一致性分析框架:向心性、挑戰性和均衡性。向心性是對Webb模式知識深度一致性的細化,均衡指標是對內容領域一致性的修正,只有挑戰性是不同于Webb模式,是一種新增的指標體系。Achieve分析是由教育專家、學科專家和課程專家參與分析,分析過程包括三個階段:第一階段檢測評價項目和課程標準的匹配程度,第二階段對評價項目的難度進行評估,第三階段檢測知識分布的平衡性和評價項目的知識廣度[14]。
Achieve分析模式提供細致的定性描述,提供關于測量整體、各維度的豐富詳實的信息,但是該模式沒有界定臨界條件,對于大規模學業評價而言,加大了比較的難度,減弱了評價質量。
5、小結
基于標準評價的研究,國內并沒有形成統一、成熟的研究范式,更不用談評價標準,即使國外成熟的Webb評價,SEC評價和Achieve評價,國內學者也沒有進行中國化情境的改造,學者對學生學業成就評價改革的方向、改革內容眾說紛紜,課程標準似乎已經脫離學業評價體系之外。
我國一致性研究剛剛起步,需要根據研究的特定目標,圍繞要解決的突出問題,綜合分析各種分析工具的應用,選擇并形成能適合研究特殊的一致性研究工具。對于不同的研究項目,也需要結合各評價工具的長處,綜合其優勢,使用多種評價工具的結合達到研究目的。
參考文獻:
[1]崔允漷,夏雪梅.試論基于課程標準的學生學業成就評價[J].課程·教材·教法,2007,27(1):13-18.
[2]邵朝友,張斌,王少非.論學生學業成就評價與課程標準的一致性[J].教育研究與實驗,2011,(6):50-55.
[3]楊玉琴,王祖浩,張新宇.美國課程一致性研究的演進與啟示[J].外國教育研究,2012,39(1):113-121.
[4] Webb, N. L. Criteria for Alignment of Expectations and Assessments in Mathematics and Science Education. Research Monograph No. 6. [R]. Washington, DC: Council of Chief State School Officers,1997.
[5]焦少珍,陳淳. 2009年課改實驗區高考生物試卷與課程標準的一致性研究[J].教育測量與評價(理論版),2010,(5);54-58.
[6]朱行建,李勇. 新課程物理高考考試大綱與課程標準的匹配性研究[J].課程·教材·教法,2007,27(10):56-59.
[7]曹小旭,張慶霞. 基于標準的小學語文學業水平考試試卷質量分析--學業評價與課程標準一致性的視角[J].教育測量與評價(理論版),2011,(7):24,57-60.
[8]岳喜騰,張雨強.基于課程標準的學業成就評價:韋伯模式之研究[J].全球教育展望,2011,40(10):79-85.
[9]劉學智,張雷.學業評價與課程標準的一致性:韋伯模式的本土化研究[J].外國教育研究,2009,36(12):13-17.
[10]Porter, A. C., and Smithson, J. L. [PDF] Defining, developing, and using curriculum indicators[R]. PA: University of Pennsylvania, Consortium for Policy Research in Education,2001.
[11]劉學智,馬云鵬.美國“SEC”一致性分析范式的詮釋與啟示—基礎教育中評價與課程標準一致性的視角[J].比較教育研究,2007,(5):64-68.
[12]陳嫻,郟璨璨,陳寧.物理內容標準與考試之間的一致性研究[J].課程·教材·教法,2010,30(7):67-71.
[13]Liu, X.F., Zhang, B.H., Liang, L.L.et al. Alignment between the physics content standard and the standardized test: A comparison among the United States-New York State, Singapore, and China-Jiangsu[J]. Science Education,2009,93(5):777-797.
[14]范麗雙,劉學智.美國”成功分析模式”的詮釋與啟示-學業評價與課程標準一致性的視角[J].比較教育研究,2010,(8):77-80.