

摘要:近年來,“二選一”文題在中考中被廣泛使用。然而,兩道文題的差異性較大、文題評價的一致性不足、糾偏機制的科學性缺位,使得“二選一”文題評價有失科學與公平。而科學與公平是“二選一”文題理應堅持的基本倫理。這就亟須引入糾偏機制。等級賦分作為成熟的糾偏機制,已被廣泛運用到高考選科評價中。將等級賦分引入“二選一”文題評價,能平抑差異,彌補缺漏,實現科學評價。
關鍵詞:等級賦分? “二選一”文題? 考試評價? 糾偏機制? 等值處理
引用格式:蔣興超.中考“二選一”文題評價引入等級賦分的研究[J].教學與管理,2022(01):66-69.
“二選一”文題,以其柔性關懷擴展了寫作和選擇的空間,在近年來的中考文題命制中愈來愈受重用。兩道文題必然有兩種評價,兩種評價就有兩套評價標準,它們是否有統一的科學維度?當兩種評價出現巨大偏差,理應有科學而成熟的糾偏機制。等級賦分作為相對性評價,其目的是糾偏,平抑評價的失當和不公。“二選一”文題評價的種種漏洞與不足亟須引入糾偏機制加以彌補,等級賦分正逢其時。
一、“二選一”文題評價的現狀分析
1.兩道文題的差異性較大
筆者收集了2021年中考語文試卷共124套,其中“二選一”文題共45卷,占比36.3%,接近樣本的四成。這比2019年占比的27.2%和2020年占比的34.7%又有所提高。可見,“二選一”文題受到命制者的普遍青睞。縱觀2021年中考的“二選一”文題,其顯著特點是差異性較大,有如下兩種表現。
(1)直接關聯小
兩道文題之間有直接關聯的有8卷,分別出自山西省,江西省,浙江省寧波市、湖州市、金華市、嘉興市、舟山市,湖南省永州市,湖北省恩施市。其他37卷的兩道文題之間沒有關聯性,具體表現為:缺少共同的情境,沒有相同或相似的話題,不在同一思考起點。缺乏關聯性意味著沒有可比性,這就增加了科學評價的難度。
(2)難度差異大
兩道文題的類型大都不同,組合形式較多,難度差異較大。比如2021年遼寧省營口市中考題:
文題一:運動讓我_____________
近視、超重、肥胖……當前學生體質健康水平發展不充分、不平衡成為社會關注的熱點,北京體育大學教授張一民說:“運動是有效增強孩子體質,促進健康和預防疾病,主動追求健康的重要手段。”以上材料引發了你怎樣的思考?請先補全題目,然后寫一篇文章。
文題二:綜合下面三則材料,選擇合理角度,自擬題目,寫一篇文章。
文題一是半命題作文,材料給出了思維支架,寫作方向較為明晰。文題二是材料作文,材料由“古訓”“現代理念”和“全面育人觀”組合而成,而“古訓”又由三則文言組成,這些看似不相關的材料成了審題障礙。考生還要能審讀出它們的共同話題是“勞動”,意在強調“勞動”的意義,否則無法下筆。因此,文題二要頗費一番功夫才能找到寫作方向。顯而易見,文題二的難度要比文題一大得多。
2.文題評價的一致性不足
“二選一”文題相較于單一文題,對評價的要求更高:要有更寬的視域和更高的技術。要有更寬的視域,是因為兩道文題的評價各自為陣,要平抑兩者的差異,需要用聯系和比較的眼光,眼界要開闊。要有更高的技術,是因為平抑差異要綜合文題難度、考分分布、等級劃分、占比確定等諸多因素,需要科學專業的技術支撐,技術要過硬。然而,頗受詬病的評價現狀是一致性不足,缺乏宏觀統籌。
單一文題的評價相對容易把握,而兩道文題就完全不同:這部分考生選擇此,那部分考生選擇彼,文題難度差異較大,選擇高難度文題的起評分是否要比選擇低難度文題的起評分高?考生一窩蜂地選擇難度低的,由此帶來嚴重的同質化,寫得尚可的作文是否因此而受到打壓?兩道文題考生分差較大,是否需要調配考分的占比?這些都需要宏觀統籌。宏觀統籌是從上位設計來考量兩道文題評價的可比性和一致性。宏觀統籌,注重大局意識,拒絕偏狹和失衡,兩題都要兼顧,重在協同和平衡。
然而,“二選一”文題評價的現狀是:相互獨立,彼此割裂,主觀化和隨意化的傾向還很嚴重。這就導致了兩道文題的評價完全失聯,一致性嚴重不足。
3.糾偏機制的科學性缺失
教育家懷特主張:“特別重要的考試,應該讓所有的學生對同一問題做出反應,這樣所有的人站在相同的起點,需要走相同的距離。最有意義的自由就是公平。”[1]在懷特看來,高利害的選拔性考試應有科學而公平的競爭起點。科學與公平,正是“二選一”文題理應堅持的基本倫理。然而,文題命制有先天性缺陷,文題評價有明顯性分離,這就必須引入糾偏機制。
糾偏機制,主要應對兩大核心問題:一是文題差異,二是評價不一。這種機制,應在文題命制之初建立,在文題評價之時啟用。中考作為高利害的考試,雖然實行的是區域化考查,但應當建立全國通行的糾偏機制。糾偏機制,屬于高利害考試的上位設計,它和試題設計、評價設計同等重要,起到自我調節和自我完善的作用。一套成熟完備的高利害的測評體系,必須內含糾偏機制。
隨著“二選一”文題的廣泛使用,科學、完備的糾偏機制必將建立。同樣高利害考試的高考,等級賦分作為成熟的糾偏機制已被普遍使用,它給“二選一”文題評價以很好的樣板參照。
二、等級賦分及引入“二選一”文題評價的意義
1.等級賦分的內涵
等級賦分,簡而言之,就是將考生的原始分數換算成等級再評價,它需要綜合等級的細化標準和考試的原始分數。現行的高考等級賦分,不同的省份等級劃分的標準各有不同,但有三點共識:都拒絕以原始分直接評價,都需要將原始分進行等級轉換,都關注原始分在群體中的位次和占比。它們的差異在于細化標準和轉換方式有所不同,但評價的精神指向完全一致。下面以浙江省、上海市、北京市、天津市和山東省的等級賦分為例,略作說明。
從表1可清晰看出,各省制定的細則標準均有不同,山東和上海的等級最少,浙江的等級最多,北京和天津大致相同。所有省市都將原始分進行了二次轉化和定級,只是級數和占比各有不同。
由此可見,等級賦分是一種相對性評價,尤為關注原始分在考群中的位次和占比。通過技術處理和轉換,它更能直觀地反映原始分的位次,而非原始分本身。而過往的傳統評價,是絕對性評價,只關注原始考分,不關注也不反映原始分的位次。
高利害的高考為何要引入等級賦分呢?2014年9月,國務院頒布《國務院關于深化考試招生制度改革的實施意見》,提出了高考改革新方案,明確要求全國各省實行“3+3”必考加選考的高考模式。2014年浙江和上海率先試點(2017年執行),選考科目,浙江實行“7選3”,上海實行“6選3”,浙江各種選科組合達35種,上海各種選科組合達20種。選考組合如此之多,而不同科目的考分差異可能很大,這就嚴重影響了考試的公平性。基于此,浙江和上海率先采用了等級賦分。2017年第二批新高考改革啟動(2020年執行)的山東、天津、北京、海南四省,選科考試也采用了等級賦分,2018年第三批新高考改革啟動(2021年執行)的湖南、湖北、河北、遼寧、重慶、江蘇、福建和廣東八省,選科考試同樣采用了等級賦分。可見,等級賦分已被各省廣泛認可,大家都把目光聚焦到選考科目之間的差異性和可比性,都不約而同地追求評價的科學與公平。
2.引入等級賦分的意義
等級賦分和“二選一”文題評價所缺失的糾偏機制有何關系呢?從本質來說,等級賦分就是一種糾偏機制,是為了防止和消除選科評價中的不合理,兩者的目的都是為了糾偏。從環境來說,它們所面臨的都是高利害的考試,一個是高考,另一個是中考,都涉及萬千考生的切身利益,被高度關注。從背景來說,它們都因選擇的多樣而帶來評價的差異,都是為了平抑差異而設立糾偏機制。從意圖上說,都希望科學測量,力求評價的科學公允。綜上所述,等級賦分完全可以成為“二選一”文題評價的必要引入。
引入等級賦分的目的在于平抑“二選一”文題評價的差異。從技術上講,等級賦分的核心意圖是解決原始分的可比性問題,引入等級賦分正是將其核心思想運用到“二選一”文題評價中:根據等級賦分的標準,用等級和占比來重新換算原始分,以達到可比和平抑的目的。
引入等級賦分可以切實有效地營創科學公平的評價環境。近年來,“二選一”文題雖廣被采用,但評價各行其道,彼此失聯,又廣遭質疑。引入等級賦分便可以糾正顧此失彼的評價現狀,讓兩者的評價充分溝通和互動起來。若這樣,文題的難度、選題的多寡和兩題的標準,就不再是考生擔憂的因素。依據等級賦分細則對原始分進行轉換再評價,遠比單題的原始分評價要科學得多,公允得多。如此,科學公平的評價環境也就隨之而至。
引入等級賦分有助于建立長效評價機制。等級賦分引入和運用到高考評價之初,就是從大處著眼,屬于評價的頂層設計。這種設計科學、周密,易于理解和接受,可操性強,能切實解決選科評價中可比性不強的問題,具有很強的針對性和實效性。“二選一”文題評價將等級賦分引入進來,也正是從上位進行頂層設計:無論兩道文題怎樣組合,無論兩題難度如何差異,無論兩題評價標準怎樣不同,都得按此頂層設計進行轉換再評價。這樣,長效評價機制的建立便水到渠成。
三、“二選一”文題評價引入等級賦分的構想
等級賦分作為糾偏機制,盡管在高考中已廣泛運用,它也可以彌補“二選一”文題評價的漏洞與不足,但能將其直接照搬到“二選一”文題評價中嗎?具體的標準該如何建立?兩道文題的原始分數又該如何轉換?我們的應對策略如下。
1.參照高考等級賦分標準
等級賦分,是為了平抑高考政治、歷史、地理、物理、化學、生物6門或7門(信息技術)選科成績差異而設立的評價系統。在新高考三種賦分的區分程度上,海南實行的是“標準分制”,山東等第三批新高考改革區實行的是“等比例轉換法”,上海、浙江、天津和北京實行的是“固定等級比例賦分制”[3]。統而言之,三種賦分方式是按不同的建模方法精確計算的結果,都有科學的測量標準,都經得起實踐的檢驗。它們只是算法不同而已,各有優勢。從理論上說,可以將等級賦分直接引入到“二選一”文題評價。
然而,等級賦分比“二選一”文題評價亟需的糾偏機制要復雜得多:等級賦分和高考選科、未來專業有高度關聯,而“二選一”文題評價則沒有;等級賦分的對象是高考6門或7門選考學科,而“二選一”文題的賦分對象只有兩道文題;高考等級賦分,除上海外,其他省份轉換后的滿分都為100分,而中考作文大多地區的滿分為50分;高考等級賦分的標準,所定的級數較多,浙江達21級,而中考作文大多地區按5類文賦分。
綜合以上信息可知,各省的等級賦分雖有差異,但都有科學可靠的定級賦分的標準。要將等級賦分引入到“二選一”文題評價,只需靈活地降格處理,也就是把等級賦分的精髓運用到“二選一”文題評價中即可。
2.明晰等級賦分精髓
為了更好地將等級賦分引入“二選一”文題評價,必須先厘清等級賦分的精髓。教育部頒布的《教育部關于普通高中學業水平考試的實施意見》明確規定:以等級呈現成績的一般分為五個等級,位次由高到低為A、B、C、D、E。原則上各省(區、市)各等級人數所占比例依次為:A等級15%,B等級30%,C等級30%,D、E等級共25%。E等級為不合格,具體比例由各省(區、市)根據基本教學質量要求和命題情況等確定[4]。這是教育部對等級賦分要求的總綱,從上位設定了考分轉換的等級占比。不管科目考試的難易程度和原始分如何,都必須按此執行。這就從根本上平抑了不同科目因難度系數和原始考分的高低不平而帶來的差異。等級賦分的程序大致如下。
(1)根據上位設計,先劃等級
由表1可見,各省所劃的等級有所不同:浙江、北京和天津劃為5等21級,上海為5等11級,山東為8等80級。各省做法雖有不同,但都進行了精確的等級劃分,且所有選考科目都按此執行。這是科學測量和有效區分的第一道屏障。
(2)劃好等級,再定占比
不同的等級,占比各有不同。以浙江為例,1級占比1%,2級占比2%,3級占比3%,6級占比6%,7級占比7%,8級占比8%,9級占比7%,10級占比7%。同為5等21級的北京和天津,大多等級的占比和浙江完全相同,而有的等級占比就略有不同,比如北京和天津6級占比都為7%,7級占比浙江和天津都為7%,而北京為8%。總體而言,各級占比差異較小,和教育部上位規定的整體占比大體一致。這是科學測量和有效區分的第二道屏障。
(3)按比賦分
按比賦分,就是將原始分按等級位次所對應的占比重新換算成新的考分。還以表1的浙江為例,不論原始考分是多少,占比前1%就為1級,對應等級重新賦分為100分,占比在1%和2%之間就是2級,對應等級重新賦分為97分,具體賦分詳見表1。
綜上可見,等級賦分的精髓就是先劃等級,再定占比,按比賦分。一言以蔽之,根據原始分的位次占比重新賦分。等級賦分看重的是原始考分的區間占比,而非原始考分本身。
3.重建等級賦分標準
“二選一”文題評價引入等級賦分不是將各省所定的細則標準直接拿來,而是取其精髓,重新劃分等級確定占比和按比賦分,也就是重新建立標準,重做等值處理。這里涉及以下兩個問題。
(1)原標準的處理
重建新標準并不意味著廢棄原有的評價標準,而是兩道文題對應兩套評價標準,不同的文題按照不同的標準分別評價。原有的評價標準專業性很強,要避免外力的干擾。這種專業性很強的原始評價是科學測評的原始防線,不可丟棄,丟棄了原始防線,等級賦分也就從根本上失去了意義。從這個意義上可以說,原標準是新標準的基石。
(2)新標準的建立
建立新標準就是要從上位設計一套科學的等級換算的標準。高考的等級賦分所設的等級較多,原因是選考科目為100分制(上海除外)。而中考作文大多為50分制,因此劃分的等級可以相對少一些。至于占比的確定,需要綜合樣本透視、難度系數、均值分數、考分分布、區分要求等諸多因素。劃分等級和確定占比是最為關鍵的兩步,它們共同決定了分數轉換的標準尺度和區分力度,需要專業人士的廣泛參與,包括作文評測和建模測量兩類專家的合力共建,并且還需要經過反復實驗和反復檢驗。依據中考作文評價的特點而建立的科學可靠的數學模型就是一套成熟的等值轉換的評價系統,也正是“二選一”文題評價所缺失的糾偏機制。有了這套系統,計算機便可以依據標準將原始分重新科學賦分。唯其如此,“二選一”文題評價才能真正邁入科學與公平的康莊大道。
參考文獻
[1] 葉麗新.讀寫測評:理論與工具[M].上海:上海教育出版社,2020:220.
[2] 楊志明.完善新高考學業水平等級考試賦分方案的三種策略[J].教育測量與評價,2018(12):5-10.
[3]? 程偉,王雨欣.新高考選考科目賦分方式的比較分析[J].河北師范大學學報:教育科學版,2020(01):28-32.
[4] 中華人民共和國教育部.教育部關于普通高中學業水平考試的實施意見(教基二[2014]10號)[Z].(2014-12-16)http://www.moe.gov.cn/srcsite/A06/s3732/201808/t20180807_344610.html.
該文為江蘇省2020年度“333”工程科研資助課題“基于思維品質提升的統編初中語文教材寫作教學研究”(BRA2020099)的研究成果