潘虹輝+聞建華



【摘 要】在學業測評中,基于師生的共同發展,倡導評價主體參與,研發雙向細目表,建立數據分析平臺,進行學業分析、教學分析和教研分析,找出學校、班級、學科組、教師與學生個體的關鍵的、具體的問題,研究并解決一個個問題,使區域性教學與學業質量的監測與評價發揮其發展性功能。
【關鍵詞】雙向細目表;測評;聚類數據;分析;問題;發展
【中圖分類號】G424 【文獻標識碼】A 【文章編號】1005-6009(2015)22-0010-04
【作者簡介】1.潘虹輝,南京市鼓樓區教師發展中心(南京,210009)質量監測中心[注1]主任,中學高級教師;2.聞建華,南京市鼓樓區教師發展中心(南京,210009)副校長,南京市中學數學學科帶頭人。
測量工具的研發是中小學教育質量監測的重要舉措,是學業評價過程中最為關鍵的環節,它在很大程度上決定了質量監測與評價的科學性和有效性。雙向細目表是一個將“知識細目”和“技能細目”兩個維度有機合成的、頗具實效的測量工具。
基于課程標準的雙向細目表的研發,旨在檢測教師的教學效果、學生的學業成就與課程標準要求的達成程度。它是一個動態的生成過程,其工作紛繁復雜,需要做大量細實的專門研究。就學科測評而言,它包含對知識細目維度的歸類和能力細目維度的界定,表中的縱橫兩列,都會因學科特點、學段、學情、命題要求和制作者的視角而異,如,對試題預設難度系數與實際難度系數匹配度的控制,對學業監測中顯性指標與隱性指標的考察與測量等。
當前,階段性的學業檢測數據,通常用來評價學習結果,是學校進行學業測評的主要依據,也是對教師教學質量進行評估的參考要素。對學校教學質量的分析,常用的數據是平均分、優秀率、合格率、低分率和分數段分布。上述幾項指標,在一定程度上能夠說明學生的整體學習情況和教師的總體教學情況。學校的教學管理者和學科教師,通過班與班的橫向比較、班級學科之間的平衡比較、班級與前幾次考試的縱向比較,可以找出其中教師的教與學生的學之間的差距。
但這樣的數據分析,呈現的是偽問題,只能淺顯地說明某名學生的學習存在問題或差距,也只能顯示某位教師的教學與其他教師出現了偏差,不能分析出真正的、關鍵的問題出在何處,更不能診斷出具體或細節性的問題。
教育評估專家袁益民指出,教育評估工作要更加注重以質量內涵建設內在規律為歸依,更加關注主體性,實現從外生性增長到內生性發展的轉變;關注科學性,實現從行政管理導向到按教育基本規律辦事的轉變;關注人文性,實現從物到人的轉變;關注協調性,實現從量到質、從快到好、從多到精、從點到面的轉變;關注多樣性,實現從簡單劃一的大一統管理到多元發展、錯位發展和創新發展的轉變;關注可持續性,實現從關注當前到關注長遠的轉變[1]。
隨著網絡閱卷在中、高考選拔性考試與評價中的全面推行,許多省、市、區(縣)、校在各級考試中都已實行網絡閱卷,且借助閱卷系統產生大量具體的學生成績數據。在這樣的背景下,對照《教育部關于推進中小學教育質量綜合評價改革的意見》,可以看出,傳統的學業測評的結果呈現與處理方式,已經不利于對測試本身價值的進一步挖掘,不能夠體現“發展是一切教育評價的宗旨”這一根本原則。
相異于原有的學生成績數據分析,有異于應試教育下的終結性評價,我們通過編制基于試卷的雙向細目表,對知識細目和技能細目進行逐項對比,使“聚類數據”[注2]模式下對學業狀況的共性與個性的分析更加細實;對所檢測的知識點、能力維度和試題的信度等進行即時的全面反饋;對學生的學習情況、教師的教學情況、教研組的教研情況、試卷的命題質量等進行多元分析和評價,從真正意義上讓數據發揮作用,過程性地對評價主體、評價目標、評價內容、評價方式和評價過程等進行剖析,側重縱向比較,兼顧橫向比較,從量性評價走向質性評價,使評價結果趨于客觀和全面,對學科組、備課組、教師和學生個體的現狀診斷與后續改進產生積極效應。
在學業測試之前,我們指導參與實驗學校的部分教師制作雙向細目表,對考查的知識細目和技能項目(因學科、學段而異)所占的分值分別進行細化處理,根據學情預設每道題的評估難度。如某實驗校初中數學測試的雙向細目表(部分),見下表。
測試之后,將雙向細目表與網絡閱卷各小題的分值導入數據分析平臺,通過分析平臺,輸出所需相關數據,進行教學分析、教研分析和學業分析。
1.進行教學分析。
數據分析平臺輸出的教學分析數據包括:各班級學科的平均分、優秀率、合格率、低分率和分數段分布,最具價值的是導出百分制等級分和正態化標準分[注3]。這些聚類數據能夠客觀地反映班級和學生個體的學業水平,教師通過比較,可以對班級不同學科之間做出均衡性評價。這樣的分析,能夠避免應試教育環境下分數至上的消極影響,也能夠避免因測試難度不同所帶來的測評結果的負面效應。
如在一次測試中,某實驗校的三個班級的不同學科之間的“正態化標準分”呈現,見下表。
相對于學科均分,正態化標準分能明晰地反映學科之間的差距。以上表中的正態化標準分做橫向比較,可以看出,一班數學的測試結果要比語文和英語兩個學科相對好一些。
如,以兩次測試的同一學科的正態化標準分做縱向比較,則能反映班級的階段性變化,見下表。
如果只看入口成績[注4]與出口成績[注5],很難判斷教學推進情況,但通過正態化標準分做比較,就能清晰地評估推進情況。教師個體借助對教學分析數據的橫向與縱向比較,獲得適切的自我評價;學校教學管理部門基于數據分析,收集并保存可以表明教師個體發展狀況的過程性資料,分析其存在的優勢和不足(包含各班級學科之間的平衡發展狀況),準確判斷其不同特點及發展潛力,形成對其發展過程的適切的認識,提供具有針對性的改進建議,促進學校學科教學的提升與班級學科之間的均衡發展。
2.進行教研分析。
與原先測試項目的成績分析系統相比,基于雙向細目表的學科數據分析平臺有較大的優勢,它能對階段性測試的知識點與技能的具體得分情況作聚類數據對比,在整體上對學科教學狀況,進行深層次的教研分析,為學科組教研活動提供翔實的參照依據。
以測試后的實際難度系數為例,通過數據分析,呈現出以下知識點細目的年級和其中三個班級的得分情況,見下表。
教研分析對學科組(備課組)進行從診斷性評價[注6]到形成性評價提供了非常具體的研討條目。基于相關數據的聚類分析,學科組能夠細致地了解學生對所測知識點的把握和應用情況;任課教師能夠在群體里發現并找到自身的優勢與不足;組內同仁通過類比,借助“同事互動”,獲取共性的亮點,找尋共存的弱項,在認真研究教情和學情的基礎上,及時調整本學科的教學目標、教學容量、教學手段和教學流程,形成發展共同體,改進學科教學。
值得一提的是,學科組要關注學業測評的命題環節。在測試之前,命題者要綜合考慮知識點(基礎知識、重點和難點)與考查技能相互交匯的吻合度。在測試之后,對照雙向細目表中的預估難度系數,學科組要將數據分析平臺輸出的各小題的實際難度系數與預估系數進行比較,對兩者差異較大的測試項目,要判斷這些項目與學情和班情的匹配情況,對測試題進行分析、判斷和評價,落實改進措施。長期以往,這對組內教師學會高質量地命題,提高學業測評的信度、效度和區分度,是大有裨益的。
3.進行學業分析。
學業分析,是學生在教師指導下自主進行的對自身學業狀況做出的比照、思考、診斷和評價。學業分析能夠幫助學生逐漸形成合理的自我認識,認清自己的長處和存在的不足,及時調整,改進學業。基于雙向細目表輸出的聚類數據分析,凸顯其對學生個體的學業評價功能。某學生學科知識點的得分對照情況,見下表。
透過這些數據,教師、學生和學生家長可以對學生個體在所測知識點方面的掌握情況有較為清晰的了解。學業評價可以幫助學生對前期的學習狀況進行總結與反思,為后續的學習找到努力的方向。學生個體通過自主地查漏補缺,找到自身知識點的缺陷,揚長補短,借助師生互動、伙伴互動和有針對性的輔助學習,逐步提升,改進學業。
上述三位一體的評價分析報告,喻示著教研部門注重價值引領、關注過程服務和在學業測評過程中倡導主體積極參與的重要性。正如袁益民先生所言:“今后,要在評估監測項目的定位中更多地關注有利于現代學校制度建設的教育均衡發展、內涵發展和多樣化發展方面的問題;在評估方案的設計中,要突出評估監測的常態化診斷、咨詢和服務功能;在指標體系的設定上要多些兼容性的質性指標,少一些不合理的量化指標;在評估主體的地位方面,要鼓勵被評主體的積極主動參與和其他利益相關人的多元參與;在評估程序、過程和方法等方面,要多一些交流和建議,少一些壓力和高利害的獎懲,使學校真正成為評估的主體。”[2]
需要注意的是,在學業測評過程中,測量工具的研發是一個十分重要的環節。就雙向細目表的制作而言,可以有兩種模式:1.先做表后命題,這主要針對地區性學業水平測試和具選拔性的測試。2.根據試題做表,這是較具普適性的做法,教師根據測試題做雙向細目表,預設評估難度系數,在測試后,對命題質量、教學效果和學業狀況做出客觀評價。還有,在教師根據試題做雙向細目表的時候,對知識點名稱的表達不能太細,要適當概括和歸類,如英語學科,考點太細,做表不可能逐一列出,像考查it,one,that,those等一類詞的用法,就可概括為“代詞用法”;對能力或技能維度的表述,不能生搬硬套布盧姆的六個認知能力層次,要因學科特點和學段特征而異,如數學學科有“證明”,英語學科有“猜測”,語文學科有“鑒賞”,歷史和政治學科有“評價”,初一學段有“書寫”等,這些因素,在對能力維度進行界定時,都是必須要考慮和兼顧到的。
此外,就測評而言,無論是“監測與評價”,還是“檢測與評價”,都要顧及學生認可與接受的程度。如對初一年級的學生而言,他們已習慣了小學階段的教師的有痕閱卷,盡管網絡閱卷對雙向細目表數據的導入帶來了便利,但無痕閱卷卻給學生的自我檢查、教師的試卷講評和家長對孩子的評價帶來了許多不便。這類瓶頸性問題,是學業測評中有待進行專門研究的。
總的說來,雙向細目表的研發及其聚類數據的分析,在學業測評與教學質量監測過程中有著不可低估的效能意義。從宏觀上講,它有利于對基礎教育階段進行較為客觀的學業測評,有利于區域性教研評價和學科基地的建設,有利于信息化、數字化校園的構建,有利于學校的全面發展。從微觀上講,它是教師行動研究的載體,有助于提高教師在教學實踐中自我反思、發現問題、診斷問題、分析問題、研究問題和解決問題的能力;它是學生學習診斷的把手,有助于提高學生在學習生活中自我評價、自我認識、自我改進和自我完善的能力;在師生和諧的教學情境中,構建促進教師自覺發展和學生自主發展的學習共同體。
【注釋】
[1]2014年2月,南京市鼓樓區教育局率先成立全國首家區、縣級教師發展中心下設的質量監測中心,旨在建立評估的指標體系,實施監測工作,進行動態監測,進行診斷、矯正和引導,進行科學監測與評估,發布評估結果,推廣經驗成果。
[2]聚類數據:聚類是把相似的對象通過靜態分類的方法分成不同的組別或者更多的子集,讓在同一個子集中的成員對象都有相似的一些屬性。聚類數據是對于靜態數據分析的一門統計技術,在許多領域得到廣泛應用,包括學習檢測、數據挖掘、模式識別、圖像分析、生物信息等。
[3]正態化標準分是通過非線性轉換的技術,把偏態分布強制扭轉成正態以后,每個原始成績對應的標準分。正態化標準分遵循的使用原則是不同的測驗分數可以相互比較,包括學科之間,或同一學科不同考試可以比較。
[4]入口成績:對比兩次考試成績,前一次的稱為入口成績。
[5]出口成績:對比兩次考試成績,后一次的稱為出口成績。
[6]診斷性評價:在教學活動開始前,對評價對象的學習準備程度做出鑒定,以便確定教學內容的起點和進度,采取相應措施使教學計劃順利、有效實施而進行的測定性評價。診斷性評價的目的是了解學生是否具有達到新的教學目標所必需的基礎知識和技能,設計出可以滿足不同起點水平和不同學習風格的學生所需的教學方案,并分別將學生置于最有益的教學程序中。
【參考文獻】
[1]袁益民.教育“質量”:是質性特征,還是量化程度[J].高教發展與評估,2012(05):29-32.
[2]袁益民.教育評估改革:以學校為主體,以質量為核心,以服務為導向[J].常州大學學報:社會科學版,2014(01):1-4.