
[摘要]為解決教學一線小學信息技術課程虛設、課程質量缺乏監控等問題,文章從文獻研究與廣州市白云區實踐出發,闡述了目前信息技術學業終結性評價的主要方式和存在問題,用實證研究法構建了小學信息技術終結性評價FMA模型,并對其評價標準、操作方法進行介紹,最后通過數據案例反映該評價模型的操作性及信度和效度。
[關鍵詞]終結性評價;評價模型;小學信息技術
[中圖分類號]G40-057 [文獻標識碼]A [論文編號]1009-8097(2011)05-0040-06一 研究背景
近十年來,政府在教育信息化不斷投入,給學校配備了計算機室及網絡設施設備,在一定時期內解決了義務教育信息技術課程開設的硬件設施問題,在信息技術課程學習上促進了城鄉學生的教育公平。但是,在學校實地調研中筆者發現:在城鄉二元化結構特征的區情下,由于小學學校數量多、設備維護更新不足、專業師資貧乏,學校發展不均衡、信息技術課程不受重視等因素,造成課程的普及程度和課程質量差異很大,虛設課程表、課堂“放羊”以及低效教學現象較為普遍;同時,較多民辦小學由于老板不配備或不更新設備,使較大數量的外來工子弟未能享受到信息技術教育或較規范的信息技術教育。
基于信息技術課程落實和課程質量發展的需要,在區域對小學生學業監測具有一定自主權的條件下,需要對小學信息技術課程建立學業質量評價體系。因此,筆者旨在通過小學信息技術的終結性評價研究,構建評價模型及其操作體系以加強課程實施的監督和課程質量的診斷,同時導向課程的有向發展,也期待在教育信息化建設績效評估上成為可作為的指標參數之一。二 研究綜述
終結性評價,是學業評價方式的一種,是診斷課程質量的重要方式。筆者進入中國知網進行文獻查詢,發現教育工作者對信息技術課程的評價研究開始于2002年,2009年之后明顯增多,如圖1。
其中,對高中信息技術教育評價的研究點相對較為豐富,包括總結性評價、過程性評價等不同評價分類下的研究,以及電子檔案袋、考試系統開發等支持性手段的研究,相比之下,初中小學對評價的研究點較少、研究不夠深入,這與十年來三個學段課程實施現狀及教師專業化程度較為相符。關于小學信息技術評價的文章共有37篇,主要集中在基于課堂的過程性評價,沒有關于終結性評價的研究。
自2004年新課程實施以來,初高中終結性評價主要采用紙筆測試、非紙筆測試及“紙筆+非紙筆測試”三種。其中,通常把非紙筆測試稱為無紙化考試,形式也是多樣的,有上機操作、作品設計制作、項目型任務以及其他各種形式的開放性考試等。高中教師在開展學分認定工作、初中教研組織部門開展學業評價時,采取這些測試形式一種或多種的組合來評價學生的學業水平。例如云南楚雄洲牟定縣楊彬老師作為教研員從06年開始組織本縣各區開展這幾種終結性評價的實驗,對山區、城區采用不同的評價方式,例如對山區學校硬件條件不足而因地制宜地采用“筆試+作品考試”的方式,對于小學的評價研究具有一定的參考作用。
另外筆者在互聯網上搜索關于小學信息技術質量抽測實施方案,發現近2年來在實踐中有部分地區借鑒初高中終結性評價方式作用在小學上,筆者選擇其中三種評價方式進行對比,發現它們較不符合本研究的需要,見表1。
英國信息通信課程GCSE(Generral Certificate 0fSecondary Education,普通中等教育證書考試)是評估學生成果的手段,它的試題基本上是以信息技術在現實生活中的應用為依托進行的,采用紙筆測試,通過試題描述創設過程化的情境,喚醒學生操作和問題解決的體驗,是考查較長階段學習之后的信息技術綜合素養。筆者認為它人性化和過程化的設計思想很值得借鑒,但是同時,筆者也認為它較適宜用于學段性的終結性評價,不適用于國內學期質量監測,特別是不適用于小學階段、且起點較低的區域。
在評價實施的操作管理上,個別新課程實驗省,例如海南和山東省,以信息技術課程納入會考、高考科目的方式。保障了課程的正常開設,一定程度上促進了地方信息技術課程的發展。但總體而言,無紙化的考試方式在考核目標上劃分為知識目標和技能目標兩個方面,并且較為強調操作技能,對“過程與方法”和“情感態度價值觀”的關注仍然較少。
綜合文獻研究與實踐分析,結合小學生心智特點,筆者定位于基于真實軟件系統環境下的操作測試,試題設計依托軟件基本工具但基于學生生活體驗設置半開放式微型作品考查學生基本操作和方法技能。同時也考慮到,對于城鄉差異大的復雜區情,采取一把標尺、一套評價指標工具、一刀切操作,與目前城鄉硬件設施差異大、設備淘汰更新進程不一的現實不符,未能實現科學、客觀衡量的目標。鑒于區域教育信息化發展的差異性和課程質量發展不平衡的現狀,筆者意圖建立一種面向區域實施的結性分層評價模型。三 小學信息技術終結性評價模型構建
1 模型構建的基本原則
作為課程質量評價,要符合國家信息技術課程理念及地方小學信息技術課程指導綱要精神,要能診斷和反饋結果信息,提供改進發展的機會,要實現學業的水平性要求和學生信息素養能力層次發展的雙贏。
本評價模型除了體現評價的科學性、目標性、導向性、激勵性等內涵原則外,還遵循以下三個原則:
(1)評價客體的人本性原則。人本性是指以人為本,以學生接受教育和信息素養發展為根本需求,以教師在其所處條件下可行的課程目標為依據,促進師生的主體發展。
(2)評價目標的層次性原則:層次性是指針對不同學片硬件條件不一的學校建立分層評價等級,對不同層次學校、不同信息技術學情起點的學生建立層次性評價標準,能夠診斷和反映操作性與創造性的能力差異。
(3)評價實施的操作性原則:操作性是指要便于評價實施的操作,是滿足不同層次學校硬件條件、師資專業技術水平下、學校人力安排下可實現的檢測評價,是數據有可比性的檢測,是盡可能保持教學目標與評價目標一致性的檢測。
2 評價等級模型構建
依據能力發展的規律和分層評價的理論以及因地因人施測的現代考試理論,筆者借鑒企業的IT評估模型,建立了樓層式評價(Floor Mode Assessment)模型,簡稱FMA模型,如圖2所示。

(1)樓層式等級設置
用A級別代表學校能夠落實課程,保障課時,規范開課。對正常開課學校的學生水平情況設置5個評價等級,由低到高分別用lA至5A來標注。其具體含義及描述如下:
1A級(初始級):表示處于起步嘗試階段,懂得一些基本操作,但未形成穩定技能。
2A級(基本級):開始形成一些技能反應,有一定的穩定性,但止于一些簡單、固定的基本操作。
3A級(適應級):達到目標水平性層次要求,各模塊技能較為均衡,操作較為熟練和穩定。
4A級(技能級):操作能力構建較為全面、完善,操作熟練,能針對問題的變式作出適應和調整。
5A級(創造級):應用融會貫通,并能夠根據問題情景調用知識技能,綜合原用素質能力實現創新。
用地下三層等級的會意表示非正常開課學校的課程質量情況,分別標注為B、c、D級。其具體含義及描述如下:
B級:開課不穩定,學生學業情況不完整,學生學業情況較差,未實現評價要求。
C級:隨意開課,教學內容不達綱要標準,學生學業情況不完整,未實現評價要求。
D級:完全不開課,學生學業情況為零,未實現評價要求。
B至D級主要用于評價一些薄弱民辦學校和虛設課程的學校,而處于設備更新改造合理階段的學校暫不作為評價對象。
(2)水平性等級
1A級僅是開課起步的初始級要求,適用于評價信息技術學情較薄弱的、或設備到位較晚的偏遠農村學校,2A級是經歷了一個階段課程學習后設置要求,3A級是規范開課,在較長時間內穩定學習的要求。因此,將3A級設置為基于地方課程目標的水平性要求,圍繞市統編教材及其難度設置評價標準。所以,1A級和2A級為低于地方課程水平要求,4A級和5A級為高于地方課程水平要求,而且用于評價特有的學生能力素質。四 小學信息技術終結性評價模型的操作
1 評價標準
針對FMA評價模型,以內容模塊為單位、按難度等級為層次為各模塊建立評價標準。以“用Windows畫圖軟件畫畫”為例,建立評價標準如表2。
對應不同等級層次的評價標準,試題命制的時候會有較明顯的不同:1A級和2A級側重于考查基本知識與基本技能;3A級和4A級在考查基本技能的基礎上,還適當考查技能組合及情景應用的能力;5A級是考查學生信息處理的綜合素質,包括其技能方法和創造能力。另外,1A級和2A級只考查觀察模仿能力,3A級和4A級滲入一定程度的開放性創作,5A級則完全考查開放性創作能力,可見各個水平等級體現不同的能力差異。
2 設置評價等級
利用FMA模型進行評價操作時,設置為“統一制”、“全可選制”和“半可選制”?!敖y一制”是指全體抽測樣本按統一評價等級試題難度進行檢測,
“全可選制”是指每個學生可以自由選擇評價試題難度等級,“半可選制”是指組織評價單位指定了某類學校的難度區間,學生在難度區間內可選,例如規定省市一級學校要使用3A至5A級難度套題,區一級學校使用3A級難度套題,非等級學校使用1A-3A級難度套題。
3 選取被評價對象
在學生學業的終結性評價中,評價的主體是學校的教師、學片的教育業務及教育行政領導;評價的客體,即被評價對象,是該學校或學片的小學生。評價客體的選取,可以是該年級學生全樣,也可以是按年級取樣。取樣的時候,可以是以班級為單位取樣,或者以學號為單位抽號取樣。
4 評價的檢測操作
(1)內容模塊
按開課年級及其對應的知識技能模塊設定檢測內容選取,包括中英文錄入、計算機操作系統基本操作、畫圖軟件的使用、文字處理與小報排版、因特網的基本使用。這些模塊按課程編排分布在各個學期,按學期內容進行抽測。
(2)檢測方式
以計算機對信息處理的上機操作情況作為檢測方式,使用統一的文字錄入測試軟件測試出中英文錄入成績,使用真實操作環境作為操作系統及應用軟件的技能檢測環境。
(3)試題命制
試題命制,由教研員圍繞課程指導綱要及地方課程目標編制檢測的雙向細目表,根據檢測內容模塊的特點擬定題目、題號、題量,融合基本操作、應用情景及問題解決等設計理念。
(4)評改方式
對于畫圖、小報制作等模塊測試,需要人工評改,由教研部門組織任課教師集中評改,每2人一組,對于1A至4A級題目按照評卷給分細則進行匿名評改,對于5A開放性作品,依照作品評價指標進行評價。
(5)評價成績制
采用100分制,由各個知識技能模塊分數組合折算而成,按題號及知識點等記錄得分情況,作為質量分析反饋的數據材料。學生的期末成績最終表現形式為等級制:A、B、C、D,還標上難度等級標志,如:4A-A,即4A級難度的A級成績。五小學信息技術終結性評價模型的實證案例
開展該評價模型及其操作模式在區域性期末質量檢測中的實驗,驗證其評價操作的效度和信度,經過2005年至2008年的實驗嘗試,于2009學年開始在本區域正式實施使用。
1 檢測率與缺考率的數據比較
2010學年下學期對全區七個學片學校抽取四年級一個班進行檢測,全區187所小學,公辦小學105所,民辦小學82所,能夠正常參與抽測的學校129所,缺考58所,其中,參加檢測與缺考的公民辦學校比例情況,如圖3。缺考學校所處等級的比例情況如圖4,相比2009學年上學期,處于C級的學校數大為減少,增加了17.24%的學校更新計算機室設備,而計算機室處于癱瘓狀態而沒有開設課程增加到75.86%。


2 統一制檢測下的學片內公民辦學校數據比較
2010學年上學期五年級抽測:T學片五年級學生數8831人,抽測有效人數1667人,樣本率18.9%,學生成績A、B、c、D等率及平均分情況、公民辦學校比較見表3。
公辦學校抽測樣本率遠遠高于民辦學校的樣本率,公辦學校的抽測數據一定程度上能夠反映出學生信息技術學業水平:民辦學校的可抽測樣本率較低,可以反映出民辦學校不開設課程的實際情況。
3 統一制檢測下的城鄉學片同類學校數據比較
2010學年下學期抽測:對z學片(農村)和Y學片(城鄉結合部)學校的四(2)班抽測,抽測數據統計如表4。
兩個學片學生學業成績A、B、C、D等級分布相近,但D成績的比率都比較高。同時,在相同平均分下,Y學片的標準差比z學片的標準差要小,反映出城鄉結合部學片學生信息技術學業差異度對比農村學片小,說明農村地區信息技術學業情況優質與薄弱之間的落差大于城鄉結合部學校。
按公民辦、省市級學校進行分類比較,見表5,省市一級公辦學校的信息技術學業成績沒有突出表現,反而明顯落后于普通學校,例如省一級學校D成績比率達45.1%,有個別學校D成績的比率還高達90%,這說明該所省一級學校在信息技術課程開設、課時保障和教學重視程度上可能存在問題,需要實地調研跟蹤。六 研究結論與思考。




1 研究結論
(1)評價模型及其評價標準操作性強,有信度
以評價模型為核心建立的評價標準及其測試操作模式依托本行政區域開展,植根于常規期末質量檢測工作,進行評卷并反饋檢查結果;該評價模型及操作模式的構建及每年試題命制均為筆者,確保了相關試題處于同一風格和同一檢測水平;該模型操作性強,調控及時,數據收集真實。通過三年試點學校實驗和兩年區抽測實驗,本區域18個街鎮、合計7個學區共180多所小學被予以抽測試驗,約100所公辦學校、30民辦學校為有效檢測數據。同時,該評價模型及操作模式得到本區一線教師的實踐認同,作為實踐成果推廣使用。
(2)評價模型反映質量現狀,有效度
評價模型及其評價標準對小學信息技術課程各模塊內容進行目標性檢測,能夠量化檢測樣本的學業質量情況及在區域群體中的位置,評價較有效度,對開課隨意的現象有較好的督促,能夠診斷出不保障課時及虛設課程表學校的情況,對學業質量有較好的導向和調控作用。
2 研究反思
FMA模型在實踐操作時,先后實驗過“全可選制”、“半可選制”和“統一制”,發現使用統一制操作能夠有效地進行橫向和縱向比較學生的學業狀態,但是在使用“全可選制”和“半可選制”檢測試驗的時候,遇到了三個難題:
(1)各校的分數競爭意識濃,用成績分數來考核教師業績,致使教師選取檢測等級時比較保守;同時,即使是較好的學校和學生都愿意選低不選高,目的是拿高分,普通學校更甚,致使較多的學校學生不選取4A和5A級進行測試,使用了4A和5A級測試的學生測試樣本較少。
(2)評價水平等級分布有5級,題目命制、質量分析的工作量加大,4A和5A級測試樣本較少,不同等級測試學校如何進行橫向比較還沒有找到關于指標比例的解決方法。
(3)5A級題目考查的是學生的信息技術綜合素質能力,但對地學生的開放性作品評價,仍然帶著不同評價人的明顯差異,對評價信度有一定影響。結束語
建立FMA小學生信息技術終結性評價模型,在宏觀上,對自上而下的課程學業水平考查而言,實施分層評估;在微觀上由教師對照評價標準進行內部自我導向、自我調整而言,實施學業的分層評價,促進學生信息素養目標的實現,利于教師專業成長和課程發展。如何使FMA模型趨利避害使師生更好地發展信息技術技能和創新實踐能力,筆者將在下一階段對其“全可選制”和“半可選制”的評價機制開展進一步研究。