吳潔明,陳 佳
(1.2.梧州學院 計算機科學系,廣西 梧州 543002)
基于試卷質量分析的計算機基礎題庫建設實證分析
吳潔明1,陳 佳2
(1.2.梧州學院 計算機科學系,廣西 梧州 543002)
考試的功能在于反饋和矯正,通過試卷分析,對考試命題的能力、學生掌握情況有更清醒的認識。在論述試卷質量分析方法的基礎上,對基于試題庫的“計算機文化基礎”期末考試從試卷總體、模塊、單個試題三個方面進行了定量分析,利用分析結果指導題庫建設。
試卷質量分析;試題庫;計算機基礎
“計算機文化基礎”是高校面向非計算機專業新生開設的一門信息技術應用基礎課程,其學生人數眾多,影響力大,是受益面最廣的一門計算機基礎課程,對學生后繼專業基礎課和專業課的學習,對培養學生的科學素養和全面素質起著重要的基礎性作用。梧州學院對于該課程的教學也在不斷地進行改革,充分利用現代教育技術與網絡資源,構建網絡教學平臺,采用網上考試系統在線考試。好的考試需要一套好的題庫作支撐,有足夠多的優質試題為基礎,盡可能減少偏題和怪題。試題庫不是題目堆積的倉庫,不能簡單地將某一科目的練習題或考試題收集到計算機中形成試題庫。優質的題庫對規范教學行為、提高教學質量的推動作用是顯而易見的。
以往該課程的考試,由任課教師自行命題,教師往往依靠個人的經驗,不同教師所出的試卷難度相差較遠。建立試題庫后,從規范、標準的試題庫中篩選、組合出符合要求的試卷,實現教考分離,有效地避免任課教師命題的盲目性和隨意性,使命題更加科學與規范化。試卷的評定由計算機自動評分,杜絕了舞弊、加“人情分”現象的出現,體現考試的公正性和客觀性,從而提高教學效果評價的科學性,對加強教學質量的宏觀監控有重要意義。
在傳統的考試中,教師要準備一次考試,從搜集資料開始,選考題、考試、閱卷到最后統計分數,工作量十分繁重,其中不可避免地存在大量重復勞動,工作效率比較低。隨著考試要求的不斷提高,工作量將會越來越大,而且非常容易出錯。建立試題庫,能夠將任課教師從繁重的命題工作中解脫出來,客觀題完全由評分系統自動完成,打破了傳統考試的舊模式,減輕了教師的工作負擔,提高了工作效率。
傳統的考試中,教師考前劃分范圍,圈出重點,致使部分平時不努力學習的學生考前找同學抄筆記、突擊背題,就能輕松過關,有的分數還不低。這種投機取巧的現象,不利于學生對課程知識的掌握,極大挫傷了廣大學生學習的積極性。建立了題庫后,試卷由計算機自動生成,知識點能夠涵蓋課程的大綱要求,減少了猜題命中率,這必然促使學生加強平時學習的主動性。
考試實際上是一種教育測量,是衡量教學效果的最主要方式之一,測量結果只有客觀的才是可靠的。高質量的試題是實現高質量考試的前提。根據教育測量學的理論,目前,衡量試卷質量的指標主要有:難度、區分度、信度和效度。其中,信度和效度主要用于試卷總體分析,對于單個試題來說,則主要分析其難度和區分度。本文重點分析難度和區分度這兩個指標。
難度是指試題的難易程度,主要是利用考生總體的得分反映試卷難易程度的檢驗指標[1]。對于單個客觀題,其計算公式為:Pi=Ri/N,其中Ri為答對該題的人數,N為考生人數。對于一份試卷的總體難度,則用公式P=X/W 來計算,其中X為試卷的平均分,W為試卷滿分值。一般來說,平均分過高,表明試卷難度低,平均分過低,表明試卷難度高。難度水平的確定是為了篩選題目。
區分度是對不同考生實際水平的鑒別程度。區分度高的試卷,能較好地反映考生的實際水平。對于單個客觀題,其計算公式為:Di=Phi/Pli,其中Phi為高分組該題的通過率,Pli為低分組該題的通過率。一份試卷的總區分度,其計算公式為:

其中Di是第i題的區分度,Wi是第i題的分值,W是試卷滿分值。美國測驗專家R.L.Ebel根據長期經驗提出了區分度的評價標準:D≥0.40評價為優良;0.30≤D≤0.39評價為合格;0.20≤D≤0.29評價為尚可;D≤0.19評價為較差,題目應淘汰[2]。
信度是指考試結果穩定性、可靠性的指標,常用克龍巴赫系數法[3],計算公式為:

其中n為試卷的試題總題數,si2是所有學生在第i題的得分方差,s2是學生總分的方差。期末考試教師自編的試卷,信度通常要求達到0.7,其值越接近1,表明試卷的可靠性越高。
本文以梧州學院2008機械制造及其自動化專業1班、2班為分析對象,由于學生在校期間必須參加全國高校計算機聯合考試(一級),所以計算機文化基礎的試題與全國高校計算機聯合考試筆試試題的構成相同,共分為基礎知識、操作系統(含網絡)、文字處理、電子表格、數據庫五大模塊,每個模塊的題量和分值也完全相同。在題型的設定方面,主要由選擇題組成,試卷共82個小題,詳見表1。

表1 計算機文化基礎試卷組成結構
本次考試共有80名學生參加,最高分為96,最低分為59.5,平均分78.5,及格率98.8%。試卷的總體難度值為0.785,試題難度適中。試卷的總體區分度為0.365,信度為0.802,表明這是一份合格的試卷,成績能真實反映學生的實際水平,試卷可靠。
由于各模塊的知識點相對獨立,在實際教學中也是采用模塊化教學方式,本文也按模塊計算其平均分、得分率、標準差、方差等各項指標,結果如表2所示。

表2 各模塊的統計參數
上述5個模塊,難度值在0.684-0.808之間,難度適中,但模塊四和模塊五的得分率低于前三個模塊,說明學生對電子表格、數據庫相關知識的掌握略差于對計算機基礎知識、操作系統和文字處理這三個模塊。由于前三個模塊在課堂講授中是位于前面的章節,學生有較多的時間去學習,而且日常應用也多,如操作系統的操作和WORD文字處理。學生平常對電子表格和數據庫的應用不多,較難理解相應的知識。模塊的難度值與這也有一定的關系。
5個模塊的區分度均大于0.3,表明本次考試區分度合格,其中模塊五的區分度大于0.4,達到優良等級。
本次考試,題目均從題庫中選取,為了考察單個試題的質量,本文對試卷的82個小題還分別進行了難度和區分度的分析,其中難度統計數據見表3,區分度數據見下頁表4。

表3 試題的難度統計表

表4 試題的區分度統計表
從表中可以看出,區分度≥0.3的試題有48個,試題優良題率(區分度≥0.3的題量占總題量的比例)為58.5%,有34個題目的區分度≥0.4,題目質量為優秀,應繼續保留在試題庫中。第2題等13個題目的區分度過低,屬于要在題庫中修改或被淘汰的題目。
難度值在0.8以上是容易的題目,難度值低于0.5的是難題。本次考試中,難題和容易題目的比例分別為11%和35.4%,得分率≥90%的題目有14題,占總題量的17.1%,得分率≤40%的題目有6題,占總題量的7.3%,比例適中。
總的來說,本次考試試卷質量較好,能真實反映學生的實際學習水平,但個別題目還需要在題庫中修改。考試是檢查教學效果、檢驗教學質量的重要環節,在教學質量評價中占據重要地位。以試題庫為基礎的考試,其教學質量的測定更科學,具有較高的可信度,與傳統的考試相比有明顯的優勢。每次考試后進行試卷質量分析,可以獲得相關的分析數據,為積累優質題目、改進試題庫提供科學依據。
[1]史東甲,余宇峰.試卷質量分析方法及其應用[J].內江科技,2007(1).
[2]戴海崎.心理與教育測量[M].廣州:暨南大學出版社,2004:117-118.
[3]王麗,張利慶.基于教學管理信息系統的試卷評價指標設計[J].黑龍江教育,2006(10).
G642
A
1673-8535(2011)02-0083-04
2011-02-20
新世紀廣西高等教育教學改革工程項目(2009B089);梧州學院教育教學改革工程項目(wyjg2009A005)
吳潔明(1959-),女,廣西藤縣人,梧州學院副教授,研究方向:軟件工程與計算機應用。
陳佳(1982-),女,重慶大足人,梧州學院講師,研究方向:信息安全與圖像處理。
高 堅)