高繼偉,陳紅君,王垠杰,費(fèi)金有
(1.長(zhǎng)春師范大學(xué)物理學(xué)院,吉林長(zhǎng)春 130032;2.中國(guó)人民解放軍軍事經(jīng)濟(jì)學(xué)院,湖北武漢 430000;3.吉林師范大學(xué)物理學(xué)院,吉林四平 136000)
?
論TIMSS和PISA科學(xué)教育評(píng)價(jià)及其對(duì)我國(guó)科學(xué)教育的啟示
高繼偉1,陳紅君1,王垠杰2,費(fèi)金有3
(1.長(zhǎng)春師范大學(xué)物理學(xué)院,吉林長(zhǎng)春 130032;2.中國(guó)人民解放軍軍事經(jīng)濟(jì)學(xué)院,湖北武漢 430000;3.吉林師范大學(xué)物理學(xué)院,吉林四平 136000)
教育評(píng)價(jià)是全球教育都關(guān)注的一個(gè)重要問題,目前國(guó)際上大規(guī)模的評(píng)價(jià)體系有TIMSS和PISA,這兩種教育評(píng)價(jià)吸引了全球很多個(gè)國(guó)家參與。本文對(duì)歷屆TIMSS和PISA進(jìn)行分析和整理,對(duì)素質(zhì)教育的有效實(shí)施和新課程理念的培養(yǎng)有非常重要的作用。對(duì)TIMSS和PISA測(cè)評(píng)的評(píng)價(jià)目的、對(duì)象、周期和理論模型進(jìn)行比較,對(duì)TIMSS和PISA的測(cè)試框架和測(cè)試題目著重進(jìn)行分析,最后提出TIMSS和PISA給我國(guó)教育評(píng)價(jià)帶來的的啟示。
TIMSS;PISA;測(cè)試框架
1.1 TIMSS評(píng)價(jià)
TIMSS是20世紀(jì)60年代和80年代國(guó)際教育成績(jī)?cè)u(píng)估協(xié)會(huì)IEA組織的第一次、第二次國(guó)際數(shù)學(xué)和科學(xué)測(cè)評(píng)之后,與1995年舉行的第三屆國(guó)際數(shù)學(xué)與科學(xué)研究(Third International Mathematics and Science Study)的簡(jiǎn)稱。在此之后,國(guó)際數(shù)學(xué)和科學(xué)研究學(xué)會(huì)每四年召開一次,所以在1999年,這項(xiàng)活動(dòng)被稱為TIMSS-R或TIMSS-REPEAT。在2003年,TIMSS也成為國(guó)際數(shù)學(xué)和科學(xué)趨勢(shì)研究(Trends in International Mathematics and Science Study)的簡(jiǎn)稱。TIMSS評(píng)價(jià)每四年舉行一次,分別在1995、1999、2003、2007、2011年舉行,這項(xiàng)活動(dòng)參加的國(guó)家以及地區(qū)分別有美國(guó)、英國(guó)、意大利、丹麥、日本、俄羅斯、馬來西亞、韓國(guó)、中國(guó)臺(tái)灣和中國(guó)香港等40個(gè),參與測(cè)試的學(xué)生在60萬左右[1],TIMSS評(píng)價(jià)是國(guó)際上著名的學(xué)生學(xué)業(yè)評(píng)價(jià)項(xiàng)目之一,對(duì)全球教育起到了深遠(yuǎn)的影響。這項(xiàng)活動(dòng)是對(duì)當(dāng)代青少年數(shù)學(xué)和科學(xué)教育的國(guó)際比較研究,給我們的數(shù)學(xué)和科學(xué)教育帶來了很大的啟示。
1.2 PISA評(píng)價(jià)
PISA是國(guó)際學(xué)生評(píng)估項(xiàng)目(Program for International Student Assessment)的縮寫。它是一項(xiàng)經(jīng)濟(jì)合作與發(fā)展組織(The Organization for Economic Cooperation and Development,OECD)統(tǒng)籌的學(xué)生能力的國(guó)際評(píng)估計(jì)劃。該評(píng)測(cè)項(xiàng)目于2000年推出,之后每三年進(jìn)行一次,評(píng)測(cè)主要分為閱讀素養(yǎng)、數(shù)學(xué)素養(yǎng)、科學(xué)素養(yǎng)三個(gè)領(lǐng)域,每一個(gè)評(píng)核周期,都會(huì)對(duì)某一項(xiàng)領(lǐng)域深入評(píng)估,占時(shí)三分之二。其他時(shí)間對(duì)另外兩項(xiàng)進(jìn)行綜合評(píng)估。PISA主要對(duì)于15歲的學(xué)生進(jìn)行,由于他們處于義務(wù)教育階段的末期,所以來考察他們解決問題和終身學(xué)習(xí)的能力。全球參與的國(guó)家和地區(qū)有65個(gè),2006年上海提出申請(qǐng),成為第一個(gè)中國(guó)大陸參加PISA的地區(qū)。上海學(xué)生在2009年第四屆國(guó)際學(xué)生評(píng)估項(xiàng)目中,獲得閱讀和數(shù)學(xué)科學(xué)素養(yǎng)第一的成績(jī),在2012年的測(cè)評(píng)中,上海學(xué)生再度以平均分613分居于榜首,深受全球關(guān)注。
1.3 TIMSS、PISA的趨勢(shì)研究
趨勢(shì)研究是比較某個(gè)國(guó)家學(xué)生在每次測(cè)評(píng)中的表現(xiàn),從而得出變化趨勢(shì)。這樣就可以幫助各國(guó)明確當(dāng)前的教育情況,并分析教育情況變化產(chǎn)生的原因[2]。曾經(jīng)有人對(duì)TIMSS1995、TIMSS1999和TIMSS2003的數(shù)據(jù)進(jìn)行了研究,顯示了數(shù)學(xué)和科學(xué)對(duì)國(guó)家經(jīng)濟(jì)發(fā)展的應(yīng)用[3]。但是進(jìn)行趨勢(shì)分析時(shí),由于抽樣方法和測(cè)量誤差決定了趨勢(shì)分析一定要細(xì)心慎重。并且在趨勢(shì)研究時(shí),為了確保想得到結(jié)果的可信度,就一定要對(duì)測(cè)評(píng)工具進(jìn)行嚴(yán)格要求,TIMSS和PISA測(cè)評(píng)題目在每一輪中都會(huì)保留一部分相同題目,被稱之為趨勢(shì)題目(trend item)。這些題目沒有公開,在下一輪測(cè)評(píng)中繼續(xù)使用,這樣可以幫助測(cè)評(píng)的標(biāo)準(zhǔn)不變,對(duì)發(fā)展趨勢(shì)起到良性循環(huán)作用[2]。
1.4 對(duì)科學(xué)測(cè)試題目的研究與比較
岳宗慧和張軍朋在《TIMSS 2011科學(xué)測(cè)評(píng)框架概況、變化及啟示》中強(qiáng)調(diào)在科學(xué)教育評(píng)價(jià)中科學(xué)探究是很重要的,要設(shè)計(jì)不同方式的科學(xué)探究測(cè)試題目。筆者建議測(cè)試題目應(yīng)新穎,讓學(xué)生體會(huì)探究的過程,這樣就可以幫助學(xué)生在探究的過程中體驗(yàn)知識(shí)建構(gòu)的過程[4]。對(duì)于PISA評(píng)價(jià),朱小虎曾在《面向未來的參與能力——PISA“素養(yǎng)”概念的發(fā)展》中指出“計(jì)算機(jī)化測(cè)評(píng)素養(yǎng)”的優(yōu)越性,可以突破傳統(tǒng)的“紙筆測(cè)試素養(yǎng)”,使測(cè)評(píng)結(jié)果更準(zhǔn)確化。賴小琴在《國(guó)際學(xué)生評(píng)價(jià)TIMSS和PISA的比較與反思》中對(duì)TIMSS評(píng)價(jià)和PISA評(píng)價(jià)的設(shè)計(jì)題型和評(píng)分的方法進(jìn)行了比較,說明了大規(guī)??鐕?guó)評(píng)價(jià)的較高要求,體現(xiàn)了測(cè)評(píng)題目的普適性。
TIMSS、PISA評(píng)價(jià)針對(duì)學(xué)生學(xué)業(yè)成就測(cè)評(píng)項(xiàng)目,定義了明確的群體并且進(jìn)行抽樣研究,應(yīng)用的工具也都相似,例如問卷或試題。并且實(shí)施過程都應(yīng)經(jīng)過廣泛的研討,質(zhì)量控制嚴(yán)格并逐步完善。TIMSS和PISA評(píng)價(jià)的測(cè)評(píng)方法類似,這源于它們都屬于大型國(guó)際學(xué)生學(xué)業(yè)的評(píng)價(jià),這兩種評(píng)價(jià)方式都在各自所規(guī)定的范圍內(nèi)進(jìn)行問卷或者試題測(cè)試,并且根據(jù)不同周期的結(jié)果進(jìn)行比較,研究其發(fā)展趨勢(shì)。但是這兩種評(píng)價(jià)方法也在一定程度上存在著不同。下面將通過對(duì)比來分析TIMSS和PISA的基本情況,然后對(duì)測(cè)評(píng)目的、測(cè)評(píng)對(duì)象、測(cè)評(píng)周期和理論模型進(jìn)行深層次的對(duì)比研究。
2.1 TIMSS評(píng)價(jià)和PISA評(píng)價(jià)的基本情況對(duì)比分析
從實(shí)施的組織來看,TIMSS的實(shí)施組織是IEA,而PISA的實(shí)施組織是OECD。從時(shí)間來看,TIMSS評(píng)價(jià)首測(cè)時(shí)間是1995年,每四年一次,分別為TIMSS1995、TIMSS1999、TIMSS2003、TIMSS2007和TIMSS2011五次;PISA的首測(cè)時(shí)間是2000年,每三年一次,分別為PISA2000、PISA2003、PISA2006、PISA2009和PISA2012五次。在評(píng)價(jià)理念方面,TIMSS評(píng)價(jià)理念即“課程是學(xué)生學(xué)業(yè)成就的重要影響因素”。增強(qiáng)學(xué)生對(duì)科學(xué)探究的判別能力,對(duì)現(xiàn)今世界科學(xué)有正確的理解。PISA評(píng)價(jià)理念為“終身學(xué)習(xí)就是一個(gè)人在他的一生中不斷通過學(xué)習(xí)獲得成功的必要途徑”。PISA測(cè)試所要關(guān)注的是學(xué)生應(yīng)用所學(xué)的知識(shí)和技能而解決當(dāng)前實(shí)際問題的能力,并非是考查學(xué)生對(duì)所學(xué)課程內(nèi)容的學(xué)習(xí)狀況。從測(cè)評(píng)內(nèi)容來看,TIMSS測(cè)評(píng)的是數(shù)學(xué)和科學(xué),PISA測(cè)評(píng)的是數(shù)學(xué)、科學(xué)、閱讀和寫作[2]。梁潤(rùn)嬋在《TIMSS、PISA、NAEP科學(xué)測(cè)試框架與測(cè)試題目的比較研究》中對(duì)TIMSS2007科學(xué)測(cè)試框架進(jìn)行分析,顯示各內(nèi)容所占比例,其中生物占35%,化學(xué)占20%,物理占25%,地理占20%,并分析了數(shù)學(xué)和科學(xué)所占題目比例為1∶1。這篇文章也對(duì)PISA2006進(jìn)行了統(tǒng)計(jì),在13個(gè)題組中,科學(xué)題組7個(gè),閱讀題組2個(gè),數(shù)學(xué)題組3個(gè)。通過以上比較初步可知,科學(xué)和數(shù)學(xué)是每個(gè)測(cè)評(píng)都會(huì)進(jìn)行的內(nèi)容,并且所占比例相當(dāng)。體現(xiàn)了各國(guó)對(duì)科學(xué)測(cè)評(píng)的重視[5]。
2.2 TIMSS評(píng)價(jià)和PISA評(píng)價(jià)測(cè)評(píng)目的的比較
無論TIMSS評(píng)價(jià)還是PISA評(píng)價(jià),它們存在的同一個(gè)測(cè)評(píng)目的就是了解學(xué)生學(xué)習(xí)的結(jié)果,即考查學(xué)生現(xiàn)有的學(xué)習(xí)狀況,并在一定程度上激勵(lì)學(xué)生的學(xué)習(xí)興趣。但是二者的評(píng)價(jià)目的還是存在著很大的不同,其中TIMSS評(píng)價(jià)主要是考察各國(guó)學(xué)生在學(xué)校的各個(gè)課程的學(xué)習(xí)成績(jī),這是為了了解各國(guó)的教學(xué)水平和教育方式,從而讓教育水平進(jìn)一步提高。但是PISA評(píng)價(jià)則關(guān)心學(xué)生的終身發(fā)展,通過測(cè)試來體現(xiàn)學(xué)生終身學(xué)習(xí)的能力,為社會(huì)的發(fā)展提供幫助。通過以上分析可以看出,TIMSS評(píng)價(jià)注重了解學(xué)生在校期間對(duì)于數(shù)學(xué)和科學(xué)課程的學(xué)習(xí),而PISA測(cè)量注重學(xué)生通過學(xué)習(xí)對(duì)實(shí)際的應(yīng)用情況。
2.3 TIMSS評(píng)價(jià)和PISA評(píng)價(jià)測(cè)評(píng)對(duì)象和周期的比較
TIMSS評(píng)價(jià)和PISA評(píng)價(jià)的測(cè)評(píng)對(duì)象都是在校的義務(wù)教育階段的學(xué)生,但是TIMSS評(píng)價(jià)的主要對(duì)象是10~11歲的四年級(jí)學(xué)生和14~15歲的八年級(jí)學(xué)生,并且評(píng)價(jià)單位以班級(jí)為單位;PISA評(píng)價(jià)的主要對(duì)象不分教育類型和年級(jí),只要是15歲三個(gè)月~16歲兩個(gè)月的學(xué)生就可以,評(píng)價(jià)單位是以學(xué)校為單位。從測(cè)評(píng)對(duì)象分析來看,TIMSS評(píng)價(jià)關(guān)注學(xué)生的科學(xué)和數(shù)學(xué)課程成績(jī),二者的考察對(duì)象年紀(jì)不同,考察所得的方向就不同[6]。TIMSS和PISA的測(cè)評(píng)周期都是循環(huán)式的,可以從橫向和縱向進(jìn)行比較,TIMSS評(píng)價(jià)對(duì)科學(xué)和數(shù)學(xué)的評(píng)價(jià)是同等的;PISA評(píng)價(jià)分為三種素養(yǎng),但每次都設(shè)一種素養(yǎng)為研究重點(diǎn)[6]。
2.4 TIMSS評(píng)價(jià)和PISA評(píng)價(jià)理論模型的比較
圖1是丹麥技術(shù)協(xié)會(huì)利用“輸入-過程-輸出”模型對(duì)TIMSS評(píng)價(jià)、PISA評(píng)價(jià)的調(diào)查結(jié)果所進(jìn)行的分析。其中,輸入包括教育政策的資源和規(guī)則,輸出包括學(xué)生的學(xué)習(xí)成就,TIMSS評(píng)價(jià)和PISA評(píng)價(jià)均受這個(gè)模型的影響。這兩個(gè)項(xiàng)目用問卷和測(cè)試兩個(gè)方式調(diào)查學(xué)生的學(xué)習(xí)情況,體現(xiàn)測(cè)評(píng)是對(duì)測(cè)評(píng)國(guó)家學(xué)生的各項(xiàng)表現(xiàn)進(jìn)行橫向和縱向的比較,也分析了影響學(xué)生成績(jī)的各方面因素,使教育者和教育決策者更好地進(jìn)行教育改革[2]。

圖1 國(guó)家水平學(xué)生成就分?jǐn)?shù)分析框架
TIMSS和PISA在各自研究領(lǐng)域上各有側(cè)重。TIMSS以數(shù)學(xué)和科學(xué)成就的研究為基礎(chǔ),分析得出影響學(xué)生教育質(zhì)量的因素;PISA不只在意學(xué)生的學(xué)習(xí)情況,還在意教育資源,學(xué)生的發(fā)展等條件。
2.5 TIMSS、PISA評(píng)價(jià)的科學(xué)測(cè)試框架的比較
TIMSS評(píng)價(jià)、PISA評(píng)價(jià)不僅關(guān)注知識(shí)領(lǐng)域,也關(guān)注學(xué)生的科學(xué)認(rèn)知能力和科學(xué)探究能力。測(cè)試框架包括評(píng)價(jià)目的、評(píng)價(jià)設(shè)計(jì)的哲學(xué)基礎(chǔ)、評(píng)價(jià)中各內(nèi)容領(lǐng)域和認(rèn)知能力所占的比重[5]。在評(píng)價(jià)目的方面,TIMSS是測(cè)評(píng)學(xué)科領(lǐng)域的知識(shí)和技能,是對(duì)學(xué)生在課堂上所學(xué)知識(shí)實(shí)施成效的評(píng)價(jià),在教育所規(guī)定的框架之內(nèi)。而PISA是測(cè)試學(xué)生能否掌握和參與社會(huì)所需要的知識(shí)和技能,是在教育所規(guī)定的框架之外的教育所得效果的評(píng)價(jià)。在評(píng)價(jià)設(shè)計(jì)的哲學(xué)基礎(chǔ)方面,TIMSS是在驗(yàn)證課堂上的實(shí)際課程是怎樣被教授的,學(xué)生又能從實(shí)際課程中掌握多少知識(shí);PISA是為了檢測(cè)學(xué)生的終身學(xué)習(xí)能力來進(jìn)行試題檢測(cè)的,目的是為了檢測(cè)學(xué)生現(xiàn)在和將來適應(yīng)社會(huì)的能力。
3.1 TIMSS2011和PISA2009內(nèi)容領(lǐng)域和認(rèn)知領(lǐng)域的比較
TIMSS2011的科學(xué)測(cè)試中對(duì)于四年級(jí)和八年級(jí)內(nèi)容領(lǐng)域是不同的。相比八年級(jí),四年級(jí)的內(nèi)容領(lǐng)域更側(cè)重生物科學(xué);而在八年級(jí),物理和化學(xué)分為單獨(dú)的評(píng)估領(lǐng)域,比四年級(jí)有了更多強(qiáng)調(diào),而認(rèn)知框架是大致相同的。對(duì)于八年級(jí),從內(nèi)容維度來看,各科所占比例分別為生物35%、化學(xué)20%、物理25%、地球科學(xué)20%;從認(rèn)知維度來看,了解所占比例為35%、應(yīng)用所占比例為35%、推理所占范圍為30%[4]。
其中,內(nèi)容維度涵蓋了整個(gè)科學(xué)所包含的領(lǐng)域,而認(rèn)知維度則包括了所學(xué)基本技能的成分。PISA2009包括三個(gè)內(nèi)容領(lǐng)域:閱讀、數(shù)學(xué)和科學(xué),要求學(xué)生培養(yǎng)終身學(xué)習(xí)的認(rèn)知能力。PISA的科學(xué)知識(shí)包括科學(xué)知識(shí)和科學(xué)相關(guān)知識(shí)兩個(gè)方面,所占比例為6∶4,科學(xué)知識(shí)包括四個(gè)方面:物質(zhì)科學(xué)15%、生命系統(tǒng)20%、地球和空間系統(tǒng)15%、技術(shù)系統(tǒng)10%;科學(xué)相關(guān)知識(shí)包括兩個(gè)方面:科學(xué)探究20%、科學(xué)解釋20%。考查的科學(xué)能力包括:確立科學(xué)問題25%、解釋科學(xué)現(xiàn)象35%和運(yùn)用科學(xué)證據(jù)35%[5]。
通過以上的比較可以發(fā)現(xiàn),盡管TIMSS測(cè)評(píng)和PISA測(cè)評(píng)科學(xué)測(cè)評(píng)框架不同,但是其所包含的內(nèi)容和能力類別是相似的。它們的不同之處就在于TIMSS測(cè)評(píng)框架把學(xué)校的教學(xué)目標(biāo)作為標(biāo)準(zhǔn),從內(nèi)容和認(rèn)知能力維度來看都是被教育者所熟悉的,而PISA測(cè)評(píng)則在學(xué)校課程的基礎(chǔ)上更深一步把科學(xué)與實(shí)際相聯(lián)系,更注重學(xué)生在科學(xué)上自身的理解與發(fā)展。
3.2 TIMSS和PISA科學(xué)測(cè)試題目的比較
TIMSS和PISA適應(yīng)多個(gè)國(guó)家評(píng)價(jià),對(duì)題目設(shè)計(jì)要求很嚴(yán)格,題目要考慮到學(xué)生的年齡和地域文化差異,并且還要注重與往年的對(duì)比和長(zhǎng)遠(yuǎn)方向的考慮。TIMSS的題目構(gòu)成主要為選擇題和問答題,其中問答題分為問答和擴(kuò)展問答兩個(gè)方面。選擇題的分值占總分的一半甚至更多。問答題每個(gè)題的分值也不高,主要考察學(xué)生所學(xué)知識(shí)的理解。PISA的題目構(gòu)成同樣為選擇題和問答題,在這基礎(chǔ)上更加細(xì)致地設(shè)計(jì)了簡(jiǎn)單和復(fù)雜的多重選擇題,并且問答題也分為封閉式問答、短答題、開放式問答。相比TIMSS而言,PISA更注重問答題對(duì)學(xué)生的考察,可以對(duì)學(xué)生根據(jù)所學(xué)知識(shí)升華為現(xiàn)實(shí)能力進(jìn)行考察。在評(píng)分方面,TIMSS和PISA相似都嚴(yán)格通過編碼、計(jì)算機(jī)評(píng)分等來進(jìn)行評(píng)價(jià)[6]。
3.2.1 TIMSS和PISA科學(xué)測(cè)試題目的分布及比例
以TIMSS2011為例,測(cè)評(píng)試題分為四年級(jí)和八年級(jí)。其中四年級(jí)的測(cè)評(píng)試題只簡(jiǎn)單地分為生命科學(xué)、自然科學(xué)和地球科學(xué)三個(gè)方面;而八年級(jí)相比較而言就比較細(xì)化,包括生物、化學(xué)、物理和地球科學(xué),表1說明了測(cè)評(píng)試題內(nèi)容分布和認(rèn)知維度。

表1 TIMSS2011科學(xué)測(cè)評(píng)內(nèi)容和認(rèn)知比例
從表1可發(fā)現(xiàn),四年級(jí)相比八年級(jí)學(xué)生而言更注重認(rèn)識(shí)的水平,而八年級(jí)則更注重推理的思維培養(yǎng)。
以PISA2009為例,其在測(cè)評(píng)方面更注重科學(xué)知識(shí)的應(yīng)用方面,更關(guān)注學(xué)生日后的生活能力,所以相比TIMSS,多了一項(xiàng)技術(shù)系統(tǒng)的分析,而且還多了科學(xué)探究和科學(xué)解釋的分析,具體百分比如表2所示。

表2 PISA2009科學(xué)測(cè)評(píng)內(nèi)容和認(rèn)知比例
TIMSS2011 與PISA2009中科學(xué)的評(píng)估題目雖然對(duì)定義稍有不同,但是對(duì)科學(xué)知識(shí)及其應(yīng)用都很重視。由表1和表2中可以看出,TIMSS2011與學(xué)生所學(xué)的課程聯(lián)系很大,評(píng)估方向很明確;而PISA2009則更注重學(xué)生的分析能力和解決問題的能力,更能考察學(xué)生的思維活躍能力以及與生活接軌的能力。
3.2.2 TIMSS和PISA科學(xué)測(cè)試題目不同題型分布及比例

表3 TIMSS和PISA科學(xué)測(cè)試題目類型以及所占比例
在測(cè)試題目方面,大多數(shù)學(xué)生認(rèn)為簡(jiǎn)答題比較簡(jiǎn)單,而多項(xiàng)選擇題來考察的是學(xué)生推理與認(rèn)知的能力,這對(duì)知識(shí)的掌握要求比較高,在表3中可以看到,無論是TIMSS還是PISA,簡(jiǎn)答題所占的比例較少,而多項(xiàng)選擇所占的數(shù)目居多,擴(kuò)展開放題考察的是學(xué)生的拓展應(yīng)用能力,這是知識(shí)的升華,所以在題目總數(shù)中所占的比例也不是很多。相比TIMSS,PISA中具有不同答案的擴(kuò)展開放性題遠(yuǎn)遠(yuǎn)比TIMSS所占的比例大,可見PISA更注重學(xué)生開放性思維的測(cè)試與培養(yǎng)。
3.2.3 TIMSS和PISA科學(xué)測(cè)試題目難度分布及比例
在測(cè)試題目中,無論是題目的數(shù)量還是學(xué)生對(duì)題目情境的熟悉程度,或者題目的陳述方式等都能夠造成試題的難度系數(shù)不同。在TIMSS和PISA在科學(xué)測(cè)試題方面,專家主要提供了推理、擴(kuò)展問答、數(shù)學(xué)技能和文本四個(gè)方面的因素來評(píng)價(jià)題目的難度。如果以0、1、2、3、4代表難度的不斷提高,通過大量的對(duì)比研究發(fā)現(xiàn)PISA的難度遠(yuǎn)大于TIMSS,其中難度最大的四個(gè)難度因素PISA就占了9%,而TIMSS只占1%,難度最小的0個(gè)難度因素,TIMSS占了56%,說明TIMSS一半以上的題目都是沒有什么難度的,而PISA在這部分只占了14%,其它的都是有難度的測(cè)評(píng)題目。
通過以上的分析可以看出,TIMSS和PISA科學(xué)測(cè)試題目的相同點(diǎn)都是與生活實(shí)際相關(guān),注重科學(xué)知識(shí)的應(yīng)用。但是TIMSS測(cè)試題中更注重中基礎(chǔ)知識(shí)的考察,而PISA測(cè)試題則更注重學(xué)生未來在社會(huì)上的發(fā)展,其測(cè)試的是學(xué)生把知識(shí)應(yīng)用到以后的生活中的能力,所以在PISA測(cè)試中,更充分地考察了學(xué)生的實(shí)際應(yīng)用和發(fā)散能力。
4.1 測(cè)評(píng)情境真實(shí)
TIMSS評(píng)價(jià)所考察的是學(xué)生對(duì)學(xué)校課程的思維理解以及基礎(chǔ)的概念性知識(shí)。測(cè)評(píng)在社會(huì)國(guó)家教育、教師課堂教育、實(shí)際課程學(xué)生理解三個(gè)方面進(jìn)行測(cè)評(píng),在創(chuàng)建測(cè)評(píng)情境時(shí)應(yīng)考慮測(cè)評(píng)情境的真實(shí)性。
PISA測(cè)評(píng)這種大范圍的考試是一種專業(yè)性很強(qiáng)的工作。不僅要重視考察的結(jié)果,更要重視整個(gè)測(cè)評(píng)的過程。PISA測(cè)評(píng)所展開的投入程度評(píng)價(jià)在心理和行為兩個(gè)方面要求了學(xué)生積極的參與興趣和參與者投入的時(shí)間以及廣度。在這個(gè)過程中要注重測(cè)評(píng)的真實(shí)性。這樣才可以從測(cè)評(píng)中看到教育評(píng)價(jià)的真實(shí)性和可靠性,讓教育者更好地完善教學(xué)理念和教學(xué)水平,也可以讓學(xué)生從情感、態(tài)度和價(jià)值觀方面全面發(fā)展,起到科學(xué)素質(zhì)的提升作用,真正起到測(cè)評(píng)的作用。
在TIMSS與 PISA測(cè)評(píng)時(shí)都要尊重測(cè)評(píng)情境的真實(shí)性,這樣就可以更好地培養(yǎng)學(xué)生把知識(shí)與實(shí)際相聯(lián)系的能力,將科學(xué)知識(shí)貼近生活情境,培養(yǎng)學(xué)生的學(xué)習(xí)興趣,提高他們的科學(xué)素養(yǎng)。
4.2 多種測(cè)評(píng)方式相結(jié)合
TIMSS測(cè)評(píng)的主要方式是試卷測(cè)試,測(cè)試題目主要源于課本知識(shí),在歷年的改革中也及時(shí)地反應(yīng)出現(xiàn)代科技的發(fā)展,但是單一性的試卷測(cè)評(píng)容易讓學(xué)生產(chǎn)生不良情緒,使測(cè)評(píng)的質(zhì)量下降,因此可以在試卷的基礎(chǔ)上設(shè)置不同類型的測(cè)試方法,例如問卷調(diào)查、師生談話測(cè)評(píng)等。不同的測(cè)評(píng)方式可以讓不同層面的學(xué)生得到全面發(fā)展,而不是單一停留在試卷分?jǐn)?shù)上。
PISA測(cè)評(píng)并不是基于課程的評(píng)價(jià),而是面向未來發(fā)展和終身發(fā)展的評(píng)價(jià)。評(píng)價(jià)要客觀、理性,結(jié)合我國(guó)的教育特點(diǎn),將多種測(cè)評(píng)方式相結(jié)合,通過試卷測(cè)評(píng)、問卷調(diào)查、隨時(shí)考核等方法進(jìn)行全面、符合實(shí)際情境的評(píng)價(jià),有助于我國(guó)教育的進(jìn)一步發(fā)展。
4.3 同時(shí)測(cè)評(píng)基礎(chǔ)知識(shí)和解決問題
我國(guó)一直以來重視以知識(shí)為基礎(chǔ),但是有時(shí)候卻忽略了能力的培養(yǎng)。所以在TIMSS和PISA測(cè)評(píng)中,要將基礎(chǔ)知識(shí)和解決問題相結(jié)合,讓學(xué)生將所學(xué)知識(shí)應(yīng)用到現(xiàn)實(shí)生活中。TIMSS和PISA主要還是通過考試測(cè)驗(yàn)來反映學(xué)生的學(xué)習(xí)成就,在試題選擇方面更多地關(guān)注實(shí)際問題,更接近生活的提問方式。在測(cè)評(píng)結(jié)果分析方面,鑒于各國(guó)的文化差異,應(yīng)要合理、公正地發(fā)現(xiàn)并解決教育中出現(xiàn)的各種問題。上海在PISA2009和PISA2012兩次測(cè)評(píng)中取得包攬閱讀、數(shù)學(xué)、科學(xué)三項(xiàng)的第一名,這說明我們的教育取得了理想的成績(jī)。
[1]吳華志,李欣.TIMSS(2007)科學(xué)測(cè)試認(rèn)知維度分析及其啟示[J].考試研究,2012 (5):69-76.
[2]魯毓婷.全球化背景下的學(xué)生學(xué)業(yè)成就比較研究——TIMSS和PISA[J].考試研究,2007(3):76-92.
[3]Hong,Hee Kyung.The impact of economic development on international mathematics and science achievement:A repeated measures design analysis of Trends in International Mathematics and Science Studies(TIMSS)for 1995,1999 and 2003[C].DAI-A 67/04,2006.
[4]岳宗慧,張軍朋.TIMSS 2011科學(xué)測(cè)評(píng)框架概況、變化及啟示[J].教育測(cè)量與評(píng)價(jià):理論版,2012(12):49-54.
[5]梁潤(rùn)嬋.TIMSS、PISA、NAEP 科學(xué)測(cè)試框架與測(cè)試題目的比較研究[D].桂林:廣西師范大學(xué),2009.
[6]賴小琴.國(guó)際學(xué)生評(píng)價(jià)TIMSS和PISA 的比較與反思[J].廣西教育學(xué)院學(xué)報(bào),2008(2):59-62.
[7]陸璟.PISA研究的政策導(dǎo)向探析[J].教育發(fā)展研究,2010(8):20-24.
[8]王蕾.從PISA試測(cè)研究實(shí)踐的視角看我國(guó)大規(guī)模教育評(píng)價(jià)改革[J].中國(guó)考試,2009(5):17-25.
[9]黃非非.美國(guó)NAEP公民教育評(píng)估發(fā)展研究[D].蘭州:西北師范大學(xué),2011.
[10]李景梅.TIMSS、PISA、NAEP測(cè)評(píng)中物理試題設(shè)計(jì)的研究[D].重慶:重慶師范大學(xué),2012.
[11]王學(xué)男,葉寶生.TIMSS 中科學(xué)評(píng)價(jià)的趨勢(shì)研究[J].基礎(chǔ)教育參考,2010(12):28-33.
[12]Jens Henrik Haahr with Thomas Kibak Nielsen,Martin Eggert Hansen and S ren Teglgaard Jakobsen.Explaining Student Performance Evidence from the international PISA,TIMSS and PIRLS surveys[C].Danish Technological Institute,2005.
2015-06-11
吉林省教育學(xué)會(huì)“十二五”規(guī)劃課題(1251157B)。
高繼偉(1964- ),男,吉林長(zhǎng)春人,長(zhǎng)春師范大學(xué)物理學(xué)院講師,從事課程與教學(xué)論基本理論研究。
G640
A
2095-7602(2015)10-0097-06