陸一 林珊 陳嘉

摘 要:過去對本科教學質量的評價注重教學設計、教學模擬與課程建設,對實際教學過程中的師生互動與學生的學情關注不足,屬于偏重靜態的評價。本文提出了大學教學質量的動態評價觀念與方法,基于大規模數據的學生反饋和教育學專業性編碼轉譯,為每門課程提供教學“體檢報告”,賦能教師改進教學,提升學習效果,促進形成全校合力重視教學的氛圍。
關鍵詞:教學評價;教學診斷;高能課;學習投入
提升大學課程質量取決于兩個層面的努力,一是課程建設,二是教學實施過程。過去,不論是政府主導的外部評估,還是院校內部的自我評估,對課程質量的評價均側重課程建設,只關注課程設計以及教師對這套設計的貫徹能力,而不考慮教學過程中學生的參與。然而,教師教學不是單向的講授,學生在課程教學中不僅僅是在場的觀眾,而是足以影響教學實施過程、決定教學效果的重要參與方,應該被理解為能動的群體。
近五年來,我們團隊先后在復旦大學、北京大學、清華大學、武漢大學、中國海洋大學、北京航空航天大學等高校開展了通識核心課程、大類基礎課程、思政課程的教學質量監測、診斷與評估的研究。本文圍繞教學質量評價問題,首先分析幾種既有測量評價手段的不足與偏差,進而明晰教學各方恰如其分的權責關系,提出了符合中國大學實際情況的課程教學質量評價方法。
一、現行評教的缺陷與誤用
1.學生評教的失效與反效果
目前大學教學質量的評價手段包括學生評教、領導評價、教師自評、同行評價等。學生評教因其便捷有效,且學生是教學的主要接受者而被廣泛使用[1]。學生評教是指學生對教師課堂教學進行打分,分數的平均值和排名代表著教學質量和效果。管理部門基于這些數據認定教師教學工作業績,并實施獎懲。
學生評教方式已經暴露出越來越多的問題。首先,大多數學生評教問卷缺乏測量的科學性、專業性和針對性,無法適應當前教學方式和師生關系的新變化。問卷設計的缺陷導致學生敷衍填答,缺少區分度[2]。其次,問卷存在問題過于籠統、概觀、指向不明和過于注重滿意度等主觀感受的缺陷[3],學生的判斷能力存在局限[4]。在課程教學過程中,學生無法做到統攬全局,不論其滿意還是不滿意,都不能等同于教學質量的優劣。師生關系不是服務員與消費者的關系,應用滿意度模型工具相當于借管理之權威異化師生關系。再者,學生評教只起到了警告或懲罰排序在末位5%左右的教師的作用,缺少激勵措施,更無法幫助和支持大部分教師優化教學。大多數教師不知道學生具體的學習感受和學習收獲——“不知道”導致無從改進。管理層無法通過學生評教分數了解教師的具體教學情況,導致教學管理工作只能局限于粗糙的形式和武斷的裁決。
有學者調查發現,高校學生評教顯著受學生背景因素的影響而不能很好地反映教學情況,男生與女生、農村學生與城市學生、高年級生與低年級生、學生群眾與學生干部之間具有明顯的評教行為偏差[5]。從心理學角度看,由于評教過程中存在愛屋及烏、禮尚往來、感知平移等心理困境,學生評教的有效性大打折扣,可能帶來降低學業要求、課堂教學膚淺化和娛樂化等負面影響[6]。
外國學者通過構建教師和學生的效用函數,發現適度使用學生評教可同時提高老師教學投入和學生學習投入與收獲,但過度使用學生評教會導致分數膨脹[7]。教師和學生有可能發生“共謀”,即教師放松學術要求,給學生打高分,以換取學生在評教中的好評價,從而使教與學的關系異化成“教學相‘漲”的尷尬局面[8]。根據最近一項對我國高水平大學教師調查的實證分析發現,學生評教對教師投入熱情具有顯著的負面影響[9]。這意味著,即使在師生認知能力都相對較高的高水平大學,學生評教不僅不能支持和促進教學提升,還消耗了教師可貴的教學熱情。
2.同行聽評課的局限與文化約束
除了學生評教,目前常用的另一項課程質量管理手段是同行聽評課。國際上比較提倡由教師同行而非管理者、政府等角色來評價教學和研究[10]。因此,同行聽課能夠為全面的課程教學評價提供一個無可代替的專家視角。但實踐中仍存在一些局限。例如,同行聽評課所能投入的時間精力有限,聽課只能截取片段,無法把握課程教學全貌。同行聽評課的視角是以“教”為中心,比較能夠把握教師教授的方法和內容,卻難以了解學生學習情況。聽評課的同行可能富有相關教學經驗,但未必是教學專家,難以將個人教學經驗上升到更普遍的教學規律。同行之間在教學上更多的是切磋關系,而不是評價權威與被評價者的關系。同時,由于知識專門化程度正在不斷加深,管理層要在校內組織起一批真正的同行來充分實現這項工作并不容易,而“外行評教”的結果難免引起爭議。除此之外,教師在心理上排斥教學同行評價,塑造著不干涉、不參與的消極慣習,抑制了教師在教學同行評價場域中活動的深度與廣度[11]。
總體而言,同行聽評課的成本高昂,收效較小。作為科學、全面評價課程教學的一個環節,同行聽評課應該被納入到評價系統中一個恰當的位置,使其效用最大化,并減少副作用。
3.新技術在教學測量方面尚無實質性進步
近年來,依托信息化、視頻監控與物聯網等技術的大幅進展,在大學校園內外涌現出許多教學測量評價方面的新技術。
首先,以視頻監控攝像和人臉識別為代表,對教與學的行為舉動進行編碼分析。這類技術的賣點在于使教學過程這個“黑箱”得到很大程度的透明化、客觀化和數量化。但恰恰是這種信息化,誘使教學過程偏離其本質。理想的課程教學不僅在于可見的人際互動,更在于思想的碰撞、內在的共鳴。如果僅依靠視頻監控技術開展教學評價,將不可避免地把管理上的注意力引向“外在化測量”,鼓勵教師開展表演型教學和學生的“表面化聽課”。這是對教育價值與意義認知的簡單化,其評價模型刻意忽略對學生作為人的發展內在性、唯一性與完整性的關照,加劇了教育的功利性和工具化[12]。目前的人臉識別技術已經能夠捕捉人類的主要表情,但還遠遠達不到精細地識別其深層心理活動、思維活動的程度。換言之,新技術在沒有發展到能夠深入“人的內在”去測量之前,這類自動測評所獲得的只能是初步、表面化的,甚至引起誤解的數據。
此外,由于中國大學較大的生師比,相對于需求而言教學供給并不充裕,教學組織安排也對課程教學質量有明顯影響,比如選課規則設計、排課方式等,教師和學生都受此制約。因此,在中國大學課程教學質量的全局視野下,教務管理部門也應當作為影響質量的相關方納入考慮,是“教與學”雙中心之外的第三責任方。
既要傾聽學生反饋,又不能將學生置于評價教學的凌駕性位置上。因此,我們需要一個中介角色來使教師和學生在教學關系中各歸其位。于是,適合作為教學評價者的中介角色將是第四方。理論上,這個第四方應當兼具學科專業性和教育教學專業性,并且了解院校的實際情況。他們需要采取綜合的全景視角,分析歸因,并且有能力與各方開展良好溝通。目前,很少有大學擁有現成的這種團隊,引入外部專家是一種辦法,但仍離不開院校內部人士的傾心投入。
四、“高能課”教學質量測評系統的設計理念
1.高能:教學質量的動態標準
為了凸顯教學實施過程質量的重要性,基于良好的課程建設與設計,我們用“高能課”來界定優秀的教學實施過程。如果說“金課”這個名稱反映了對課程內容含金量的關注,側重于教學設計,屬于靜態質量,那么,“高能課”的命名是為了提倡教師和學生在課程教學中的主體性行動。“高能”意味著高效能的教與學,并且以激活學習潛能為理想教學結果的標志,屬于動態教學質量。
什么是教學質量的動態標準?“高效能”和“激活”等表述均避免了關于工作量、任務強度或取得“正確”知識的描述。高等教育與基礎教育中教學與知識的關系存在質的差異。對基礎教育而言,“知識”是個名詞,是學習的固有對象。大學的教學目標不是傳授固有的知識,而要使學生能夠像學者那樣思辨地看待知識、駕馭和運用知識、研究拓展和更新知識,不再是像中學生那樣對待知識。對高等教育而言,“知識”不僅是名詞,更是個動詞,是一套理性求知的方法門徑,包括學習態度與動機、特定專業對問題的思考架構、自我拓展學習的方法和對學問的判斷力與品位等。大學教師要通過嚴謹的訓練與師生互動,將學生領上學問的正途,有嚴格的“家法”卻無絕對的權威。因此,對大學教學而言,“課好”“教得好”都不是第一性的,促使學生進入真正的主動學習狀態才是最重要的。
因此,為了更好地把握大學教學的卓越特征,我們尤其強調這種高等教育特有的教學觀念,側重動態教學質量的評價,采用“高能課”來定義優秀的大學課程教學。
2.測量:以可見行動為依據
根據我們對高等教育教學質量的動態化理解,測量評價的對象便具象化為教與學的投入行為。數據要刻畫真實的學習環境、課程學習過程表現和具體學習體驗,并考慮學生的起點水平,以增值性作為評價標準,問卷的問題設計切中課程學習痛點,能夠與學生共情。
表1列出了“高能課”教學質量測評系統的主要指標體系。一級指標的教學質量、學習投入等反映教與學過程的投入行為,即教師做了什么、學生做了什么。一級指標的學習收獲則反映了對課程預設教學目標的達成度,以及這種收獲的認知質量。二級指標則是一級指標的具體化操作。
3.診斷:區分評價與反饋
“高能課”教學質量測評系統的診斷理念是;課程質量需要師生共同承擔責任。在表1中,評價指標兼顧了教與學兩個方面。學生的反饋數據是了解教學過程的一把鑰匙,得到了反饋數據后還需要透過數據發現學生學習的本質,了解影響質量的原因,這便是診斷環節的主要任務。在清理數據后,充分結合教育教學規律對數據進行分析,充分考慮教與學雙方的相互作用,不僅僅把原因歸于教師或學生的任何一方,也要將院校背景、教學管理機制等其他因素考慮進來。
基于前述大學教學評價的結構性原則,我們進一步將二級指標分列為評價指標與反饋指標。也就是說,存在一些確實影響著教學質量,但并非教師和學生的責任所致的因素。對希望改進教學的教師而言,他們有必要獲知這些因素的存在,比如內容難度設置、課堂規模設置、學生客觀上的學業準備等。因此,我們既要獲取這些數據,又不用于評價,而作為要素信息反饋給教師。
前面我們已經指出,教學關系并非商業服務關系,滿意度模型不適用于教學評價。但學生的學習體驗和主觀情意面向的因素仍舊是影響學習的重要因素,因而我們創造性地做出兩點轉換。一是將滿意度指標歸為反饋指標,通過消除其評價效力來使其合理反映學情。二是將學生對自己學習投入質量、學習收獲的滿意程度納入二級指標,使學生在參與這項調查時更全面地意識到自己的責任,也使師生關系在這個指標結構中擺脫評價者與被評價者、服務者與消費者的桎梏,恢復本來的正常關系。
4.效用:賦能教師與支持管理
診斷環節過后,教師將獲取關于其課程教學質量的分析報告。教師基于報告數據和初步診斷結果,進行進一步的自我診斷。例如,針對報告中提出的課堂優勢與短板,教師可以針對性地調整教學環節。通過縱向比較多個學期的數據,教師就能清晰地看出教學手段和環節的效果及變換過程,發現問題的根源所在,找到解決問題的抓手,了解問題解決的程度。
對于教學管理部門而言,“高能課”教學質量測評系統提供縱觀全局的視野,能夠在一張至少四維的可視化圖表中清晰地看到所有課程的動態分布情況。同時,為了破除學生評教殘留的一維評價誤區,我們反對“課程排序”,支持折中的辦法,即根據診斷分析提供“課程歸類”。歸類的明確度能滿足管理所需要識別功能,比如哪些是“水課”、哪些是“高能課”等,便于行政上的有效作為,也能避免排名帶來的混淆與誤導。
五、“高能課”測評系統的應用
在確定了測評理念和基本指標后,我們參考國內外的權威評教系統,結合大量現場聽課的經驗,針對指標內容設計出通俗易懂、問題指向明確的問卷。為了保證問卷的信效度,我們團隊先在個別課堂進行了小范圍的預測量,根據回收得到的數據,找出問卷中存在的問題,并有針對性地進行調整。同時,邀請部分學生與教師進行訪談,進一步優化問卷的內容與表述。經過多次反復修改與討論,確保問卷能夠引起學生的評教熱情,真實地反映課堂問題。問卷成型后并非一成不變。隨著核心課程結構的不斷調整、教學形式與手段的革新,教學專家對測評指標及時優化更新。
自2015年起,我們團隊應用“高能課”測評系統,對復旦大學、北京大學、武漢大學、清華大學等一流大學的數千門次課程進行了測評,其結果得到了教師和管理方的認可,并逐步嵌入大學整體的質量保障系統。
對于每位授課教師,在學期結束時得到一份有針對性的“課程體檢”報告。根據“課程體檢”報告中的各項指標高低,教師能夠從總體上把握課程教學互動情況,特別是對學生的學習情況更加心中有數。
對于上述學校的教學管理部門,我們提出了構建課程質量保障閉環的建議。授課教師設計構建課程,進而實施教學,隨后在恰當的期間,在專業團隊支持下合理地落實學生調查,得到學生反饋。教學學術專家團隊根據學生反饋以及綜合定量和質性數據分析,給出總體診斷報告和每一門課的“課程體檢”報告。教學管理部門將“課程體檢”報告分發到教師,同時根據診斷報告中顯示的特征進行分類管理與支持,對特定課程開展同行聽評課或課堂觀察,從而不斷積累翔實的課程教學檔案。教師可以根據“課程體檢”報告中顯示的問題修訂優化課程設計,開始新一輪教學。
我們認為,管理評價只是提升質量的手段,并不是目的。單純的“評教”更不足以概括這項工作。課程教學設計的質量主要取決于教師個人及其學科專業共同體的水平,而教學實施過程的質量更有賴于教師、學生、學校三方合力。中國大學的課程教學質量不僅僅是教師的責任,雖然教師在其中負有不小的責任。基于這樣的認識,在幾年的實踐中我們意識到,教師的教學積極性居于整項工作的核心位置,評價不能妨礙教師發揮教學積極性[25]。比起“評價”,我們更樂意將這些工作描述為“尊重并解讀學生反饋”與“為教師提供專業支持”。我們希望通過一套專業性方法來取得大規模的教學質量評價及提升,并使這種提升可觀察、可把握,最終在大學內部構建人人關心教學、認真討論教學、合力提升教學的氛圍。
參考文獻:
[1]Renaud R D , Murray H G . Factorial Validity of Student Ratings of Instruction[J]. Research in Higher Education, 2005, 46(8):929-953.
[2]李楠. 高校教師績效考核中學生評教存在的問題及對策分析[J]. 首都經濟貿易大學學報,2009,11(4):96-99.
[3]王瑛. 關于高校“學生評教”中若干問題的探
討[J]. 中國大學教學,2006(7):46-47.
[4]Uttl B , White C A , Gonzalez D W . Meta-analysis of faculty\"s teaching effectiveness: Student evaluation of teaching ratings and student learning are not related[J]. Studies in Educational Evaluation, 2016:S0191491X16300323.
[5]周繼良,秦雍. 高校學生評教行為偏差基本類型及其與學生相關背景特征的關系[J]. 復旦教育論壇,2018,16(6):65-73.
[6]吳洪富. 學生評教的心理困境干預[J]. 高教發展與評估,2019,35(3):39-46+111.
[7]Weinberg B A , Fleisher B M , Hashimoto M. Evaluating Methods for Evaluating Instruction: The Case of Higher Education[M]. Social Science Electronic Publishing, 2007.
[8]哈巍,趙穎. 教學相“漲”:高校學生成績和評教分數雙重膨脹研究[J]. 社會學研究,2019,34(1):84-105+243-244.
[9]閻光才. 高水平大學教師本科教學投入及其影響因素分析[J]. 中國高教研究,2018,303(11):26-31.
[10]Atkinson R . Academic Freedom and the Research University[J]. Proceedings of the American Philosophical Society, 2004, 148(2):195-204.
[11]周玉容,沈紅. 大學教學同行評價:優勢、困境與出路[J].復旦教育論壇,2015,13(3):47-52.
[12]金生鈜. 大數據教育測評的規訓隱憂——對教育工具化的哲學審視[J]. 教育研究,2019(8).
[13]梅萍, 賈月. 近十年我國高校學生評教有效性問題研究述評[J]. 現代大學教育,2013(4):29-34.
[14]白逸仙. 走向”以學生為中心”的評估模式——以中國《本科教學質量報告》與美國NSSE為比較對象[J]. 中國高教研究,2014(11):64-68.
[15]Taylor Terry. A value-added student assessment model Northeast Missouri state university[J]. Assessment & Evaluation in Higher Education, 1985, 10(3):190-202.
[16]涂冬波,史靜寰,郭芳芳. 中國大學生學習性投入調查問卷的測量學研究[J]. 復旦教育論壇,2013,11(1):55-62.
[17]郭卉,韓婷. 大學生科研學習投入對學習收獲影響的實證研究[J]. 教育研究,2018,39,461(6):62-71.
[18]陳佑清. 論有效教學的分析模型[J]. 課程·教材·教法,2012(11):3-9.
[19]Lizzio A , Wilson K , Simons R . University Students' Perceptions of the Learning Environment and Academic Outcomes: Implications for Theory and Practice[J]. Studies in Higher Education, 2002, 27:27-52.
[20]Astin A W . Four critical years[M]. San Francisco: The Jossey-Bass series in higher education, 1977.
[21][英]約翰·亨利·紐曼.大學的理想[M].徐輝,譯. 杭州:浙江教育出版社,2001.
[22]郝曉玲. 關于大學教師課堂教學能力現狀的調查與分析[J]. 中國大學教學,2011(2):84-85+6.
[23]王建中,劉暢,吳瑞林. 學生評教何去何從——基于美國、歐洲、澳洲4所大學的分析[J]. 中國高教研究,2018(10):87-92.
[24]趙炬明. 打開黑箱:學習與發展的科學基礎(下)——美國“以學生為中心”的本科教學改革研究之二[J]. 高等工程教育研究,2017(4):35-51.
[25]徐全忠. 回歸教師發展本位的綜合教學評價研究[J]. 中國大學教學,2018(10):79-82.
[基金項目:國家社會科學基金“十三五”規劃課題“中國大學通識教育建設成效分類評估研究”(CIA190274)]
[責任編輯:夏魯惠]