摘 要:從水平評估到審核評估,不僅是我國高校教學評估實踐的新探索,更是教學評估理論的新認知。這種理論認知及實踐探索,集中表現在四個方面:一是在評估理念上,從強調績效問責走向注重協商對話;二是在評估作用上,從剛性強化走向柔性激勵;三是在評估分類上,從單一標準走向多樣標準;四是在評估重點上,從教學具體活動走向內部質量保證體系。
關鍵詞:高等學校;教學工作;水平評估;審核評估;評估理論
我國高校教學評估工作始于20世紀90年代,歷經25年,期間先后開展過合格評估、優秀評估、隨機評估、水平評估、審核評估等幾種不同形態的評估。但若從評估規模、效果及其影響來看,毫無疑問當以水平評估與審核評估最為典型、最具代表性。前者全稱“普通高等學校本科教學工作水平評估”,習慣上也叫首輪水平評估,自2003年開始至2008年結束,6年間共評估589所高校。后者全稱“普通高等學校本科教學工作審核評估”,實際上是第二輪評估,開始于2013年,將于2018年年底結束,630余所高校參加,包括了接受過首輪水平評估的所有高校。在筆者看來,審核評估與水平評估,既一脈相承,又有創新與發展。就此而論,審核評估之于水平評估,不是簡單地換個名詞或改一種稱謂,實際上,在評估理念、標準、內容、方式、技術及組織等方面相應做了一系列調整和變化,表明我國對評估工作或評估制度在理論上有了新認識,在實踐上有了新進步。審核評估全面總結和借鑒了水平評估的經驗,深入反思并汲取了水平評估的教訓,是我國高校教學評估實踐的新探索,更是教學評估理論認識水平的新提升。
一、教學評估理念:從強調績效問責走向注重協商對話
教育評估或評價活動既古老又年輕。言之古老,是因為自教育產生時起就存在著評價。孔子就曾講,聽其言觀其行而后知其人。蘇格拉底也提到,未經反思和評判的生活沒有意義。說它年輕,在于作為一門學問和一種制度,教育評估評價只是在20世紀初才得以確立,并且在很大程度上受益于工商業發展以及現代企業質量管理理論與實踐的啟示。在19世紀前的西方社會,高等教育的標準與質量多由大學內部掌握和控制,政府及社會很少關心和過問。隨著高等教育規模不斷擴張,入學人數不斷增多,大學從過去教會和私人領域逐漸變成國家和社會的公共事業,高等教育也由遠離社會一步步走到社會的中心,其事業的發展和擴充,越來越依賴于政府和社會的財力支持。20世紀70年代之后,西方國家先后進入高等教育大眾化階段,政府財政投入吃緊且呈減縮態勢,相應地,個人教育成本負擔增加。在此情況下,無論是政府還是社會與公眾,普遍關注教育質量,要求大學對質量做出承諾,由此開啟了政府和專門機構主導下的高等教育質量外部問責和績效評價時代。西方主要國家紛紛制定高等教育質量標準,頒布質量法律,建立質量評價制度,成立質量評價機構,開發質量評估工具,開展質量評估認證活動。有些國家還開展雙邊或多邊高等教育質量相互認證工作,區域性乃至國際性高等教育質量組織得以成立,掀起了大規模國際高等教育質量保障運動。所有這些,對改進高等學校工作、提高高等教育質量具有不可替代的作用。
在世界高等教育質量保障運動大背景下,20世紀80年代中期,我國高等教育質量保障工作亦提上議事日程。1985年,《中共中央關于教育體制改革的決定》首次提出,政府要對高等學校辦學水平和教育質量進行評估。此后,教育部在工科高校數百個專業進行了教學評價試點。20世紀90年代,教育部將專業評估轉入院校整體性教學評估。1994年,國家對改革開放后批準設立的高校本科教學工作開展合格評估;1996年,開始對那些申請進入國家“211工程”重點建設項目的高校本科教學工作開展優秀評估;1999年,對其他普通高校本科教學開展隨機性水平評估。這三種評估工作均持續到2002年,總計評估254所高校,其中以接受合格評估的高校最多。2002年,教育部將三種評估合并為普通高等學校教學工作水平評估,即首輪教學水平評估,從2003年正式實施。雖然此前的三種評估被合并為一種評估,但其在評估思路、評估方案等方面并沒有多少實質差別,可視為同類性質的評估模式。
指導首輪水平評估(包括之前的評估)的基本理念與思想,就是人們耳熟能詳的評估十六字方針:“以評促建、以評促改、評建結合、重在建設”。隨著實踐的深入,再增加“以評促管”,發展為評估二十字方針。不管是十六字還是二十字,都代表了那個時期人們對評估理念與功能的總結和概括,反映了人們對評估本質、價值及目的的基本認識和理解。
透過首輪教學水平評估以及評估方針,我們不難發現,教學評估主要是由政府直接組織的,當然要體現政府的意志和意圖,體現政府對高等教育質量的問責,評估是為政府對高等教育及其質量實施有效管理和監督服務的。通過評估,政府可以檢查高校教學工作是否符合、貫徹和落實了黨和國家有關教育方針政策及法律法規要求,檢驗高校教學效果是否達到了政府規定的質量標準,督促高校進一步加強教學建設、改進教學工作、提高教學質量。為實現上述目的,政府制定了教學評估指標體系,規定了評估標準和評估具體要求,其中不僅有量化指標,還要區分出評估結果等級序列,進而使高校教學與人才培養工作變得可觀測、可衡量、可檢查、可比較、可參照,進而與一定的獎懲政策制度銜接。
政府對高校教學質量進行問責評估本為分內之職,制定評估標準也是法律賦予的權力,但政府并不是質量問責和評估的唯一主體,否則就會否定和排斥其他組織或群體的價值存在,甚至在某種程度上造成評估本質扭曲、評估目的錯位和評估功能變形。事實上,現代高等教育是一個巨大的利益共同體,政府、高校、社會、公眾、媒體、家長、學生、校友、用戶等諸多群體都有著各自的利益需要和價值訴求,也有著不同的評價標準,高校教學工作評價也是如此。由此,當前國際上出現了所謂的第四代評估理論。這種評估理論認為,先前評估所經歷的三個發展階段(學業測量、實情描述和效果判斷)都是理性主義、實證主義、管理主義和功利主義的產物,它們均將評價對象看作被動存在者,評估成了一種權力對另一種權力的壓迫、規約和限制。第四代評估理論宣稱,評估不是為了檢查和證明,不是為了單純測量和判斷,而是為不同利益主體提供平等交流和協商對話的平臺;評估是交流對話的機制,是各利益主體相互間圍繞著質量與改進所展開的建構性評價活動,評估本身不存在確定性的單一量化標準[1]。第四代評估理論受到各國評估界的高度重視,并以此為指導改進評估認證與質量保障工作,其中眾所周知的學校主體、自我評估、持續改進、發展性評價、過程性評價等,就是這一理論的重要表現形式。
在我國,首輪教學水平評估之后,人們對評估經驗教訓、是非功過進行了認真總結和反思,認識到單純政府問責、績效檢查和量化評估的局限性。在廣泛聽取各方面意見,借鑒國際先進理論與模式基礎上,教育部對首輪水平評估進行了較大的調整和改造,其重點是合理吸收了第四代評估理論。審核評估這一新術語,某種意義上表達了第四代評估新理念。雖然審核評估并未根本改變也不可能更無必要消除以往評估的說明、檢查、鑒定、激勵和問責等特質,但它更有意識地注重和突出高校的主體性,強調政府與高校間的平等性,認可評估是不同利益方的溝通和交流,共同就人才培養與教學工作診斷協商、梳理思路、查找問題和謀求改進之道。審核評估明確提出“為國家負責、為學校服務、以學生發展為本位”,學校自我評估是全部評估的基礎。審核評估取消了首輪水平評估的等級設置,突出評估的目的在于促進高校內涵建設和特色發展,不再使用統一的評估指標體系這種單一標尺來衡量所有的高校,而是立足高校自我目標定位,用高校自己設立的標準評價高校自身工作及其發展。在評估主體上,除政府評估外,積極鼓勵專門機構、高校和社會參與評價,構建多主體、多形式、多渠道的評估制度,給高校發展空間,給公眾和社會評價權利,形成多主體競爭與合作的格局。事實上,首輪評估后,第二輪審核評估中,政府除了制定評估標準和規劃外,評估的具體組織已經由中央和地方性評估專門機構通過接受政府購買服務的形式獲得了評估代理權,第三方評估建設取得了重要進展。此外,社會團體組織的專業認證、高校自主選擇參與國際評估業已形成趨勢,政府單一評估局面基本被打破,為多方對話和價值表達進而影響高等教育質量決策提供了廣闊舞臺。正因為如此,新一輪評估受到高校、專家及社會的普遍認可和積極評價。有高校形容,過去接受合格評估是為了生存,接受水平評估是為了聲譽,而參加審核評估則是為了自我發展[2]。有專家認為,參加審核評估最大感受就是高校的平常心和開放態,不回避矛盾、不隱瞞問題,學校愿意就教學工作中遇到的問題、困難和困惑對專家敞開心扉、平等交流,期待從專家那里受到啟發,找到解決問題的辦法。還有研究者指出,審核評估真正體現了教育評價的本質,讓評價回歸其本來面目和應有位置,它不再是獨立于高校教學工作的外在強加物,而成為高校教學工作的內在構成,不再是簡單地給高校教學工作下個結論或者貼上等級標簽,而是為了幫助學校發展,各方從中都能受益[3]。所以,審核評估較好地平衡了政府、高校和社會三者之間的關系,體現了不同主體協商對話的評估新理念。
二、教學評估作用:從剛性強化走向柔性激勵
無論是水平評估還是審核評估,都是政府主導下的外部評估,其問責、說明、檢查和督促的作用是既是正常合理的,又是正當合法的。長期大量的評估實踐證明,作為督促和問責手段,評估本身也存在一個度的問題,掌握得好、運用恰當,評估就能發揮其積極正向作用;否則,將會適得其反和事與愿違。通常人們所謂的評估是把雙刃劍,就是這個意思。
一般說來,評估者總是希望評估工作能夠足以引起被評者的充分重視且對其工作產生實質影響,通過評估給工作帶來新發展新變化,尤其是作為教學評估政策和評估方案的制定者與組織者,政府部門對評估工作的作用力往往持有更高的目標期待。在我國,評估被賦予特別的意義和價值。在政府看來,教學評估是高校工作的指揮棒和方向盤,是反映高校工作優劣的鏡子和衡量教學質量的尺子,是助推高校教學的發動機,是撬動高校工作的強大杠桿,也是推行政策的重要手段,特別是當高等教育領域存在重科研輕教學、重學科建設輕人才培養現象且這些現象和問題日趨嚴重卻見不到有效解決跡象時,政府對評估就更為看重,期待通過教學評估扭轉局面。從這點上講,政府是加重評估強度、提高評估作用力的第一推手。政府提高評估強度和作用力的途徑與辦法很多,主要有設定評估標準、規定評估等級、量化評估指標、對評估結果進行排名和發布、評估結果與撥款或其他有關政策掛鉤等。
與政府相比,在如何對待評估壓力和強度問題上,高校的角色及心態可能要復雜得多,有時甚至非常矛盾。首先,高校是被評對象,必須接受政府或其代理機構的評估,如今,評估已經成為世界各國高等教育質量保障的一項長期制度安排,正如美國學者E·格威狄等人所指出的,“所有大學/學院的質量和效率需要定期的評估,特別是本科生的績效評估應為重中之重”[4]。然而,大學學術自由自治的傳統與個性,又使其天然地表現出抵制和拒斥外部評估問責的傾向,時刻提防著外部評估認證對大學自身發展內在邏輯造成的威脅、傷害和破壞,尤其在一些自由主義文化濃厚的歐洲國家,很少有發自內心愿意主動接受評估的大學,即使接受了評估,對評估的非議和負面評價也從未間斷過,在他們看來,評估會導致集權化、標準化、忽視大學個性化發展等問題[5]。其次,高校教師的自由職業者特征常常散發出極強的各行其事的個體主義色彩,他們害怕也反感外部機構對自身的教學工作進行評價,教師的這種立場與角色又使得高校管理層面總是試圖借助外在的力量對之加以剛性約束和規制,以便強化自身的權力和權威,落實或推行相應的政策與措施,提高行動與目標的一致性,達到工作的高效率和高質量。在這一點上,高校行政管理者又期望提高評估的強度和力度。評估和認證中存在的目標責任層層落實、任務層層加碼和壓力層層傳導現象就是最有力的證明。在行政管理人員心目中,似乎評估的強度或力度與評估的實際效果呈現線性正相關,以為評估強度越大,人們就越重視,效果就越顯著,反之,評估強度越小,就越受人輕視,效果也就越差。
以高校首輪教學水平評估和目前正在展開的審核評估工作為例,通過比較不難看到,二者在作用強度和力度上恰好形成了明顯對照。水平評估被分成優秀、良好、合格與不合格四個等級,每一評估等級所對應的標準和要求不同,等級越高,標準和要求相應也就越高。之所以進行水平評估,在于評估政策制定者和方案設計者不僅試圖通過等級評估來客觀描述和區別把握我國高等學校教學工作的“真實”水平,更在于剛性強化地方政府和高校對教學工作的重視和投入,進而實現有限資源得到非均衡性優化配置和獎懲的目的。應該說,水平評估在某種意義和程度上確實實現了政策制定者和實施者的初衷,在世紀之交高等教育大發展大擴招條件下,保證了高校教學基本條件、基本秩序和基本質量,也激發了高校之間在辦學資源、聲望與質量上的競爭。據對2007年198所參評高校的統計,水平評估給高校生均四項教學經費帶來超過27%的增長率,而生均教學儀器設備值更是帶來33%的增長額[6]。另有調查表明,96%的高校領導認為水平評估作用顯著[7],74%的高校教師認可水平評估的價值[8]。然而,水平評估所設置的高低好差不同級別,不單純表征不同高校的質量、水平、聲譽、地位和影響,甚至主要顯示著學校管理者包括其行政管理部門的管理水平、能力和政績,因此,水平評估最終不由自主地演變成一場圍繞等級、名聲與地位的激烈角逐。高校對評估的重視,與其說是為了實現評估目的和提升教學工作質量本身,不如說直接為了等級結果、標牌和稱號,這勢必導致評估變形和目標游移。
2008年水平評估全面結束后,政府、機構和高校各方面對水平評估進行了認真總結和深刻反思,認識到水平評估等級設置的優勢與局限,提出了改進評估的基本對策,即取消等級,減輕評估對高校造成的過大壓力和過重負擔。待到審核評估方案確定后,水平評估等級已被徹底取消,代之以寫實性評價,即說明和描述被評高校教學工作哪些方面值得肯定、哪些方面需要改進、哪些方面必須整改,評估壓力及評估成本隨之大大降低。
不過,取消等級后的審核評估工作,似乎又走入另一極端、陷入另一種困境,評估由以往剛性過大、壓力過重、強度過高變成了柔性偏大、壓力偏小和強度偏弱。水平評估中存在嚴重的功利欲、攀比心已經讓位于審核評估中的平常心、正常態。審核評估回歸了評估應有的面目,它更加強調高校在質量保障中的主體地位和多樣化發展生態,學校評估中更加自主、自信和從容,真正把注意力放在學校內涵建設和特色發展方面,不再為外在等級結果所左右,審核評估不打擾學校正常秩序,但由于它注重問題導向,注重與學校平等交流和協商對話,學校放下了水平評估狀態下的防御、戒備、博弈和討巧心理,致力于通過審核評估發現問題、分析原因、尋求對策和提高質量。所以,審核評估得到許多高校和專家的充分肯定和積極評價,認為審核評估是尊重教學規律的評估,是促進學校發展的評估,是指向內涵建設的評估。但平常心之下學校對評估用心不多,正常態之下學校工作狀態表現不佳,地方教育行政管理部門和高校對審核評估重視程度不夠,審核評估帶來的教學激勵不大,教學改進實際效果不明顯,甚至有圖形式、走過場的跡象。所以,有政府管理者、高校領導和專家主張,要辯證對待和評價水平評估與審核評估,充分吸收各自長處,避免各自短處,適當增加評估壓力和強度,以此提升評估影響力和作用力,更有效地促進高校本科教學工作,提高教育教學質量。
水平評估到審核評估,評估的作用確實出現了從高到低、從大到小、從強到弱、從剛到柔的明顯轉換,相應地,人們對評估被重視程度和評估實際效力的判斷也出現了變化。如何看待評估的強度和作用力以及由此引起的功用?到底是強度大好還是強度小好?評估作用強度與評估效果是否一定存在明顯正相關或者說二者成正比例關系?筆者認為,這個問題比較復雜,不可一概而論。關鍵要看這種相關性是形式上的還是實質上的,是表象的還是內在的,是一時的還是長遠的。無論作用強度大小,外部評估問責都是重要的、不可或缺的,同時,它作為一種手段,必須服從和服務于教育教學自身目的及需要。外部評估問責所承載的功能不可能是無限的,其最終的效果和作用,進一步說,教學工作能否得到改進,教學質量能否得到提升,歸根到底取決于學校自己。尤其是高等教育進入實現內涵式發展以及治理體系和治理能力現代化的新時代,政府職能將進一步向法治型和服務型轉變,高校辦學自主權日益擴大,外部評估作用剛性的空間會逐漸收縮,柔性空間逐漸擴充。由是觀之,那種過于相信評估剛性作用的認識并不合時宜,適度柔性實為大勢所趨。
三、教學評估分類:從單一標準走向多樣標準
伴隨高等教育大眾化發展,高等教育的社會化程度也日益提高,其內部分化過程加速。換言之,高等教育大眾化、社會化與多樣化是密切相關、聯為一體,因此才有所謂高等教育的多樣發展和特色發展。要實現多樣化、特色化,不僅需要高校辦學自由自主、主動對接市場和社會需求,而且政府和社會也需要加強分類管理和分類評價。
高等學校分類是重要的教育理論問題和實踐問題。中外學界有許多研究,取得了非常可觀的成果。但嚴格說來,已有的研究及成果,各有優劣和長短,并且高校如何分類也是與本土經濟、政治、文化與教育基礎相適應的,并不存在一個統一的模式[9]。最有代表性的美國卡內基教育基金會依照高等學校職能和學術層級,將高校分為研究型大學(內部又細分為研究型1類和2類)、博士類大學、碩士類大學、四年制文理學院以及社區學院等[10]。其中,研究型大學和博士類大學,重視研究生教育和科研工作,而碩士型大學和文理學院主要側重本科教學,社區學院則具有升學(本科)教育、職業教育及滿足成人個性化發展教育的多種職能。這種分類與美國注重通識教育、研究生教育規模大以及勞動力培訓市場高度發達直接相關。與美國不同,歐洲高等教育分類更多從職能劃分,主要分為學術型、應用技術型和綜合型三類[11],其中,前兩類是歐洲傳統的學術性教育與職業性教育雙軌制遺產。學術型教育地位高,實科與職業教育地位低。戰后在民主化運動影響下,歐洲高等教育的平等化發展迅速,大面積出現學術與職業兼具的綜合性中等學校和綜合性高等學校。
在我國,高校分類是一個新課題,也是長期以來沒有得到很好解決的實踐問題。民國時期的高等學校,主要仿效西歐國家,分為綜合大學和專門學院。前者側重學理性或基礎性教學與研究,后者則側重某一方面的專門學問教學。中華人民共和國成立后,全面學習蘇聯經驗,對高等學校進行根本改造,強調高等教育專業屬性,除了保留少數文理性綜合大學之外,絕大多數高校都是按照狹窄的專業領域甚至產品進行建設和管理,專業多而細。即使是綜合大學,內部也存在著嚴格的專業劃分并嚴格按照專業進行招生、教學、管理和就業工作。改革開放后,特別是新世紀以來,高等教育的大眾化發展,市場經濟體制的確立,高等教育多樣化發展成為必然,高校如何分類和定位也成為突出問題。政府行政部門為了管理及資源配置等需要,組織力量加強了分類研究,社會評價機構為了高校質量、聲譽等排名需要,在分類上也進行了許多有益的探索。有的按照職能劃分,如研究型大學、教學型高校、服務型高校,進一步又細分為研究型、研究教學型、教學研究型、教學服務型、職業技能型等;還有的按照知識的性質進行劃分,如學術型大學、應用型高校、技能型高校等。這些劃分盡管各有道理和優長,但若將之應用到具體實踐管理和評估工作中,問題和弊端就會暴露無疑甚至寸步難行。例如,嚴格意義上,不同分類之間的界限應該清晰,最好不要交叉重疊,這樣才有利于歸類、統計和行政管理,也有利于制定相應的政策。然而,現行的分類辦法卻難以應用到具體事務管理和政策,分類本身歧義就多,而實際管理中將哪些高校劃歸哪一類別本身成本也會很高。誰來負責進行分類,用什么方式和辦法分類;是高校自主歸隊,還是行政力量強行劃分,抑或通過市場自發歸類?這些都是難題。在現實政策與管理中,高校分類歸類、分類管理或分類評價的背后,往往是權力和利益的分配與再分配,誰都不愿意在分類中失去權力和利益,因此,分類變成一種權力和利益的博弈。博弈的后果是成本的擴大和增加,無論是政府還是高校都在分類博弈中消耗寶貴的時間和精力。
如果分類的前提或者分類本身不合理不科學,教學評估合理性也會受到質疑。早在1994年教育部開展高校教學工作合格評估時,為了體現評估的科學性、針對性,當時把高校按照綜合、理工、農林、醫藥、師范、政法等分為十個類別,分別制定不同的評估方案與標準進行評估,但實施一段時間后卻發現,各科類院校在人才培養和教學工作上,其間的區分度并不很明顯,其評估方案和標準過多反而人為地加重了評估的難度,增加了復雜性。所以,到2002年,十種不同的合格評估方案被廢棄。不僅如此,合格評估與同時期的優秀評估及隨機水平評估也被合并為一個方案,即后來統一的水平評估方案。
水平評估方案大大簡化了教學評估工作,也提高了評估效率,降低了評估成本。但新的問題隨之出現了。水平評估標準過于單一,沒有考慮到不同高校之間的基礎和差異,不僅造成高校相互攀比結果,而且導致高校辦學模式同質化、劃一化,消解了高校特色辦學和自主發展,忽視高校不同利益群體多樣化訴求。在水平評估即將結束的2007年,教育部成立新一輪評估課題研制組,無論課題組還是教育理論界,不約而同地提出分類評估的要求和設想。有學者提出按照層次分類,如“985工程”大學(39所)、設有研究生院的大學(56所)、其他“211工程”大學、博士學位授予權大學、碩士學位授予權大學、地方本科高校、新建本科高校等[12]。
也有學者主張,要按照研究型(創新型)、教學型、應用型對高校進行分類[13],但問題在于,這些分類設想和研究成果難以操作,不僅造成教學評估方案研制與轉化困難,更造成高校在歸類歸屬上的爭議與困境,誰也不愿意被歸入低一個層次。
分類問題在學理上可以進行探索,但在實踐中難以真正得到落實。如何既進行分類,又不使高校在分類中因擔心歧視而導致選擇困境?經過認真研究和討論,審核評估在這一問題上做出有益的嘗試,取得了重要突破,那就是不把分類作為預設的前提,分類不是預先由政府或評估機構提出,分類方案也不預先由政府或評估機構制定,然后要求學校作出選擇。審核評估提出一個非常好的動議,即“用自己的尺子量自己”,把分類這一難題留給學校,讓學校根據自身實際情況確定辦學定位和培養目標,評估者只是根據學校提出的定位與目標,審度其定位是否符合學校實際與社會需要,是否有足夠的資源支持,運行過程與教學效果是否達到了預期定位要求,說的、做的、做的結果是否能夠相互印證,是否得到同行與社會認可。這便是審核評估提出的“五個度”標準。
審核評估較為有效地解決了高校分類問題。當然,這種解決是相對的,它是權宜之計,還是理應如此,確實需要人們繼續進行深入細致的研究。
四、教學評估重點:從教學具體活動走向內部質量保證體系
第四代評估理論出現之前,西方教育評估即已經歷了三個階段,即測量階段、描述階段和判定階段。測量也好,描述或判定也好,就其實質而言,共同特點在于把教育活動及其過程本身作為評價的對象和內容,通過評價證明教育活動過程效率與效果,用以改進教育教學活動,提升教育教學質量。
傳統教育評估的理論總體上基于管理主義、科學主義和實證主義,總是相信可以通過那些所謂價值中立的科學客觀的評估標準或評估工具來認識和把握教育教學活動過程及結果。這一點,我們可從現實生活中各式各樣的大學排行榜和績效評價指標體系得出結論。就高校本科教學工作評估看,也沒有脫離如此的理念和模式。至于將高校具體的教學工作和教學環節作為評價對象與評價內容,更是我國計劃經濟體制下所形成的政府注重過程管理和微觀事務管理的產物。水平評估及其之前的所有教學評估形式,無不以具體教學工作為其對象,即這種評估評的是學校教學工作過程、環節、內容是否符合規定,是否達標,是否有效。每一種評估都有一整套具體明確的指標體系,不僅設置若干個一級指標,并且每一個一級指標又被劃分為若干個二級指標,同樣,二級指標下面又設置若干個具體觀測點。一般說來,指標體系幾乎涵蓋或容納了高校辦學目標定位、培養模式、師資隊伍、教學條件、專業設置、課程與教學、教學管理、質量與效果、就業等教學工作所有方面和過程。為了能夠客觀說明、展現與比較學校內部或不同高校間教學工作各方面環節質量與成效,評估方案又根據不同方面、不同環節在教學工作及在影響質量過程中的地位與所起的作用,賦予不同指標以不同的權重。評估政策制定者和實施者通常認為,指標越全面、具體、細致和深入,越能夠通過數據或行為加以說明和描述,對教學工作及其效果和質量的衡量就越確切、越容易把握和控制,進而制定相應的針對性的政策與措施。以水平評估為例,該評估方案一級指標7個,二級指標19個(其中高權重的重要或核心指標11個),觀測點44個,被評高校要預先根據這套指標體系和標準逐一對照本校教學工作,寫出自評報告,說明每一方面和過程實際情況及其效果,尤其是要自我判斷,自我做出優秀、良好、合格或不合格等級評價。然后,評估專家根據學校自評報告、自評等級和進校實地考察情況,給出評估結論建議和相應的評估等級。這個等級可能與學校自評等級一致,也可能有較大出入,或者說評估專家組可能認可學校自我評價,也可能更改修正學校的自我評價。
水平評估雖然追求全面性、客觀性和過程性,以此來說明學校教學整體工作以及具體方面或環節的工作狀況,以便更有效地發揮評估作用,然而水平評估也存在非常明顯的問題和缺欠。一是指標體系過于單一,沒有考慮到不同學校多樣性發展的實際需要,導致評估區分度不高,忽視和制約了學校特色化辦學;二是等級標準過于剛性,過于重視教學條件等硬件,學校出現了相互攀比和虛假評估現象,未能有效達到以評促建促改的目標;三是水平評估重視評價學校具體的教學工作過程及其效果,相當程度上限制了學校辦學及教育教學的自主性和積極性,學校被動跟著評估指標體系運轉,以期贏得理想的評估結果。在某種程度上可以說,水平評估中倡導的以評促建變成以評代建,以評促改變為以評代改,以評促管變為以評代管。
與水平評估相比,審核評估在評估內容和重點方面作出了重大改變。盡管在結構形式與內容上二者看似相近,但實質上卻有著明顯的變化。一是將水平評估指標體系改稱為審核評估范圍,一級指標改稱為審核項目,二級指標改稱為評估要素,觀測點改稱為審核要點。名稱不同,實際蘊含著審核評估不再像水平評估那樣過于強調指標體系的剛性規范,而是將評估指標更多的作為一種框架性、方向性和引導性要求,其彈性和柔性空間增大,以有效加強評估的針對性,充分發揮高校主體性和創造性,適應高校大眾化和多樣化發展需要。二是審核評估的重點不再僅評價具體教學工作及環節,盡管它仍然是評估的主要內容,但審核評估更重視強調評價學校內部質量保證體系建設。審核評估明確提出,要強化高校合理定位、強化教學工作中心地位和強化質量保證體系建設,這是水平評估未能顧及到的。在審核評估看來,只有學校自身建立健全了內部質量保證制度和體系,其教學和人才培養質量才是有保證的。所以,審核評估重點不在于評價學校某項具體工作做得如何,關鍵是看學校內部是否建立了有效的質量保證體系。
實際上,審核評估正式把質量保證體系作為獨立的評估項目(相當于水平評估的一級指標),項目之下設置質量標準、質量組織、質量監控、質量信息、質量反饋和質量改進等審核要素,所有這些構成了完整的高校內部質量保證體系,進而引導并統領著高校質量建設實踐。將內部質量保證體系作為審核評估重點,體現了質量保障中學校的主體性,質量標準的系統性,資源配置的有效性,培養活動的針對性,質量措施與改進的持續性,尤其是體現了質量保障工作中不同利益相關者的參與性、互動性和建設性。
有研究表明,外部評估是否有效,是否能長期發揮作用,重要的前提就是與高校內部質量保證對接,或者說外部質量保障的目的在于積極推動和促進學校內部質量保證[14]。當代西方國家大學具有悠久的自由自治傳統,對外部的質量保障持批判態度居多,但盡管如此,歐美國家的外部質量保障卻堅持上百年,尤以近三四十年為盛,其原因恰恰在于西方外部質量保障活動的目標和重點指向于高校內部質量保證制度和機制,也就是說內部質量保證體系是外部保障和評價的主要目標。美國六大區域認證中心實施的高等學校質量認證,英國高等教育質量保障署(QAA)開展的高等學校質量審核,澳大利亞國家高等教育質量保障局實施的質量評估,均以高校內部質量保證為重要內容。當前我國實施的審核評估即是將直接評價具體教學工作轉移到評價高校內部質量保證體系建設,盡管因為我國高校內部質量保證體系建設無論在理論上還是實踐上發展都還不健全不充分不平衡,使得這種轉變尚不全面也不徹底,但無疑已經是非常大的進步,在引導高校內部質量保證體系建設方面發揮了十分重要的作用。可以預期,隨著評估不斷深入,高校質量保證體系建設將提升到新的高度。正如有學者指出,“未來評估的重點是審查質量保障體系的適宜性和充分性,核驗其運行的有效性。質量保障體系由質量方針、質量目標、質量標準、質量要素、程序文件、質量監控、信息反饋及持續改進等部分構成”[15]。
從水平評估到審核評估,我國在高校教學評估理論、評估制度和評估實踐等方面進行了有益探索,取得了可喜進展,當然,這種進展是相對的、有限的,具有鮮明的階段性特征,但由此也說明,高校教學評估理論發展與評估實踐探索不會有止境。
參考文獻:
[1] 劉康寧.“第四代”評估對我國高等教育外部質量保障的啟示[J].國家教育行政學院學報,2010(9).
[2] 李志義,等.如何正確認識本科教學審核評估[J].中國大學教學,2012(10).
[3] 劉振天.回歸教學生活:我國新一輪高校本科教學評估制度設計及其范式變革[J].清華大學教育研究,2013(6).
[4] E·格威狄,等.高等教育中的質量與問責[M].毛亞慶,等,譯.北京:北京師范大學出版社,2008.
[5] 張應強,等.高等教育質量保障:反思、批判與變革[J].教育研究,2014(5).
[6] 吳巖,等.構建中國特色高等教育質量保障體系[M].北京:教育科學出版社,2014:51.
[7] 李延保,等.普通高校本科教學工作水平評估調查綜述[J].中國大學教學,2006(6).
[8] 高耀明,等.本科教學工作水平評估對高校教學工作影響的調查研究[J].高等教育研究,2006(11).
[9] 王保華.關于高校分類評估的若干思考[J].中國教育政策評論,2012(11).
[10] 陳厚豐.中國高等教育分類研究現狀述評[J].大學教育科學,2010(2).
[11] 潘懋元,等.從高等教育分類看我國特色型大學發展[J].中國高等教育,2010(3).
[12] 鐘秉林,等.堅持分類指導 制定分類標準 實施分類評估——新一輪本科教學評估基本問題探析(二)[J].中國高等教育,2009(6).
[13] 李立國,等.建立以人才培養為基礎的高等教育分類體系[J].教育研究,2018(3).
[14] 鄭覓.高校內部質量保障:框架與措施[J].中國高教研究,2016(9).
[15] 張安富.本科教學工作審核評估的再認識及持續改進[J].高教發展與評估,2018(3).
[責任編輯:周 楊]