張耀方,韓海波
(上海交通大學科學技術發展研究院,上海 200240)
統籌推進建設世界一流大學和一流學科是我國現階段發展高等教育的重要戰略舉措,也是貫徹落實 《國家中長期教育改革和發展規劃綱要 (2010—2020年)》文件精神的必然要求。而學科評估工作是加快促進雙一流建設目標實現的重要支撐,也是指導踐行創新驅動發展戰略的關鍵引領。
我國學科評估是教育部學位與研究生教育發展中心按照 《學位授予和人才培養學科目錄》,對具有研究生培養和學位授予資格的一級學科進行整體水平評估,迄今為止已經進行了4輪,呈現出以下特點:①評估時間周期相對固定。第一輪至第四輪評估分別在2002—2004年、2006—2008年、2012—2013年、2016—2017年開展,平均每4~5年組織一次,每次評估歷時約兩年。②參評單位和學科數穩定增長。第1輪至第4輪評估分別涵蓋了229個單位的1366個學科 、331個單位的2369個學科、391個單位的4235個學科 、513個單位的7449個學科,學科數同比上一輪增長率分別為73%、79%、76%。③評估方法和指標體系逐步發展。逐步淡化了師資隊伍與資源投入類指標占比,轉而更加關注人才培養、社會服務與學科聲譽等指標權重,科學研究占比維持穩定;定量與定性指標相結合,在維持原有數量指標評價的基礎上進一步強調質量評價指標,例如增加了代表性成果、代表性案例展示、同行專家與服務企業調查等。④社會影響力和認可度明顯提升。評估以學科建設情況和水平為對象,公布的結果基本符合大眾預期,為我國的一流學科建設提供了重點方向和資源儲備;以提供發展建設建議為目的,得到高等院校的普遍關注和重視,為高校未來的學科布局和建設路徑提供了指導意見;評估的公開透明和權威性引發社會廣泛關注,為廣大家長和學生填報專業志愿提供了決策參考。
學科評估實施以來不僅引發高校和社會各界的廣泛關注,也引起學界的熱烈探討,研究大體集中在以下方面:第一,對學科評估整體的思考與分析,包括趙立瑩[1]基于元評估模型對第四輪學科評估進行優劣分析,方躍平[2]提出完善學科類型化評估機制,林夢泉等[3]分析學科評估發展與改革探究等;第二,對學科評估的國際比較與探討,包括蔣林浩等[4]基于美英中三國的比較研究學科評估的方法、指標體系及其政策影響,李鋒亮等[5]對英國科研評估體系REF及其評估實施變化過程與方向進行的專門探討,萬坤等[6]對瑞典FOKUS 科研質量評價框架的評價單元、評價內容、評價指標、數據來源4個方面進行的深入分析;第三,對學科評估某一方面的研究深化,包括梅紅等[7]對比學科評估指標與雙一流重點建設任務的契合情況與創新探索,丁雪梅[8]對我國高等院校重點學科評估的指標體系及評分標準提出幾點建議,方躍平等[9]深入分析了我國學術聲譽評估及其優化等。目前,科技政策改革導向對學科評估指標體系的研究仍然空白。
第五輪學科評估預計在2020年開展,目前各參評單位已開始積極著手準備,可以預見參評高校和學科數將繼續增長、社會影響力將持續提升,而評估指標體系在經驗積累與研究分析的基礎上也需要更加完備。作為振興國家高等教育和雙一流建設的重要舉措,學科評估指標體系需與國家政策導向的引領性和指導性相符,而近年來伴隨著創新驅動發展戰略的深入推進,國家科技創新政策發生了一系列重大變革,涉及項目、經費、機構、人員、評估等各個方面,其對學科評估指標體系的影響值得深入研究與探討。
目前學科評估指標體系分為三級,一級指標保持穩定、契合研究型大學的功能和定位,包括人才培養、科學研究、社會服務,另外增加了學科聲譽指標;二級、三級指標是對一級指標的進一步分解和細化,與國家政策導向變化相呼應,呈現出不斷的動態調整和變化。鑒于創新驅動發展戰略、雙一流建設戰略分別于2012年、2016年提出,恰逢第三輪、第四輪評估的伊始,對學科評估指標體系的影響深遠,因此文章著重分析 “十二五”以來的政策導向 (見表1)以及近三輪的指標體系變化情況 (見表2、表3)。
第三輪、第四輪學科評估分別始于2012年、2016年,處于整個 “十二五” “十三五”規劃的初期,這一階段以 《國家中長期教育改革和發展規劃綱要 (2010—2020年)》[10]、國務院印發 《統籌推進世界一流大學和一流學科建設總體方案的通知》[11]的發布為綱領。其間,2012年9月,中共中央、國務院印發 《關于深化科技體制改革 加快國家創新體系建設的意見》[12];2013年11月、2014年7月,教育部印發 《關于深化高等學??萍荚u價改革的意見》[13]、 《高等學??萍挤诸愒u價指標體系及評價要點》[14];2017年1月,教育部、財政部、國家發展改革委印發 《統籌推進世界一流大學和一流學科建設實施辦法 (暫行)》[15]。在師資隊伍、人才培養、科學研究和學科聲譽方面政策改革導向變化顯著,相應的對學科評估指標體系的影響不斷顯現。

表1 第三輪、第四輪評估前期國家最高層面政策變化對比

表2 學科評估一級指標及權重

表3 學科評估二級與三級指標對比
第四輪評估結果公布至今,國家各部委先后出臺了一系列績效評估相關文件,包括2018年7月的中共中央辦公廳、國務院辦公廳 《關于深化項目評審、人才評價、機構評估改革的意見》[16]、國務院 《關于優化科研管理 提升科研績效若干措施的通知》[17]、2018年8月教育部 財政部 國家發展改革委 《關于高等學校加快 “雙一流”建設的指導意見》[18]、2018年10月科技部、教育部、人力資源社會保障部、中科院、工程院 《關于開展清理 “唯論文、唯職稱、唯學歷、唯獎項”專項行動的通知》[19],政策文件的宗旨和導向將繼續影響新一輪的學科評估。筆者認為新一輪學科評估指標體系可能將在以下方面有所變化:
第一,師資隊伍與資源將更看重人才的實際貢獻和成長性,進一步杜絕 “帽子”稱號的異化使用。頭銜、資歷、職稱、榮譽稱號等代表過去取得的成績和貢獻,不能替代對當前和未來的評價和預判,優秀青年教師的培養支持和發展規劃、優秀創新團隊的協同合作和科學精神更應該成為學科發展未來的布局重點。同時,對重點實驗室、基地、中心等學科支撐平臺和資源將進一步加強謀劃、規范管理,切實推進績效評估和終身淘汰制,不以建設數量取勝而以發展質量取優,給予新興學科更多的同臺競技的機會和舞臺,形成良性競爭、共同進步的發展機制。
第二,人才培養將更加強調學生的培養質量和綜合素質,進一步成為學科評估關注的核心指標。大學階段是青年世界觀、價值觀、人生觀等形成的關鍵時期,也是道德品格、職業技能、科學素養、創新能力、國際視野等提升的重要時期,與在校生、畢業生質量評價和用戶滿意度調查相比,培養過程質量更需要被強調和關注,既包括教學過程的科學設計、教材課程質量的高水準、國際交流合作的高質量、實踐環節的嚴格要求等,更應該包括理想信念、愛國精神、個人品格的塑造和引導,而這種軟條件評估的科學性、合理性、公正性對學科評估提出了更高的挑戰和要求。
第三,科學研究將更加突出國家重大需求導向,進一步提倡關鍵核心領域的原始自主創新。國際環境的風云變幻、貿易和高技術領域的摩擦與爭端,再次把我們推到歷史重要的轉折點,唯論文、專利、職稱、學歷、獎項都解決不了諸多技術瓶頸問題,過去的資源驅動、粗放型發展模式已經不可持續,未來只能轉換為科技驅動、集約式、內涵發展模式,無論是基礎前沿探索、應用成果轉化,還是新型智庫建設,都將以解決現實問題和痛點、促進美好生活提升為衡量尺度和唯一準繩。單一的數量評價容易,多維度的質量評估難,需要持續的研究探索、實踐檢驗與路徑優化。
第四,社會服務與學術聲譽將更加聚焦經濟社會發展需求,進一步強化誠信體系建設。學術共同體代表著更高的道德聲譽要求,將對弄虛作假、科研不端、師德失范等行為零容忍、一票否決。風清氣正的學術環境、自由包容的研究氛圍是良好科研生態系統的基礎土壤和先決條件,既包括對科研團隊、研究人員學術成長軌跡和學術水平的跟蹤評價,也包括對教師隊伍和學生的誠信教育和綜合評估,還包括整個學科領域誠信規范體系的建立。同時,將更加強調學術成果的代表性、原創性和貢獻度,重點評價其科學價值、技術價值、經濟價值、社會價值、文化價值等。
第五,文化傳承創新和國際合作交流類指標將進一步增加,進一步關注學科建設的軟實力。過往的評價中更加關注人才培養、科學研究和社會服務,但文化的自信、傳承和創新,國際合作與交流的深度與廣度對學科的縱深發展和綜合實力提升是至關重要的,也是未來評估指標體系需要更新和拓展的領域。
學科評估是一項系統工程,伴隨著國家政策改革導向的調整和現實需求問題的不斷涌現,將面臨越來越大的挑戰和難點。指標體系在保持原有一級指標框架的基礎上,二、三級指標的設定與內容將跟隨國家政策導向的調整不斷更新和完善,更加契合雙一流建設目標要求,更加服務于創新驅動發展戰略,更加滿足社會經濟發展需求。同時通過延伸分析與思考,以下問題需要進一步深入研究與關注:
第一,評估周期或需相對固定或延長。首先,中長期績效評價更能激發學科的潛心發展,過于頻繁的評估或考核容易導致短視、浮躁和無效壓力,亮點成果的涌現離不開十年磨一劍的長期積累;其次,從國際經驗來看,美國博士點評估在1982年、1995年、2006年,間隔期長達10年,英國7次科研評估分別在1986年、1989年、1992年、1996年、2001年、2008年、2014年,間隔期也逐步延長;再次,經過40年的改革開放和奮勇追趕,我們的學科發展和科技創新體系已進入新的歷史階段,由對數量、速度的追求逐步過渡到對質量、效益的關注,越往上發展越不可避免地難度越大、瓶頸越多、壓力越重、突破越難,越需要平心靜氣、破除干擾、全身投入攻克技術壁壘,無謂的短期評估反而可能會打破既定節奏。因此適當的評估周期將非常重要,給予5年及以上的中長期評估對學科的發展與沉淀更加有利。 《中共中央辦公廳、國務院辦公廳關于深化項目評審、人才評價、機構評估改革的意見》提出,建立中長期績效評價制度、建立綜合評價 (5年為評價周期)與年度抽查評價相結合的中央級科研事業單位績效評價長效機制; 《國務院關于優化科研管理 提升科研績效若干措施的通知》提出減少評價頻次,對于評價結果連續優秀的實行一定期限免評的制度等。可見政策導向已十分明確,后續制度的真正建立、完善與落實則更加重要,既需要中共中央辦公廳、國務院較高層面的統一監管和督辦,也需要各個部委、地方政府的積極落實和配合,更需要整個高校、科研院所、企業以及社會各界的輿論監督和實際反饋。
第二,評估結果的應用或需進一步加強。現階段的學科評估立足服務學科發展和研究生教育,服務各級政府和參評單位決策咨詢,服務社會各界信息需求,評估結果的公布與應用更多集中在提供信息服務和決策參考方面,并未與財政撥款、國家科技計劃項目承擔、國家級科技人才推薦、國家科技創新基地建設、學科專業設置、研究生和博士后招收、科研事業單位領導人員考核評價、科研事業單位人事管理、績效工資總量核定等工作相銜接。當然,評估結果與資源配置強相關會帶來各種各樣的問題,例如引發尋租行為、激化浮躁情緒、疊加過度壓力等,從國際經驗來看,英國采取的將學科評估與科研撥款直接掛鉤的做法并非國際主流且受到爭議。但我們也應認識到,結合評估結果適當給予正向激勵和反向約束,可能會更有利于學科的良性發展和共同進步,獎優懲劣、賞勤罰懶、促先策后在資源有限的情況下更有助于集中優勢力量取得重大突破,關鍵是獎懲力度的把握、政策的公開公平合理以及落實的正確到位。 《中共中央辦公廳、國務院辦公廳關于深化項目評審、人才評價、機構評估改革的意見》提出,加強績效評價結果與科研管理機制的銜接,充分發揮績效評價的激勵約束作用,因此未來在學科評估設計的合理性、過程的規范性公正性、結果應用與資源配置關聯度方面的研究需要更加深入和嚴謹。
第三,量化評估與定性評估的關系或需進一步優化。量化評估和定性評估各有利弊,量化評估更加客觀、公開公正、簡便易行,但有時結果并不可靠,且指標的選擇與設計非常重要,定性評估更加人性化、更加靈活,能很好地彌補量化評估的不足,但是容易受到主觀情緒的影響和其他因素的干擾,因此科學界定兩者的關系、應用場景和范圍十分重要,這也是一項國際難題。美國博士點評估方法經歷了從定性評估到量化評估和定性評估相結合再到純量化評估的過程,英國科研評估則在定性同行評估方法的基礎上考慮逐步加入量化評估。學界對純量化評估的批評較多,但純定性評估也必然會導致尋租增加、客觀公正性降低、透明度不足等各種問題。 《國務院關于優化科研管理 提升科研績效若干措施的通知》提出對科技評價活動中簡單量化的做法進行清理,開展 “唯論文、唯職稱、唯學歷”問題集中清理; 《科技部、教育部、人力資源社會保障部、中科院、工程院關于開展清理 “唯論文、唯職稱、唯學歷、唯獎項”專項行動的通知》明確將在全國開展清理 “四唯”專項行動,克服 “四唯”傾向并不意味著完全摒棄量化評估,恰恰相反量化評估仍然是評估的必要基礎和合理組成,在未來的學科評估中更需要合理界定其和定性評估的關系和比例,二者并非非此即彼,而是相互補充和相輔相成。