侯劍華,梁曉晴
(中山大學資訊管理學院,廣東廣州 510006)
同行評議是科學技術評價實踐活動的基本手段,在國內外的學術論著出版、科研項目立項、人才和團隊評價、科研機構考核等方面發揮了積極有效的作用。一直以來,同行評議方法在我國科學技術管理和科學技術評價工作中占有重要地位。2018 年,針對科技評價體制改革,國務院、科技部和教育部等部門先后出臺破除“四唯”的相關政策文件[1],旨在發揮科研成果學術影響力和貢獻度的導向作用,準確評價科研成果的科學價值。破“四唯”,破的是“唯”字,定量評價方法只評價科研成果的數量而忽略了質量,導致研究者一味追求成果和頭銜的數量等,忽略了科研活動的知識創新本質。破除“四唯”要求給同行評議機制提出了新的挑戰,同時也帶來了重要發展機遇。一方面,以科研成果學術影響力和貢獻度為導向的新的評價體制為同行評議制度提出了新的要求。另一方面,隨著評價指標從重數量到重質量的轉變,同行評議制度在科技評價工作中將發揮越來越重要的作用。
科學研究是一個有投入、轉化、產出的動態過程。科技評價要遵循科研活動的發展規律,要有利于科研生態系統的構建和演化。有效的科研創新依賴于科研活動所構筑的良好科研生態。如果科技評價體系只看重科研產出的成果而忽略科研過程中的投入、環境、科研人員因素,會導致科研活動只看重結果,急功近利,不利于提升原始創新能力。因此,在“破四唯”背景下,如何構建基于科研生態系統的同行評議機制成為當前科技評價制度改革過程中的重要課題。
本研究針對我國現行的同行評議制度,對國家重點實驗室科研成果的同行評議機制進行重新審視,基于科研生態系統的視角,從投入、環境、產出等科研活動要素,對科研成果進行完整、客觀的評價,嘗試提出同行評議在國家重點實驗室科研成果評價中的創新模式,能夠在一定程度上改善以往通過數量評價科研成果的不足,對為我國國家重點實驗室評估工作提供創新實踐路徑,對科技管理和科技評價制度改革實踐具有一定的參考價值。
針對學科領域細分化導致的同行專家不足、評議效果不佳、,專家評議有主觀性以及受利益關系的干擾等問題,現行的國家重點實驗室同行評議制度在實踐工作中不斷進行改進和完善,在各項評議工作中發揮了積極作用。
(1)同行專家的遴選。在專家遴選原則上,首先遵從回避原則,盡量避免與參評實驗室有直接利益相關的專家參與評價工作。其次領域相近原則能在一定程度上增加評議的可靠程度。此外學術權威性、來源廣泛性、結構合理性、評估的公正性等原則對專家的遴選做出了進一步的要求,并且利用數理統計的方法來確定合理的專家數量[2]。除了專家的遴選標準要更加具體化之外,還要注重國際化評審,關注領域專家而不局限于國籍,建立完善的專家遴選制度。將選舉和學會推薦相結合[3],擇機組建專家委員會等[4]。
(2)同行評議的組織形式。主流的方法包括現場評估,與通訊評估相結合。而同行評議網絡化等評議形式在國外同行評議中廣泛使用,如PubPeer等匿名評議平臺[3]。這些開放式網絡平臺系統由獨立于期刊社或者國家評議機構的第三方組織搭建,借助新平臺,同行評議工作從被動接受變為主動選擇[5]。雖然開放性同行評議使同行評議系統的層次性質平坦化[6],但反觀同行評議的發展及其變遷的過程,不難發現,不論是公開還是匿名的、開放的還是封閉的同行評議,不同組織形式有不同的優勢和劣勢。對于利益關系,專家的主觀性和個人偏好的修正作用并不顯著。不論是現場評估還是網絡評議,這些組織形式并沒有關注到科研活動的完整過程,尚未擺脫只看科研成果的形式。
(3)建立和完善申訴制度。國內學者強調實驗室對于評議結果的反饋。一方面國家重點實驗室如果對同行評議工作的評議結果有疑問,可以向相關機構提出申訴[7]。一方面也通過專家的評議結果對專家的相關評議記錄,信用等進行積分,從而反饋并積累該專家的信息庫。這一舉措能有效地保護國家重點實驗室要求公正結果,維護自身利益的權利,同時能在一定程度上對專家的評議工作發揮監督作用[8]。
國際上同行評議制度有許多可以借鑒之處。美國的NSF 針對不同項目采用多元化的評審方式,同時建立規模宏大、多樣性的評審專家庫,建立了詳細的評審結果反饋和多級申訴保障。它擁有一個包含27 萬位評審專家的中央數據庫,并通過申請人、通訊評審者、小組會審專家及來訪科學工作者推薦等多種途徑尋求和擴展評審專家候選人[9];而美國實驗室的評價體系,將目標管理引進了國家重點實驗室的評價體系當中,綜合國家層面的戰略目標、科學自身的發展規律和科研人員的科研實踐,對目標進行合理設定和有效分解[10]。軟同行評議F1000因子的出現也是作為對現行同行評議方法的修正。F1000 采用了網絡化的信息公開方式,主題分類更細致,專家評審趨近于真正的小同行評審;量化考核與文字評語結合的評分制度避免了按被引頻次評價論文質量的缺陷,比較綜合客觀地反映了文獻的科學價值[11]。英國的REF 將科研成果的原創性和創新性作為重點,同時兼顧嚴謹性和意義性,將分類評價和專家同行評議評價結合應用。德國的DFG則主要采用“2+1”的評審方式,首先選擇兩位獨立的有判斷力的同行專家進行通訊評議,如果兩位的意見一致,則按同行專家意見決定是否給予資助。如果首選的兩位同行專家評議結果不一致,則選擇第三位同行評議專家。
2014 年國家科技部發布了《國家重點實驗室評估規則》。同行評議制度在我國國家重點實驗室評估工作實踐中不斷改進和完善,對我國國家重點實驗室的評估工作發揮了重要作用。現行的國家重點實驗室科研成果同行評議的運行模式如圖1 所示。

圖1 我國現行的國家重點實驗室同行評議的運行模式
在我國現行的國家重點實驗室科研成果同行評議模式中,主要的構成要素有專家庫,專家遴選原則,同行評議過程,評議對象。根據遴選專家的原則,從專家庫中抽取專家進行實驗室的同行評議。在評議過程中容易忽視科研投入,而直接對科研的產出成果進行評議,最后根據評議結果返回信用,反饋至專家庫更新專家庫數據。
(1)專家庫建設。專家庫旨在建設集中統一、標準規范、安全可靠和開放共享的國家科技專家庫,建立專家入庫信息定期更新機制。從專家庫中遴選專家進行同行評議,從而更好地滿足項目評審要求。
(2)專家遴選原則。主要包括回避原則,同領域相近原則,客觀原則和專家信用記錄等。在遴選專家的過程中回避有利益相關的專家,盡量選取相同、相近領域的專家進行評議,減少評議的誤差。同時要求專家秉持公平、公正的原則進行評議,最后將專家的評議結果進行記錄,并在專家信息庫中錄入專家信用記錄,作為以后評議項目的專家遴選依據。
(3)評議過程。主要包括初評,現場考察,綜合評議和提出評估報告等環節。初評中審閱評估材料,聽取實驗室主任工作報告和討論評議,根據評估指標體系記名打分和排序,并提出專家組評估意見。在現場考察中,專家組通過聽取實驗室代表性成果匯報、核查實際運行管理情況、個別訪談,形成現場考察報告。現場考察不打分、不排序。隨后綜合評議專家組聽取初評和現場考察情況的報告,審議初評結果,重點對現場考察的實驗室進行評議并記名打分和排序,提出評估意見,最后形成評估報告。后續工作還包括評估機構分析和總結評估工作情況,將完整的評估工作檔案資料提交科技部。科技部根據評估報告和專家評估意見,確定并發布實驗室評估結果及處理意見。
(4)評議對象。主要包括研究水平與貢獻,隊伍建設與人才培養,開放交流與管理。其中研究水平與貢獻主要體現在國家重大科研任務,重大科研成果,代表性成果,合作研究與自主研究課題的組織與實施。隊伍建設與人才培養體現在實驗室主任與學術帶頭人的作用,隊伍結構與創新團隊建設,青年骨干人才培養,為創新型人才提供條件與保障[12]。開放交流與管理主要體現在開放課題設置及成效、科學傳播,學術交流,儀器設備使用與共享,運行管理、依托單位支持,如規章制度的建設等。
現行的國家重點實驗室科研成果的同行評議模式吸收融合了國內外重點實驗室評估的主要做法,發揮了積極的作用。隨著科技評價體制改革的不斷深入,國家重點實驗室的同行評議機制也凸顯出一些問題。如,學科領域細化和學科交叉的日益復雜化,難以找到真正“對口”的專家,存在專家的主觀性因素,注重成果產出而忽略投入要素的評價,導致的評議結果的不公正等。評議產出成果,沒有從實驗室科研活動的投入、過程和產出等科研生態系統的視角,對重點實驗室進行綜合評價,不利于實驗室的可持續發展以及良好科研氛圍的營造。“四唯”問題不能在根本上得到解決。
(1)“同行專家”數量有限。由于學科細化導致科學“研究對象”的劃分越來越細,特別是在交叉學科領域和新興研究領域等,很難找到真正的同行。專家對實驗室的科研成果進行評議時,很難保證對評議對象的研究領域完全熟悉,單純靠專家的主觀評議會導致評議的誤差風險增大。同時,過分強調專家的遴選策略,會導致專家遴選的難度增大。
(2)專家評價存在主觀性。無法避免參與同行評議的專家或多或少與實驗室存在利益關系。一方面大多數專家來自不同的實驗室,而實驗室之間的競爭關系往往會影響專家的對其他實驗室的客觀判斷。雖然主題地圖在同行專家庫構建中的應用能保證專家對實驗室的評議更具可信度[13],但也常常面臨同領域競爭的現實。在人情社會背景下,將絕大部分的評議權重放到同行專家手中而沒有可靠性強、可操作性高的參考工具,難以保證評議結果的客觀與公平。
(3)科研成果的載體與數量的局限。一方面,現行的評議模式沒有從完整的科研活動視角對實驗室進行評價。另一方面,雖然同行評議的方式在一定程度上取代了直接“唯數量論”的評估方法,但是同行評議在國家重點實驗室評估的過程中,評價結果往往依賴于建構在定量輔助基礎上的同行評議模式[14],專家難免會受到實驗室科研成果的載體和數量的限制。科研創新成果的新知識一般以專利、論文和標準等文獻載體,但不同類型的知識載體可能會導致專家對實驗室的創新性知識的認識不充分,存在偏差。
(4)對科研活動的整體性評價不足。在科研機構中,科研人員,研究對象和相關的科研環境之間相互作用,形成了復合,多元,具有自組織系統特性的整體,是一個完整的生態[15]。一方面,忽略實驗室的投入要素,僅對產出成果進行評價是不公平的。不同的實驗室的科研經費,科研人員,設備規模往往不同,甚至差異巨大,科研投入的差異會導致科研產出成果的差距。大規模的實驗室評議結果更為可觀,而規模較小但是產出科研成果效率高的實驗室卻得不到重視。這樣并不利于營造公平和諧的科研氛圍。一方面,當評議工作忽略科研生態的整體性只關注于科研成果時,沒有遵從科研的屬性,導致科研人員急功近利,一味追求論文的數量而忽略了質量。這樣的科研生態環境往往也難以產出優秀的科研成果,容易形成惡性循環,不利于科研機構的可持續發展。
結合國家重點實驗室同行評議的工作現狀,提出了一套基于科研生態系統的科研成果同行評議創新評價模式。這一評議模式以科研生態系統為切入點,一方面,依據科研活動創新鏈對國家重點實驗室進行評價,評議對象著眼于實驗室資源的投入、研發過程和產出等整體環節。另一方面,對科研產出成果的評價,主要從成果的知識融合視角,評價科研成果的創新度和貢獻度,設計科研成果創新度和貢獻度的量化測度指標,為同行評議專家提供輔助參考。
科研生態系統是在一定機構或者領域內,完整的科研活動所需的投入和產出及其所在的科研環境構成的統一整體。通常包括人員、設備、資金在一定的科研環境下,通過科研創新活動,產出相應的科研成果,產生一定的經濟和社會效益,培養相關的人才,顯著改善實驗室的協同創新能力[16]。國家重點實驗室的運行是一個小型的科研生態系統,包含投入、產出和科研環境。因此,在國家重點實驗室科研生態系統中,同行評議工作應綜合考慮實驗室的規模、人員、設備、經費和這些投入要素對應的產出情況,包括科研成果、人才培養、經濟效益等。實驗室的科研生態系統是否運行良好,管理制度是否合理將對評議結果產生較大影響[17]。從科研生態系統視角對國家重點實驗室進行評議,符合科研活動的基本規律,符合科技評價制度改革的根本要求。
科研生態系統視角下的國家重點實驗室科研成果評價模型(圖2),其構成要素除了原有的專家庫以及遴選原則,還將完整的科研活動的生態系統嵌入評價體系,綜合考察實驗室的投入要素,科研環境以及產出要素。此外,將實驗室不同形式的創新成果通過知識單元融合,形成知識融合網絡,為專家的評議工作提供輔助參考。新的評議在原有模式的專家庫與專家信用記錄制度和考察方式等基礎上,將評議對象聚焦于科研生態系統下的科研成果的創新性和貢獻度。一方面,基于科研生態系統的評價體系整體上更加符合科學技術活動的發展規律,能更加全面客觀地對實驗室進行評價。另一方面,對科研產出成果的創新度和貢獻度的聚焦符合國家科技評價體制改革的現實需求。將實驗室不同形式的科研成果,從知識單元層面進行融合,形成科研創新成果的知識融合網絡,通過知識網絡的結構和節點指標等從整體上為專家的同行評議提供參考,有效輔助同行專家評議的主觀性判斷。

圖2 科研生態系統視角下的國家重點實驗室評價模型
在科研生態系統中,科研活動流程包括科研投入、科研環境、科研產出。通過綜合考量投入的人員、設備、經費、管理制度和產出的重大創新成果、人才培養、經濟效益等方面,考慮實驗室建設和發展的規模,有利于對其進行客觀、合理的評價。不同的實驗室投入的差異往往也會導致科研產出的差距,如科研成果、科研人員的培養,等等。在不考慮投入的情況下直接對實驗室科研成果進行評價不利于評價結果的公平性,可能會導致一些新銳或者規模較小但是產出效率高的實驗室得不到重視,錯失發展的機會。將國家重點實驗室看作科研生態系統,并將這一概念落實到操作層面,對投入和產出進行整體的評估,有利于評估結果的公正客觀,也能為評估資源的合理分配提供有效的參考。
科研成果的本質是新知識的創造。對科研創新成果的評價不應受到知識載體(論文、專利、標準和專著等)形式的限制,應跨越不同知識載體形式,融合科研創新成果的知識要素,評價知識創造本質的創新性和貢獻度。因此,基于科研生態系統的國家重點實驗室評議模式提出了知識融合視角下的知識網絡結構分析方法。對于國家重點實驗室的不同形式的科研成果的知識單元進行抽取、融合,通過知識關聯結構,表現出知識單元間的網絡結構關系,形成實驗室全部產出成果的知識網絡結構圖(圖3)。在此基礎上,可以在更大范圍和層次上,形成科研產出成果所在研究領域的知識融合網絡結構圖,這些不同層級和類型的知識融合網絡結構可視化圖譜,再結合知識融合網絡結構的學術創新度測量指標,可以為同行評議專家對實驗室科研產出成果的創新度和貢獻度的評議提供客觀、有效的決策基礎。同時,這一方法能夠體現實驗室產出成果的綜合學術影響力及其貢獻,在同行評議工作實踐中,一定程度上可以改進“唯數量”的評價方式。

圖3 知識網絡結構圖
科研成果的知識融合網絡結構圖方法,在不同的參照系,客觀地展現了實驗室科研成果的學術創新度,能夠在一定程度上減少專家評議的主觀性偏差。同時,在研究領域不斷細化和學科交叉度不斷增強的研究背景下,能夠在一定程度上彌補缺少“小同行專家”評議的不足,降低專家主觀評議的難度。傳統的同行評議中,專家憑借自身的專業知識和學術經驗對科研成果進行評價,對專家的知識儲備要求高。科學計量的評價方法對科研成果的學術影響力的測度更為客觀,并且隨著引用時間的增加,預測未來影響力的結果就越精準。將知識融合網絡結構圖融入評議模式可以輔助評議專家進行客觀有效的綜合評議,使評議結果更加客觀、準確。
隨著我國科技評價體制改革的不斷推進,對國家重點實驗室科研成果的評議,應在科研生態系統視角下,遵循科研發展的規律,將投入、科研環境、產出視作一個完整的科研活動的流程,對科研成果的學術創新度和貢獻度進行綜合評價。基于科研生態系統的國家重點實驗室同行評議模式,一方面使得評議結果更加客觀、綜合,另一方面有利于營造良好的科研環境,實現科研生態系統內部的良性循環。在評議過程中注重科研成果的創新性和影響力,通過知識融合網絡結構圖方法,擺脫以往只看代表作,拘泥于科研成果的載體限制的評議方法,將不同載體的知識要素進行抽取、融合,在不同層級研究領域的參照系,對其創新性和影響力進行綜合評價。
基于科研生態系統的國家重點實驗室同行評議模式提供了一個新的重點實驗室評議思路和框架,但沒有提供具體詳細的評分標準和細則。知識融合網絡結構圖方法旨在為順應國家破除“四唯”要求,為創新評議模式提供一條可借鑒的思路。構建新型的國家重點實驗室同行評議模式還需要明確具體的標準和實現技術。未來的研究,需要結合現狀,遵循科學研究發展的規律,通過不斷地改進和實踐探索,摸索出符合中國國情的國家重點實驗室同行評議模式。