溫芳芳
(武漢大學科學評價研究中心,湖北武漢 430072)
哲學社會科學評價中數量與質量關系的思考
溫芳芳
(武漢大學科學評價研究中心,湖北武漢 430072)
近年來,在哲學社會科學領域,定量化評價引起太多的關注和思考,其中,既有合理的反思與批判,也不乏無端的非議與指責。文章對哲學社會科學評價中數量和質量的關系進行了梳理和解析,認為數量與質量相輔相成,構成了科研成果不可分割的兩個方面;質量的評價必須要以一定的數量為基礎;質量的提升源自于數量的積累;數量和質量并不沖突,二者融合于定量化評價之中;定量化評價方法本身沒有問題,只是利益因素誘導出對該方法的誤用和濫用,才導致了一系列的極端行為和失范現象。筆者呼吁能夠辯證地看待數量與質量的關系,能夠客觀地評論定量化評價方法,能夠更加冷靜地尋找哲學社會科學評價的改革之道。
哲學社會科學;科研評價;定量化評價;數量與質量
2005年12月《人民日報》發表了《北大試行論文代表作制度》一文,報道北京大學為克服追求論文發表數量帶來的弊端,正在試點推行論文代表作制度。北大中文系在教師聘崗時實施代表作制度,即教師在聘期內只要發表了一篇有較大影響力的論文,經院系學術委員會認定,在相關的學科領域里屬于領先地位,對該學者的科研工作就不再進行量化考核。這一消息迅速被各媒體反復轉載,引起教育界乃至社會各界人士的高度關注和震動。社會各界將輿論批評的矛頭對準以數量為主要考核標準的學術評價體系,同時為北大推行論文代表作制度叫好[1]。北京大學中文系主任溫儒敏表示,在北大中文系并不是現在才開始試點論文代表作制度,而是一直將論文質量放在相當重要的位置。
一直以來,學界對哲學社會科學的定量化評價頗有微詞。近年來,關于成果數量與質量的討論比比皆是,關于重數量輕質量評價方式的批判此起彼伏,關于改革哲學社會科學評價制度的呼聲也越來越高。北大所推行的論文代表作制度在一定程度上推動了科研評價由重數量向重質量轉化,可謂是哲學社會科學評價改革歷程中的標志性事件。而且,北大此舉再次引發了學界關于定量化評價的批判與反思。盡管定量化評價的確有其先天不足,在后天的應用中也出現了一系列的極端行為和異化現象,這些批判和反思在很大程度上真實地反映出了定量化評價的種種弊端。但筆者認為,學界對定量化評價的認識有一些不理智和不客觀的成分。那么,在哲學社會科學評價中數量與質量究竟是一種什么樣的關系?是否重數量的評價方式真的是阻礙科學發展和人才成長的桎梏?是否重質量重創新就意味著要完全拋棄數量?帶著這些問題,筆者對哲學社會科學評價中數量和質量的關系進行了梳理和解析,呼吁大家更為客觀、冷靜地看待定量化評價方法。
20世紀80年代,同行評議機制被正式引入到國內,同行評議方法被大量應用于科學評價實踐中。同行評議具有一定的優點,如同行專家對學科發展、研究力量等方面進行比較分析,能夠做出比較準確的判斷,但由于同行評議在評價過程中缺乏公認的評價標準,加上受諸多學術和非學術因素影響,而使同行評議流于形式,致使同行評議的科學性和公正性受到越來越多的質疑與批判[2]。為了減少人為因素的影響,使成果評價盡可能客觀,哲學社會科學評價引入了定量化評價方法。20世紀80年代以來,隨著科學計量學的興起和科研計量評價共識的增加,越來越多的科研機構和管理部門將科學計量學和文獻計量學方法引入科研績效評價和科學家績效評價,并作為科研管理與科學決策的重要依據[3]。20世紀90年代中后期,許多管理部門和研究人員開始探索借助科學計量分析的方法評價社會科學成果。借鑒國外哲學社會科學的三大引文索引《社會科學引文索引》(SSCI)、《藝術與人文科學引文索引》(A&HCI)、《國際學術會議社會科學引文索引》(ISSTP),中國人文社科成果定量評價的興起始于南京大學研制成功的《中文社會科學引文索引》(CSSCI)的應用,目前該數據庫已經成為中國主要的社會科學評價工具之一。
定量化評價引入哲學社會科學領域之后,以其操作簡單、客觀公正等優勢受到科研管理部門的歡迎,并在科研管理中得到了廣泛應用。但是哲學社會科學是以人自身以及人類社會作為研究對象,具有不同于自然科學的研究特點與發展規律,又深受本國政治、經濟、文化環境的影響和制約。因此,當定量化評價這種源自西方自然科學領域的方法被簡單地引入中國的哲學社會科學評價之后,既不符合哲學社會科學的學術發展規律和特點,也不符合中國學術界的現實情況。在全面的、完善的、公正的、科學的人文社會科學學術成果評價體系還沒有建立的情況下,各高等院校和科研機構紛紛出現學術評價與數量掛鉤的做法。職稱評定、崗位津貼、獎金發放等都有類似的要求:收入國外權威引文索引多少篇、中文核心期刊上發表論文多少篇、獲國家級或省部級優秀成果多少項、出版專著多少本,等等[4]。把學者的個人利益與學術成果的數量如此緊密地捆綁在一起,一定程度上引起了學風浮躁,滋長了弄虛作假之風,造成了學術腐敗現象的擴大。從科研管理的角度看,忽略人文社會科學的內在特殊性與多樣性,只用簡單量化方法,會使管理的目的大打折扣,甚至走向其負面[5]。
定量化評價方法的缺陷與優點從一開始就相伴而生,對其過度應用也遭到越來越多來自學界及社會各界的非議與責難,稱定量評價“違背學術規律,漠視個性與人性”[6],認為“學術評價量化背離學術評價宗旨”,“學術評價要靠同行評議”,認為是學術評價量化導致了種種學術不端行為,甚至被稱為“學術評價的鴉片和罌粟花”[7]。一種本來可以行之有效的評價方法被過度地、超范圍地、不按規律地加以濫用,導致社會矛盾和學界爭議日益加深,顯然有悖于初衷。與此同時,學界對于定量化評價重數量輕質量的做法以及由此所引發的一系列負面影響進行了反思,呼吁改革現有的評價體系。
有學者指出,目前的量化考核評價制度,已經嚴重妨礙中國高等教育和學術研究的健康發展,已經與建立創新型國家和進一步繁榮發展哲學社會科學的要求不相適應,它抑制了學術創新,妨礙了學術事業的健康發展,必須盡快進行改革和完善。學術機構應克服急功近利與攀比心理,對學術人員的激勵、考核、評價不能簡單地看成果的數量,而應更多地看成果的質量。在學術競爭上應以質量取勝,學術管理上應堅持質量導向,學術考核上鼓勵原始創新,克服急功近利與過度考核現象。應以學術的標準評價學術,以創新程度作為評價的主要標準。要改變“唯量”的論文考核方式,采取國際通用的同行評議、匿名審稿、論文代表作制度等方式,實現定量與定性考核相結合。同時,應為科研人員營造寬松的學術氛圍,讓他們潛心研究,減少由考核壓力導致的急功近利行為。教育部李衛紅副部長特別提出要“改進評價方法,強化質量標準,形成正確激勵導向”。她主張“要鼓勵運用現代先進的科學研究方法和手段,把創新程度作為衡量科研成果質量高低的核心要素。在專業技術職務晉升和崗位聘任過程中,強調精品力作的作用,讓確有真才實學的人得到充分認可,讓真正有利于個人成才的激勵機制落到實處”。
針對哲學社會科學評價領域存在的關于“數量與質量相沖突”、“數量增長影響質量提升”等言論,筆者將采用一種實證分析的方法對科研成果的數量與質量之間的關系進行辨析。選用中國引文數據庫,分別從個人和機構兩個角度進行計量和分析。取中國引文數據庫中高被引作者前50名和高被引院校前50名作為統計樣本,分別統計其發文量、被引頻次、下載頻次、H指數等指標數據(數據采集時間為2011年6月17日)。然后,分別將高被引作者的指標數據和高被引院校的指標數據導入SPSS13.0進行Spearman相關性分析,結果如表1和表2所示。

表1 高被引作者發文量與被引頻次、下載頻次和H指數的相關性分析

表2 高被引院校發文量與被引頻次、下載頻次和H指數的相關性分析
一般來說,發文量在一定程度上代表著某一作者或者機構生產科學知識及文獻的能力,而被引頻次和下載頻次則代表著某一作者或機構所生產的科研成果在知識交流中的質量和影響力。因此,在本次相關性分析中,將發文量看作是表征數量的指標,將被引頻次與下載頻次看作是表征質量的指標,而H指數則是數量和質量兩方面的綜合考察指標。從相關性分析結果看,無論是在個人層面還是機構層面,發文量與被引頻次、下載頻次和H指數都存在著顯著的正相關關系。由此表明,數量與質量并不沖突,擁有高被引頻次、高下載頻次和高H指數的作者或者高校往往同時擁有較高的發文量。也就是說,無論是高被引作者還是高被引院校,其質量和影響力都基于一定的數量優勢。
無論宏觀評價還是微觀評價,都要涉及到數量與質量的問題。數量易于統計,質量的鑒定則相對復雜。但任何事物都有數量和質量兩個方面的屬性,要完整地界定一個對象既要定量又要定性,沒有量也就無所謂質,沒有質的界定,量也就沒有意義。任何要把數量和質量割裂開的思想和行為都是不理智和不可行的。
如果一篇論文都未發表,就無法認定某一國家地區或機構的科研績效、學術水平和影響力。有一種觀點認為,科研績效評價應取消對論文數量的規定和要求。顯然,這不符合實際,也是不負責任的。從SCI和SSCI等收錄的論文數量看,科技發達國家的論文數量規模占明顯優勢,說明在遵循科研產出的客觀規律和學術規范的前提下,論文發表的數量是科研實力、學術水平的一個客觀評價指標。上文對科研成果數量指標與質量指標的相關性分析結果也表明,數量與質量具有較高的相關性,無論是個人還是高校,其科研產出的質量和影響力都是基于一定的數量優勢。片面追求論文數量,固然本末倒置,但把論文質量不高的原因歸咎于論文數量太多同樣不得要領[8]。論文質量的控制要靠期刊編輯認真把關和同行嚴格評審,而實際的質量水平和學術影響力則要看其發表后被同行認可和接受的程度,即被引用的頻次和影響力,以及成果轉化應用所產生的社會和經濟效益。
論文質量并非與數量成正比,但應認識到科學研究是一個長期積累的過程,無論對于一個國家或地區,還是一個機構或個人,科技論文的產生都必須有一個數量積累的過程,才能有整體質量的逐步提高。這一方面有賴于學術規范和監督機制的加強和完善,另一方面則應注重學術評價的導向作用,摒棄單純以論文數量評定績效的做法,提倡數量與質量相結合的評價方法。例如,對基礎理論研究型論文,采取質量影響因子法評價,將發表論文的總被引頻次除以論文總篇數作為評價指標,可促使科研人員慎重發表論文,因為每一篇論文如果不能對總被引頻次有較大“貢獻”,反而會導致發表論文數越多,個人質量影響因子越低。再如,可采用“代表作法”,即只推薦一定數量最有代表性的作品進行被引頻次統計或由同行評定其質量高低,也可有效抑制片面追求論文數量的勢頭。那種將數量與質量對立,拋棄數量只追求質量提升的做法完全違背了科學發展和人才成長的規律。那種一生成果寥寥卻對人類有巨大影響的科學精英固然偉大,但畢竟只是少數。對于大多數科研人員來說,還是要遵從“量變引起質變”的自然規律。尤其對于那些剛剛進入科研領域的年輕人,更是要經歷數量的積累才能有質量上的突破。
在對待論文數量與質量的問題上應持辯證的觀點。今天學術界存在的種種失范與不端問題,其根本的原因并不在于評價方法本身,更不能把所有的責任都歸結為成果數量的急劇增長。數量與質量本身并不沖突,只是在引入和使用定量評價方法時,操作程序過于簡單機械,又賦予了過高的利益誘惑,人為地把數量與質量對立,使定量評價走向了只重數量、忽視質量的極端,從而導致了種種異化現象和失范行為,其實質是利益因素誘導出對評價的誤讀與誤用。這一切與定量化評價方法本身沒有必然的聯系,那種把定量化等同于“重數量輕質量”的觀點是十分錯誤的。實際上,定量化評價的核心思想就是提倡數量與質量相結合。發文量代表科研工作者的生產能力,期刊的級別和影響因子在一定程度上代表著論文的質量,而被引頻次則反映出該項成果在知識交流系統的貢獻度和影響力。綜合了發文量、影響因子、被引頻次的定量化評價方法能夠很好地踐行數量與質量相結合的評價思想。
科研成果的評價分為兩個方面:一是從專業學術角度,對成果內容本身的創新性、科學性和應用性及其發表價值的評審,這主要靠同行評議;二是從科研管理角度對科研人員或機構的績效考核,這主要是運用科學計量學的方法對已發表的論文及其學術影響力,盡可能做出符合實際情況的量化評價結果。兩者的操作主體和功能目的不同,既相對獨立又相互聯系。前者是學術評價的基礎,評價主體是同行專家,主要是評審論文成果的價值以決定是否能夠發表及其發表的場合;后者主體是科研管理部門或機構以及科學計量分析人員,主要是對已發表論文成果數量和質量的綜合評價,其目的是作為績效考核、職務評聘、資源分配的依據。同行評議與文獻計量評價各有利弊,都非完美無缺。之所以采用其中一種與不采用另一種方法,并非因為某一種方法優于另外一種,而是根據評價目的和評價對象性質的不同所做出的合理化選擇,與評價方法本身的優劣沒有關系。目前,中國一些學者對成果量化評價大加抨擊,同時強調應重視同行評議,甚至提出要推翻定量評價回歸同行評議,這其實是對評價方法存在誤解。同行評議和定量評價都有其不可替代性,二者應該長期共存、互為補充。
在對定量化評價的種種批判與反思中,筆者也注意到了一種非常極端的言論,認為學術界一切失范問題的元兇就是定量化評價,甚至認為定量化評價已經成為阻礙中國哲學社會科學發展以及學術人才成長的桎梏。那么定量化評價是否應該承擔學術界所有的責難與批判?筆者認為,定量化評價方法本身沒有問題,只是人們對該方法的誤用和濫用才導致了一系列的極端行為和失范現象。實際上,定量化評價方法在最初被引入時,在科研管理領域發揮了積極有效的作用,并且短時期之內迅速推廣應用,這就足以說明定量化評價有其科學性和合理性的一面。如果推翻了定量化評價,那是否就可以解決目前學術界所有的問題,又能否建立一種新的更為有效的評價制度?我們可以輕易地打破一個舊世界,但在這之前應該思考有沒有能力去構建一個新世界。目前,在哲學社會科學評價領域,關于定量化評價的批判很多,但是對新的評價方法和體系的研究卻很少,也就是說大家都意識到了舊的評價體系的弊端,但是還沒有能力構建一種新的行之有效的評價制度。由此,中國哲學社會科學評價進入一種尷尬的境地,一方面猛烈地批判定量化評價,另一方面又不得不繼續沿用這一評價方法。筆者認為,任何一種評價方法都不是萬能的,與其批判定量化方法本身的種種不是,倒不如更加冷靜地思考如何趨利避害,如何更加合理地利用這種方法。
現代科研工作存在著巨大的壓力,而且科研制度本身對成就和成功都起著激勵的作用。科學家同其他社會勞動者沒有什么不同,并沒有擺脫其他行業的人們所具有的感情、奢望和人性弱點。現代科研畢竟是一項職業,要想獲得成功,一個研究人員必須盡可能拿出自己的成果,特別是有分量的成果,唯有如此,才能得到同行的認可和社會的承認,才能確保獲得政府的資助,建立自己的實驗室,創造條件招收研究生,爭取當選科學院院士,并企盼有朝一日被邀請到斯德哥爾摩領取諾貝爾獎[9]。這種夾雜著強烈愿望和復雜情感的心態不可避免地會滲透到科學研究及成果分配的過程中。在這樣的科研制度和環境中,確實很容易滋生浮躁的學術風氣和種種不端的行為,這種情況與科學評價方法本身并沒有直接的因果關系。
任何一種評價方法,一旦與利益緊密結合,又沒有相應的監督約束機制做保障,不可避免地會產生一些異化,各個國家、各個領域、各個行業概莫能外。只不過當這種問題發生在以嚴謹認真而著稱的學術界、發生在以追求科學真理為己任的科研人員身上,就顯得尤為惡劣和不能容忍。近年來,在哲學社會科學領域,定量化評價承擔了太多的評論與質疑,其中,既有合理的反思與批判,也不乏無端的非議與指責。我們支持以質量和創新為導向的哲學社會科學評價改革,也為北大試行的“代表作制度”拍手叫好。與此同時,筆者也呼吁大家更加理性地辨析數量與質量的關系,能夠客觀辯證地看待定量化評價。希望大家能夠結合哲學社會科學自身發展的規律,以及中國學術界的現實情況,更多地從制度、環境、文化等方面探討如何規范和優化科研評價,而不要過多地糾纏于評價方法本身的優劣和不足。
[1]曹建文.北大中文系論文代表作制度探路學術評價體系改革[N].光明日報,2006-01-04.
[2]劉文達.關于基礎研究同行評議的約束機制構建問題[J].科技管理研究,1999(6):13-18.
[3]邱均平.文獻計量學[M].北京:科學技術文獻出版社,1988:189.
[4]任全娥.我國人文社會科學研究成果評價體系研究[D].武漢:武漢大學博士論文,2008.
[5]上官子木.學術管理的有效性:量化管理方式并不適用于學術管理[N].南方周末,2002-09-19.
[6]黃安年.違背學術規律 漠視個性與人性——評目前高校流行的“量化”管理制[EB/OL].(2008-4-5).http://www.acriticism.com.
[7]葉再林,聶聃.洋索引崇拜——科研評價的罌粟花[J].社會科學論壇,2007(2):101-107.
[8]朱大明.學術評價中論文的數量與質量[EB/OL].(2007-09-12).http://www.edu.cn.
[9]朱進寧.背叛真理的人們——科學界的弄虛作假[M].方玉珍,譯.北京:科學出版社,1988.
Contemplation on the Relationship between Quantity and Quality of Humanity and Social Science Evaluation
WEN Fang-fang
(Research Center of Chinese Science Evaluation,Wuhan University,Wuhan 430072,P.R.China)
During recent years quantitative evaluation has attracted a variety of concerns in the field of humanity and social science, including both reasonable introspection and unreasonable critics.In fact, quantity and quality are two sides of research achievement and one can't be separated from the other.The qualitative evaluation must be based on quantity and the promotion of quality also comes from the accumulation of quantity.The two elements are integrated in the method of quantitative evaluation.This paper analyzes the relationship between quantity and quality,in the hope that people can have a dialectical attitude towards quantitative evaluation methods and can find a proper way to realize the innovation and reform of humanity and social science research evaluation.
humanity and social science;scientific research evaluation;quantitative evaluation;quantity vs quality
G644
A
1008-5831(2012)02-0112-05
2012-02-12
國家社會科學基金青年項目“人文社會科學成果評價體系設計與實證分析”(09CTQ014)
溫芳芳(1984-),女,河南平頂山人,武漢大學科學評價研究中心博士研究生,主要從事信息計量與科學評價研究。
致謝:感謝中國社會科學院任全娥博士對本文所作的重要貢獻。
(責任編輯 彭建國)