陳新超,連鑄淡,洪 霞
(福建醫科大學研究生處,福建 福州 350108)
1981年5月國務院批準實施《中華人民共和國學位條例暫行實施辦法》之后的二十余年間,國內研究生培養單位大多實行公開評審制度。大部分高校的碩士論文評閱通過率接近100%,實行評分制的平均分也都處于高位,這顯然與學位論文質量的實際情況不符。綜合來看,普遍認可的原因為:一是沒有客觀的、操作性強的量化評價指標體系;二是論文評審專家由導師指定,使論文評閱流于形式。這使得學位論文質量的監督機制不能有效建立,學位論文質量難以得到保障[1]。隨著我國碩士研究生規模不斷擴大,原有碩士學位論文評閱制度已經不適應教育發展需要,近年來學位授予單位開始嘗試改革碩士學位論文評閱制度[2]。本文通過對福建醫科大學碩士學位論文評閱制度改革近3年來1243人次的2863份碩士學位論文評閱結果進行全面統計,從信度、效度以及改革效果三個方面進行系統分析,以期評價碩士學位論文評閱制度改革的成效,并從細化優化論文評價標準、創新評閱辦法等方面對進一步改進評閱制度提出建議。
福建醫科大學近年開始對本校碩士學位論文評閱制度進行了改革并逐步完善,主要包括創新評閱方式、細化評閱標準、合理處理評閱結果等。
原有論文評閱方式是公開評閱,即學位論文作者、導師等信息對評閱人是公開的,本文稱之為“明評”。近年來,各學位授予單位普遍采用“盲評”評閱方式,主要是“雙盲”(學位論文的作者及相關個人信息、評審專家信息互相保密)方式,由管理部門選擇評閱人。這種辦法不但可以避免論文作者和導師請評閱人放松要求,也使得評閱人因為不知道論文作者而沒有壓力,有利于評閱人排除干擾,公正地評價論文。
我校采用的評閱方式是明評和盲評(雙盲)結合進行。導師首屆碩士畢業生的論文、論文被評為“C”或者“D”者導師的下一屆畢業生論文、論文涉及學術不端行為者導師下一屆畢業生論文等必須參加盲評,再對其余論文隨機抽取5%參加盲評,其余論文使用明評。
目前我國并沒有對論文評閱標準進行細化的規定,我校原有評閱標準僅有主觀綜合表述和定性評價。改革采用定量評價指標體系與定性評價結果相結合,制作了評分表,細化了選題與綜述、基礎理論與專門知識、研究手段設計能力和創新性、寫作能力與工作量等評價指標,評閱人對每項指標給出百分制成績,總評分根據設定好的權重公式進行計算,并給予綜合評語,最后為學位授予單位提出定性的結論和明確的建議,即:A.該論文達到規定的要求和水平,同意參加論文答辯;B.該論文基本達到規定的要求和水平,同意修改后參加論文答辯;C.建議修改后再送審,合格者方可參加論文答辯;D.該論文未達到規定的要求和水平,不同意參加論文答辯。
公正的評價論文水平并提交答辯的定性評閱結果對學位論文的重要性不言而喻。原處理方式為一票否決制,改革將論文送審份數固定為3份,評閱意見的認定如下:3份評閱意見中有2個A者,可參加論文答辯;有2個B或1個A和1個B者,須按專家意見進行修改,方可參加論文答辯。凡未達到上述評閱意見結果的碩士學位論文,須重新修改或撰寫并推遲至次年同期參加學位論文評閱。這種做法在尊重每一位評閱專家意見的同時也避免了由于某一專家的評閱結果影響論文作者答辯。
分析2008年至2010年期間,1243人次的2863份碩士學位論文評閱結果(其中,明評1746份,盲評1117份),將其進行各方面的數據統計,對改革的信度、效度及效果等進行分析,可以對此次改革進行再評估。
信度系指結果的一致性、穩定性及可靠性,評價盲評這種評閱方式是否可靠可信,則必須檢驗聘請的盲評專家及其評閱結果的信度。
1.評閱專家指導資格。評閱專家是否為碩導是很重要的一個評價指標。親自指導過研究生撰寫論文的評閱專家對碩士論文的合格標準較為了解,對評價標準把握得更為準確,在評閱時也就更有針對性。
3年來明評的評閱人中導師比例分別為85.27%、91.77%、84.92%,都會低于盲評的相應比例 97.18%、98.88%、93.49%。總體來看,明評的評閱人中研究生導師占比87.27%,而盲評為96.44%,盲評中導師比例明顯高于明評。這是由于碩士論文評閱人資格要求為副高級職稱或以上,至少一名研究生導師。所以,明評的論文并不以是否是導師為惟一參考標準;而盲評評閱人是由評閱單位來確定,除了學科對口外,還會盡量選擇導師。
2.評閱專家對論文研究內容熟悉程度。新的評閱要求中,要求評閱人按照很熟悉、熟悉、一般的3類標準來選擇注明自己對學位論文的熟悉程度。盲評專家是由盲評單位來選取,具有一定的盲目性;而明評專家是由導師推薦的,往往會根據對論文內容熟悉程度或評閱專家在該領域的地位而選擇評閱人。3年數據統計表明,明評專家中選擇“很熟悉”和“熟悉”者,分別占35.23%和61.36%,都高于盲評專家中33.23%和59.57%的相應占比,明評專家比盲評專家更熟悉論文內容。
效度即有效性,它是指測量工具或手段能夠準確測出所需測量的事物的程度,評價此次改革的效度就是看盲評是否真實反映了學位論文的水平。
1.評閱平均分比較。改革三年來,明評的成績平均值(分別為89.62、89.06、89.36)都高于盲評的成績平均值(分別為85.86、86.02、86.16),明評的三年總平均分為 89.34,而盲評的這一數字是86.02,明評的平均分高于盲評平均分達3.32分。
2.評分離散度比較。標準差,通過計算標準差來對評閱結果的離散度進行分析,可以比較評閱專家對同一篇論文的評價差異。把明評結果和盲評結果分成兩組分別進行統計和計算。使用SPSS16.0軟件,調用Descriptives過程,計算每一年度的盲評和明評分數的平均值和標準差。以此計算明評和盲評3年的評閱結果的標準差如附圖所示(該圖對數據進行2倍標準差的描述,用于觀察數據的離散程度。圓圈是均數,長度的范圍表示離散程度)。
盲評專家總評分的標準差為5.889分,大于明評專家的3.704分。而且三年來盲評評閱結果每一年度的標準差(分別是6.425、5.062、5.937)都大于相應年度明評評閱結果的標準差(分別是3.768、3.965、3.379)。結果表明盲評評閱結果的離散程度較大,說明盲評專家對同一篇碩士學位論文的水平評價的差異較大,盲評專家評閱結果與本人的主觀判斷更為貼近。而明評專家普遍給出較高分數且成績更為趨同。
3.對論文水平總體評價比較。對評閱人對于論文的定性結論進行比較。按照碩士學位論文評閱書的分類標準,對論文水平的總體評價可以分為A-D共4類。
結果顯示明評專家給出A的比例為98.85%,高出盲評專家84.24%的比例超過15%。而在1746份明評專家的評閱意見中,給出C和D評價結果的全部為零,對于3年1746份的全部明評結果這足夠大的樣本量來說,全部為零的原因正是明評專家過不了“人情關”所致。而每年都有盲評專家給出了C(1.07%)或者D(0.27%)的結果。盲評評閱人給出的結論則更加趨于正態分布,顯得更加合理。

附圖 不同評閱方式評閱結果標準差示意圖
1.高分數段比例增加。設定80分以上的評閱得分為高分,則三年來兩種評閱方式的評閱專家給出高分總的趨勢都是有所增加的,其中盲評專家給出高分的比例提高了5.21%,他們評定得高分的論文比例增長更快。當然這其中也有明評的高分比例已經很高(三年分別是 98.7%、98.06%、99.04%),增長空間有限的原因。
2.盲評的平均分逐年提高。盲評評閱的平均分在逐年提高,(3年分別為85.87、86.04和 86.16);明評的平均分基本穩定(3年分別是89.62%、89.06%和89.36%)。盲評專家基本是基于論文本身給出評價,給出的平均分的增長較能反映學位論文整體水平的提高。
以上分析表明,此次改革是取得一定成效的:新的評閱標準更加合理,將定量評價與定性評價相結合,客觀評分和主觀表述相結合,取長補短、相得益彰;評閱流程更加規范,盲評有效杜絕了原有評閱方式難過“人情關”、流于形式的弊端,保證了評閱真實準確的反映了論文水平;評閱結果更加客觀,無論從定量的評價分數還是定性的評價結論看,盲評結果都更符合實際水平;論文整體水平得到一定程度的提高,這從三年來兩種評閱方式得到高分的趨勢都有所增加,且盲評的平均分亦在穩步提高等方面得到證明,其原因是評閱制度改革給碩士生和導師帶來了質量上的壓力。
通過前述數據比較與分析,可以看出此次改革卓有成效,但依然需要辯證的看待盲評評閱方式,評閱制度的改革還有很多方面需要進一步深化。
盲評方式能夠避免明評方式中評閱人講情面、敷衍了事的弊端,保證了學位論文評閱的嚴肅性和評價結論的權威性,但其也需改進。
1.推廣網上評閱形式,降低成本,縮短盲評周期。抽選論文和盲評單位、結算費用、處理結果等新流程帶來的事務性工作,使管理部門新增了很多工作量[2]。由于流程處理繁雜,且省外遞送需時較長,使得本來就較為緊迫的論文寫作時間更加捉襟見肘。針對這些情況,主要應對策略是推廣節省大量人力、經濟和時間成本的網上評閱形式;還可以讓作者在論文首頁列出論文的創新點等以便于專家評判,節約評閱時間。
2.建立專家信息庫,避免盲評評審專家選取的隨意性。嘗試建立評審專家信息庫,使得盲評專家的選取更有針對性。專家庫的建立應根據研究方向細分,而對于評閱結論過于泛泛者、多次給出的評閱結果與論文真實水平差距過大者、受到干擾而改變評閱結果者都列入“黑名單”,不再予以選取。總之,專家庫除了學術水平,還應在師德、誠信和學術態度等聲譽方面都制定要求,實行動態管理,避免論文評閱人選定的隨意性。
目前所有學科論文的評閱意見書是統一的,實行同一的評價指標體系和標準,無法體現不同學科門類的特點,缺乏針對性,使得評閱專家給分的標準還是帶有一定程度的主觀性。應該按照不同學科甚至不同的研究方向制定不同的個性化的細化指標體系,以便于專家更準確的掌握評價尺度[3]。在指標體系的構建中,還可單獨設置一票否決指標,只要一項不符合則論文不予通過,例如存在嚴重剽竊行為;有明顯原則性問題;無創新點;所用的主要方法不當;主要數據不真實等[4]。
目前評閱制度缺乏信息的反饋,如能建立相應的監督和反饋機制,可在一定程度上對評閱人進行監督和控制。這些機制其一是內部途徑,將論文評閱結果網上公示,增加評審結果的透明度,使得論文作者的學術水平、導師的指導水平甚至評閱專家的評審水平都接受監督,使論文評閱結果更加公正、準確;其二是引入社會機制進行監督,比如把論文裝訂成冊公開出版,附上評閱者和答辯委員會成員姓名,接受全社會的監督。
學位論文是檢驗研究生理論基礎、專業知識、科研能力、創新能力、學術水平的重要手段,是研究生培養質量的重要標志[5],繼續推進和深化碩士學位論文評閱制度改革才能確保研究生培養質量。當然,沒有任何一種評閱方式是完美無缺的,我們要在實踐中總結,不斷嘗試和改革,權衡利弊,尋找最有利于學位論文水平提高,有利于節省教育資源的評閱方式。
[1]陳新超.嚴把學位論文質量關切實提高研究生培養質量[J].福建醫科大學學報:社會科學版,2006,7(2):74-76.
[2]張宇航.博士學位論文評閱制度改革研究與實踐——以國防科技大學為例[D].2006.
[3]高坤華,劉 銘,陳亞濱.學位論文評審及答辯方式改革的探索與實踐[J].學位與研究生教育,2007(2):31-33.
[4]吳太山.匿名批量和國際化評審學位論文探析[J].科技進步與對策,2003,20(10):123-125.
[5]周紅康.研究生學位論文答辯制度的治理[J].煤炭高等教育.2006,24(4):89-91.