羅海元 趙晉 賈敏敏



摘 要:近年來,研究生學術不端行為頻發,加強研究生學術誠信培養刻不容緩。從演化博弈的視角出發,構建了高校與研究生之間的博弈支付矩陣,通過計算復制動態方程,求解穩定均衡點,從而對雙方演化穩定策略進行探索,并經實證分析對模型進行驗證。在深入分析影響主體行為的關鍵要素的基礎上,從外部主體、高校和研究生三個層面提出建立研究生學術誠信培養長效機制的相關建議。
關鍵詞:研究生教育;學術誠信;演化博弈;復制動態方程
問題的提出與研究進展
近些年,在科研隊伍不斷擴大,研究成果漸趨豐碩的同時,抄襲、剽竊、學術造假等學術不端問題也逐漸顯現。學界對研究生學術誠信培養問題的相關研究集中在三個方面:一是失信行為的表現;二是導致失信行為的原因;三是保障學術誠信的對策。2016年6月,教育部對“學術不端行為”做出了明確規定,將其定義為一種在學術研究活動中發生的違反學術規定和準則、違背學術誠信規范的一種行為,并采用列舉式定義對學術不端行為進行表述。①研究表明:學術失信包括很多方面,李建國等(2014年)將研究生學術失信行為總結為研究成果存在剽竊、引用他人學術成果不注明出處、偽造數據和一稿多投四種具體表現,其中一稿多投現象在研究生群體中表現最為普遍。[1]造成研究生學術失信的原因有外部和內部兩個方面:外部因素主要包括社會環境、學校教育、學術評價制度和導師;內部因素則與研究生自身的素質和價值觀念有關。[2]還有一些學者運用定量方法分析這些影響因素的強弱程度。[3]學者們主要從三個層面探討如何保障研究生學術誠信:一是宏觀上要推進社會誠信建設,營造良好的社會和學術風氣;二是中觀上要加強并完善制度建設,包括學術評價制度、監督制度、問責制度等;三是微觀上要通過榜樣示范、思想教育等方式提高研究生的自我修養。整體來看,當前研究主要集中在宏觀層面和中觀層面,對研究生個體關注較少。作為學術失信行為的主體,個人對失信行為的認知、態度和行為直接影響最終的結果。因此,有必要對研究生個體進行深入分析,挖掘失信行為的內在心理動機,探尋失信問題產生的根源。
行為主體的行為之間普遍存在相互作用和彼此依賴,博弈論分析方法在研究主體行為選擇問題上具有適用性和優越性。一些學者就此進行了有益探索,如周潔等(2016年)聚焦研究生學位論文質量問題建立了研究生與高校的混合策略博弈模型。[4]但傳統的博弈論分析中嚴格的理性人假設和完全信息假設在現實世界中很難實現,相比而言,演化博弈論有限理性和信息不對稱的假設更具實際意義。[5]因此,我們嘗試以演化博弈論為視角,構建高校與研究生之間的演化博弈模型,在分析影響主體行為的關鍵要素基礎上探討建立研究生學術誠信培養長效機制的對策建議。
研究生學術誠信演化博弈模型的建立
1.問題描述與基本假設
演化博弈理論是一種結合了博弈理論分析和動態演化分析的理論,其核心概念是演化穩定策略(ESS)和復制動態方程,ESS下的群體能夠獲得最佳收益并消除任何突變小群體的擾動,與之密切相關的復制動態方程是演化博弈理論中運用最為廣泛的選擇機制動態方程,通過復制動態方程的演算即可得到博弈雙方群體的ESS。[6]
研究生受高校直接監督管理,研究生學術誠信與否在很大程度上與高校的監管力度有關。監管力度越大,意味著學術失信越容易被發現,即學術失信的成本越高,此時學生須衡量失信帶來的收益和付出的成本之間的差額。當然,也可能出現學生雖然學術造假卻沒有被發現的情況,但無論被發現與否,學生必然會承受一定的心理壓力,也可以看作是成本的一部分。對于高校來說,理論上應該落實好監管責任,杜絕一切失信行為的發生。然而,監管需要付出成本,監管力度越大,付出的成本越高;且對學術失信的后續處理和問責也需要相應投入,因此高校也會衡量嚴格監管與容忍學生兩種情況下分別付出的成本與獲得的收益。
為建立博弈模型,做出以下假設:一是行為主體有限理性,即行為人不需要掌握完美的最優化決策規則而只需要依據簡單的數學計算和統計模型形成有利于自身利益最大化的經驗法則,[7]整個系統達到均衡是一個漸進的動態調整的過程;二是信息不完全,即參與博弈的行為主體并不具備有關的經濟基本面的所有信息,也不清楚市場均衡方程的具體內容;三是博弈雙方具有異質性,即行為主體在認知程度或群體感知度等方面存在差異;四是即使高校嚴格監督,學術造假學生也有一定的可能未被發現,假設學生學術造假行為被發現的概率為p,則未被發現的概率為1-p。
模型中的博弈雙方為研究生和高校。研究生群體的策略集合為{誠信學術,學術造假};高校的策略集合為{嚴格監督,容忍學生}。學術造假分被發現和未被發現兩種情況,博弈模型在理論上有六種可能的結果。其中,“高校容忍學生,研究生學術造假且被發現”這一情形不合邏輯,實際上只有五種可能結果。
2.建立博弈支付矩陣
為方便問題探討,設定以下參數:Cs:研究生學術造假行為付出的成本,包含學生選擇學術造假行為所承受的心理壓力、勞動成本、時間成本等;Rs:研究生學術造假行為未被發現時得到的收益;Is:研究生學術造假行為被發現后受到的學校處分以及個人信用損失等負面影響;Ru:高校選擇嚴格監督所帶來的榮譽或口碑收益;Cu:高校選擇嚴格監督投入的時間和勞動成本,大小等于高校容忍學生時的收益;Iu:高校選擇容忍學生學術造假行為時,其所帶來的對學校學風和口碑的負面影響。由此構造博弈雙方的支付矩陣(見表1)。
表1 學術誠信博弈支付矩陣
研究生
高校 誠信學術 學術造假
被發現 未被發現
嚴格監督 (Ru-Cu,0) (Ru-Cu,-Cs-Is) (Ru-Cu,Rs-Cs)
容忍學生 (Cu,0) — (Cu-Iu,Rs-Cs)
研究生與高校的演化博弈分析
1.復制動態方程
假設在t時刻高校群體中選擇嚴格監督策略的比例為x(t)(0 記u1與u2分別表示t時刻高校在采用嚴格監督策略與容忍學生策略時的期望收益,則整個高校群體的平均期望收益為u=xu1+(1-x)u2;記w1和w2分別表示t時刻研究生在選擇誠信學術與學術造假時的期望收益,整個大學生群體的平均期望收益為w=yw1+(1-y)w2。根據表1的支付矩陣,高校與研究生的復制動態方程如下所示: 2.演化穩定策略(ESS)分析 復制系統(3)中有五個平衡點,分別為P1(0,0)、P2(0,1)、P3(1,0)、P4(1,1)、P5(x*,y*),其中 求偏導得復制系統(3)的雅可比矩陣為: 根據弗里德曼提出的穩定均衡點判別方法,對于一個由微分方程系統描述的群體動態,只有當雅可比矩陣H的行列式為正數,且其跡為負數時,才能達到局部平衡點的穩定性,即當|H|>0,tr(H)<0時,此平衡點是演化穩定策略(ESS)。對于P5(x*,y*),此時|H|<0,tr(H)=0,因此P5(x*,y*)是復制系統(3)的鞍點。 3.博弈模型實證檢驗 通過分層抽樣對X大學研究生實施問卷調查:一是人口統計學變量;二是學術失信基本情況調查,包括是否存在學術失信情況,對學術失信的態度,學術失信的主要表現,失信成本與收益(以貨幣來衡量);三是學術失信行為的影響因素,包括自身原因,導師對學術失信的態度和學校政策等。問卷共發放90份,回收有效問卷76份,問卷有效率為84.4%。結果顯示:97.37%的被調查者認為學術誠信是進行學術研究的一項基本行為規范,必須嚴格遵守。然而,研究生學術失信問題仍然存在,主要表現在剽竊、抄襲他人研究成果;引文不當,杜撰參考文獻兩個方面。在被問及何種情況最易導致學術失信時,畢業壓力這一因素占比最高。 通過問卷調查最終求得:Cs=1475元②,Rs=1961元,Is=1173元③。目前,教育部出臺了一系列政策加大對學術造假行為的懲罰力度,但并沒有采取相應的激勵措施或是公開排名等方式以推動高校不斷加強對學術造假行為監督力度,因此Ru接近于0。Cu是高校選擇嚴格監督投入的時間和勞動成本,大小等于高校容忍學生時的收益,鑒于時間成本與勞動成本不可量化,將其轉化為學校全面普及論文查重系統的單位價格(元/人/次),通過查找相關材料④可得Cu=325元。鑒于目前我國各高校的實際情況,通過對近幾年學術造假的典型案例進行分析[8],可以看出研究生因學術造假而引發廣泛關注的實例相對較少,在高校緊急公關、妥善處理的前提下,對學校口碑的影響幾乎可以不計,因此令Iu=ε(ε為趨近于0的一個正數)。假設學術造假行為被發現的概率為p,則未被發現的概率為1-p。依據教育部提出的研究生學術論文的合格標準,論文查重率在15%以內即為合格,則說明在嚴格監督的條件下,研究生學術造假而未被發現的概率1-p≤15%,即p≥85%,本文中p取85%。將以上數值代入P1(0,0)、P2(0,1)、P3(1,0)、P4(1,1)、P5(x*,y*)可得ADF檢驗結果:P1穩定,P2不穩定,P3不穩定,P4穩定,P5鞍點。 4.基于博弈模型的主體行為演化分析 參數Ru+Iu-2Cu表示高校采用嚴格監管策略相比于容忍學生時的額外效益,只有當Ru+Iu-2Cu<0時,高校管理者才有動機去容忍學生。調查結果顯示:參數Ru+Iu-2Cu<0,說明高校采用嚴格監管策略的收益小于容忍學生時的額外效益,高校存在容忍學生學術造假的動機。Rs-Cs表示大學生學術造假且未被發現時的總效益,調查發現Rs-Cs>0,說明學生有學術造假的動機。假如高校恰好在這一時間段嚴格監督的比例低于0.1824,則[Rs-Cs-(Is+RS)px]>0,即學生采用學術造假策略時的期望收益為正,學生會采取學術造假策略。 相應地,由上述學生選擇學術造假比例的復制動態方程可知:若x=x*,則G(x,y)始終為0,即在y水平上所有的點均為穩定點;若x≠x*,則y1=0和y2=1是兩個穩定狀態,其中y1=0是ESS。同理,由上述高校選擇嚴格監管策略比例的復制動態方程可知:若y=y*,則F(x,y)始終為0,即在x水平上所有的點均為穩定點;若y≠y*,則x1=0和x2=1是兩個穩定狀態,其中x1=0是ESS。根據上述反應的復制動態和穩定性,不難發現此博弈的演化穩定策略只有x1=0和y1=0這一點。這意味著在沒有制度約束的情況下經過長期習得和調整的策略結果是:學生選擇學術造假,而高校選擇容忍這一行為,這對高校乃至整個教育體系來說,無疑是最壞的結果。因此,需要相應的制度設計來使得學生學術造假的期望收益不斷減少到零乃至負數,以避免這一糟糕處境。 研究生學術誠信培養的長效機制探索 1.外部層面 若使系統演化至理想的穩定均衡策略(嚴格監督—誠信學術),即就是增大鞍點P5(x*,y*)趨近于穩定均衡點P4(1,1)的概率,在外部層面上可以通過改變Iu的大小來實現。當高校選擇容忍學術行為時,學生學術造假所帶來的對學校學風和口碑的負面影響Iu不斷增加時,鞍點P5的橫坐標值不變,縱坐標值將趨近于1。由此可知,負面影響Iu對研究生學術誠信問題的演化趨勢起到影響作用,負面影響Iu的值越大,則越能激勵高校通過實行嚴格監督來保證研究生的學術誠信。這就需要建立起對各高校研究生學術誠信情況的評分評級系統,由有關部門或機構定期對各個高校的研究生學術誠信監管情況進行檢查評價,并建立配套獎懲制度。可將表現優秀的高校樹為典型,經由宣傳示范,鞭策高校提升學術誠信監管整體能力。 2.高校層面 對于高校而言,只有采用嚴格監管策略相比于容忍學生時的額外效益,即Ru+Iu-2Cu>0時,高校管理者才有動機采取嚴格監管策略。因此,可以從增加Ru和降低Cu兩個方面激勵高校選擇嚴格監管。由于Ru是高校選擇嚴格監督所帶來的榮譽或口碑收益,一方面,Ru可以來自對高校落實好監管責任的獎勵;另一方面,也可以通過將這一評價結果納入學校整體辦學水平的考核之中來增強嚴格監督行為的收益。Cu是高校選擇嚴格監督投入的時間和勞動成本,要想降低Cu,需要高校通過創新監管制度和優化監管環節等途徑實現。同理,先進經驗的宣傳推廣也是降低高校監管成本的一個有效途徑。 3.研究生層面 w1和w2分別表示t時刻研究生在選擇誠信學術與學術造假時的期望收益,而w1(t)=0,只有當w2(t)不斷減少到零乃至負數時,學生才有動機選擇學術誠信,此時鞍點P5(x*,y*)的橫坐標值將趨近于1,系統收斂于理想的穩定均衡點P4(1,1)的概率變大。顯然,Rs、Cs、Is的變化都將改變鞍點的橫坐標的位置,且Rs減小、Cs和Is增大時,學生選擇學術誠信的動機越強。 4.措施層面 就此可采取的措施有: 第一,建立學術誠信教育體系。具有高學術誠信素養的研究生能夠自覺遵守學術準則和規范,自發杜絕學術失信行為的發生,主要是因為研究生個體對學術誠信有了更準確、更深刻的認知,學術失信所造成的認知失調會使他們背負更沉重的心理負擔,即失信帶來的心理成本Cs會增大。因此,高校應當開展多種形式的教育培訓活動,將學術誠信教育作為研究生培養的必要內容,貫穿研究生培養的整個過程,通過提高研究生的誠信素養來增加學術造假所付出的心理成本。 第二,建立健全學術誠信監管機制。一方面,嚴格完善的監管機制會對研究生起到警示作用,增加其學術造假的心理成本Cs;另一方面,覆蓋事前、事中和事后全過程的監管體制也大大減少了研究生學術失信行為未被發現的可能性。 第三,建立嚴格的失信懲處機制。高校對于學術造假者應秉持零容忍的態度,學術失信行為一旦發生,一定要給予相應的懲處,并且要對學術造假行為進行通報批評,高校可以依據學術造假行為的嚴重程度施加不同力度的懲處。當前,針對研究生的相應懲處措施大部分只局限于高校內部,對其未來產生的影響不大,難以起到足夠的威懾作用。未來還應建立起研究生學術誠信檔案,將學術誠信與個人信用掛鉤,增加學術造假對個人信用損失的負面影響,即增加學術造假者的試錯成本Is。 第四,建立科學的學術水平考核評價機制。一些研究生之所以選擇學術造假,在很大程度上與學術水平的考核評價機制有關,有些高校過分注重量化考核,導致學生盲目地追求科研成果的數量而非質量。一些學生為了獲得更高的評價,往往會選擇學術造假這一捷徑。高校應該建立起更加科學的學術水平考核評價機制,引導研究生潛心于真研究,努力取得具有較高水平的原創性成果。這一機制實際上也減小了研究生學術造假行為未被發現時得到的收益Rs,有助于激勵研究生誠信學術。 綜上所述,高校仍然是學術造假行為預防與處理的主體,高校的監管機制建立情況直接影響著研究生學術策略的選擇;有關部門或機構對高校的監督和獎懲又會影響高校對學術誠信監管機制的實施,如圖1所示。因此,建立研究生學術誠信培養的長效機制,首先要強化高校嚴格監管的動機,通過加強外部監管和獎懲促使高校選擇嚴格監管策略;高校逐步建立健全學術水平考核評價、誠信教育、誠信監管、失信懲處等制度體系;研究生經過權衡得失,將自發作出學術誠信的策略選擇。若研究生選擇學術誠信策略,則有關部門或機構對高校的評級相應升高,正向激勵效應將引導高校不斷完善其監管機制,進一步促使研究生堅守學術誠信,從而實現良性互動循環,推動研究生誠信培養長效機制逐步形成。 圖1 研究生學術誠信培養主體及其作用關系 結語 本文采用演化博弈思想,通過構建高校與研究生之間的支付矩陣,計算復制動態方程,求解穩定均衡點,對雙方演化穩定策略進行探索,取得以下結論:一是高校與研究生之間的策略選擇受到研究生學術造假成本,學術造假未被發現時的收益,高校對學術造假行為的懲處力度,高校嚴格監督時的收益、成本以及高校容忍學術造假行為對學校的影響程度這六個主要因素的影響。整個復制動態系統中雖然存在兩個穩定的均衡點,但不會固定停留于某一點。二是就高校而言,不斷增強嚴格監督而產生的收益,擴大學校容忍學術造假行為對高校學風和口碑的不利影響,不斷降低學校嚴格監督的成本均可有效促進高校完善研究生學術誠信管理制度,提升研究生培養質量。三是就研究生而言,降低學術造假所帶來的收益,增加學術造假的成本,合理降低論文查重率均可有效防止學術造假行為。希望上述結論能夠對相關研究有所裨益,并獲得更大規模的數據支持。 本文系中央財經大學2018年黨建和思想政治工作理論研究課題成果 注釋: ① 中華人民共和國教育部.高等學校預防與處理學術不端行為辦法[Z].2016-06-16. ② 首先將學術造假行為分解為五種表現形式,被調查者選出其中最具代表性的兩個,將每種具體行為下的成本加權平均,權數即為處理過的被選擇的每種行為的頻率. ③ 在調查中,被轉化為在已知學術失信行為被發現后會受到學校處分及個人信用損失的前提下(不計其他成本),多大金額能誘使冒險. ④ 資料來源于學校官方網站,該校自2013年起針對研究生啟用學位論文學術不端行為檢測系統. 參考文獻: [1]李建國,賈玉,管麗兵.近十年來研究生學術誠信問題研究述評[J].高等理科教育,2014(1):33-38. [2]魏海斌,牛玉堃,張元園,等.研究生學術誠信現狀析因及保障對策研究[J].大學教育,2018(12):188-190. [3]劉志波,孔垂謙.研究生學術誠信危機影響因素的灰色關聯分析[J].中國高教研究,2008(2):33-35. [4]周潔,顧永東.研究生學術道德失范行為博弈研究[J].黑龍江教育(高教研究與評估),2016(7):61-63. [5]謝織予.經濟博弈論[M].上海:復旦大學出版社,2002:3-24. [6]易余胤,劉漢民.經濟研究中的演化博弈理論[J].商業經濟與管理,2005(8):8-13. [7]卡爾斯·霍姆斯.復雜經濟系統中的行為理性與異質性預期[M].忻丹娜,李娜,譯.上海:上海人民出版社,2016:9-12. [8]劉普.我國學術不端問題的現狀與治理路徑—基于媒體報道的64起學術不端典型案例的分析[J].中國科學基金,2018,32(6):637-644. (作者單位:中央財經大學政府管理學院) [責任編輯:卜 珺]