高校教學(xué)督導(dǎo)組與專職教師之間的博弈分析

2013-04-12 00:00:00彭超華

教育教學(xué)論壇 2013年49期

摘要：利用動態(tài)博弈和重復(fù)博弈的理論，建立了博弈模型，并且在不同條件下討論了高校教學(xué)督導(dǎo)組與專職教師之間的有限次和無限次博弈。討論結(jié)果表明：督導(dǎo)組執(zhí)行長期制度化并且客觀公正的績效考核有利于實(shí)現(xiàn)督導(dǎo)組與教師之間雙贏的結(jié)果。

關(guān)鍵詞：專職教師；績效考核；博弈分析；納什均衡

中圖分類號：O225 文獻(xiàn)標(biāo)志碼：A 文章編號：1674-9324（2013）49-0143-02

高校專職教師作為高校教育師資隊(duì)伍中的重要成員，對學(xué)校整體的教學(xué)質(zhì)量，以至整個學(xué)校的生存和發(fā)展都起著舉足輕重的作用。如何科學(xué)、合理地進(jìn)行專職教師的績效考核也成為高校師資隊(duì)伍管理中的一個重要研究課題。馬志強(qiáng)[1]等人從高校是否應(yīng)該實(shí)行考評的角度，指出績效考評體系的建立是教師績效考評的前提和基礎(chǔ)。司林波[2]等人進(jìn)行了高校教師年度績效考核方案的設(shè)計。李華東[3]、陳杰[4]等人則通過建立高校與高校教師之間的委托代理模型，對高校教師從教行為進(jìn)行了博弈分析。楊雪瀅[5]等人從博弈論的角度對高校教學(xué)的督導(dǎo)效能進(jìn)行了經(jīng)濟(jì)學(xué)分析。唐仁春等人構(gòu)建了社會、高校和學(xué)生三者間的不完全信息動態(tài)博弈模型對高校教育質(zhì)量管理進(jìn)行博弈分析。本文擬利用完全信息動態(tài)博弈和重復(fù)博弈的理論和相關(guān)分析方法，重點(diǎn)分析督導(dǎo)組與專職教師之間的博弈關(guān)系，以期為科學(xué)、合理地進(jìn)行高校專職教師績效考核提供理論參考依據(jù)。

一、模型描述

高校專職教師績效考核的過程是評價主體與評價對象之間動態(tài)重復(fù)博弈的過程。評價對象系指學(xué)校的專職教師，評價主體通常包括督導(dǎo)組、學(xué)校領(lǐng)導(dǎo)、同事和學(xué)生等四個方面。高校專職教師績效考核過程涉及到的參與者眾多，關(guān)系復(fù)雜。本文主要考慮督導(dǎo)組與教師之間的博弈，通過對雙方博弈行為和策略的分析，尋找使得雙方利益最大化的均衡策略。

1.博弈的要素。①參與者，博弈的雙方分別是督導(dǎo)組和專職教師。督導(dǎo)組代表了校方的總體利益。專職教師則代表了個人利益。②策略，督導(dǎo)組對專職教師的評價有客觀評價、主觀好評、主觀差評三種行為選擇；而專職教師在督導(dǎo)組做出評價之后，有努力工作、不努力工作和消極怠工三種行為選擇。③信息，在博弈中，行動的順序、行動空間以及在每種策略組合下博弈雙方的收益都是督導(dǎo)組和教師的共同知識。督導(dǎo)組與教師之間的博弈屬于完全信息且完美信息的動態(tài)博弈。④收益，假定教師付出努力的成本為e；教師不努力工作付出的成本為0；教師消極怠工時候可以獲得的額外收入為s。督導(dǎo)組代表學(xué)校的利益，在教師努力、不努力及怠工的情況下，督導(dǎo)組獲得的收益分別是：R（e）、R（0）、R（s），并且，R（e）>R（0）>R（s）>0。督導(dǎo)組做出客觀評價需要支付的成本（比如：監(jiān)督費(fèi)用等）為C。督導(dǎo)組主觀評價則不需要支付任何評價成本。督導(dǎo)組代表校方做出主觀好評，則需要支付給教師的獎金為B；做出主觀差評，則教師會被處以罰金F。如果督導(dǎo)組做出客觀評價，則會根據(jù)教師努力、不努力和怠工的行為情況分別給予獎金B(yǎng)（e）、B（0）、B（s），并且，B（e）=B，B（0）=0，B（s）=-F。

2.博弈模型構(gòu)建。假定初始自然狀態(tài)，專職教師的教學(xué)表現(xiàn)為工作業(yè)績一般，即處于不努力工作狀態(tài)。據(jù)此，可以建立高校專職教師績效考核過程中督導(dǎo)組與教師之間的博弈樹模型如圖1所示（其中，參與者1代表督導(dǎo)組，參與者2代表教師）。

二、單次或有限次重復(fù)博弈分析

1.單次博弈分析。如果高校的績效考核僅進(jìn)行一次，即督導(dǎo)組和教師之間進(jìn)行的是單次博弈。由圖1可知，當(dāng)督導(dǎo)組選擇客觀評價時，由于B（0）+s>B（0）>B（0）-e，教師會選擇消極怠工。當(dāng)督導(dǎo)組選擇主觀好評時候，由于B+s>B>B-e，教師會選擇消極怠工。當(dāng)督導(dǎo)組選擇主觀差評時，由于-F+s>-F>-F-e，教師仍然會選擇消極怠工。在單次博弈中，無論督導(dǎo)組給出怎樣的評價，教師都會選擇消極怠工。當(dāng)然，代表校方利益的督導(dǎo)組也會選擇以最小的成本付出，即選擇主觀差評。督導(dǎo)組選擇主觀差評、教師選擇消極怠工分別是博弈雙方的嚴(yán)格占優(yōu)策略。由逆向歸納法知，此博弈具有唯一的純策略納什均衡，即：督導(dǎo)組給出主觀差評，然后教師選擇消極怠工。博弈的結(jié)果是，雙方所得的效用為（R（s）+F，-F+s）。顯然，在單次博弈中所得到的納什均衡并非原博弈的帕累托效率意義最佳策略組合。

2.有限次重復(fù)博弈分析。如果階段博弈G有唯一的納什均衡，則對任意有限的T，重復(fù)博弈G（T）有唯一的子博弈精練納什均衡，其結(jié)果就是階段博弈G納什均衡重復(fù)T次。如前所述，在督導(dǎo)組與教師之間的階段博弈過程中，存在唯一的納什均衡解。因此，如果督導(dǎo)組與教師之間的博弈重復(fù)T次，由于前面T-1次博弈的結(jié)果已經(jīng)成既定事實(shí)，無論前面階段博弈的結(jié)果如何，最后一階段（第T階段）博弈結(jié)果都是唯一納什均衡（主觀差評，消極怠工）。按照逆向歸納法的思路，在有限次重復(fù)博弈的過程中，唯一的子博弈精練納什均衡就是階段納什均衡（主觀差評，消極怠工）重復(fù)了T次。督導(dǎo)組和教師在這T次重復(fù)博弈過程的總收益分別為：（R（s）+F）·■，（-F+s）·■（δ為貼現(xiàn)因子）。

三、無限次重復(fù)博弈分析

當(dāng)績效考核被作為一種制度納入常規(guī)教學(xué)活動過程當(dāng)中時，該博弈則成為無限次重復(fù)博弈。設(shè)Ei表示第i階段教師的行為選擇，并且，Ei={e，0，s}。第i階段，在督導(dǎo)組進(jìn)行客觀評價時，應(yīng)該支出的獎金為B（Ei-1）={B（e），B（0），B（s）}={B，0，-F}。δ為貼現(xiàn)因子。在無限次重復(fù)博弈下，督導(dǎo)組和教師之間的博弈樹模型如圖2所示。

設(shè)博弈雙方在博弈過程中采取如下戰(zhàn)略組合：

督導(dǎo)組采取策略s1：在第一階段采取客觀評價，在第i階段，如果前面i-1階段的結(jié)果都是（客觀評價，努力工作），則繼續(xù)選擇客觀評價，否則選擇主觀差評；如果督導(dǎo)組在某階段選擇主觀差評，則以后都選擇主觀差評。專職教師采取策略s2：在第一階段選擇努力工作，在第i階段，如果前面i-1階段的結(jié)果都是（客觀評價，努力工作），并且在當(dāng)前階段，督導(dǎo)組選擇客觀評價，則繼續(xù)選擇努力工作，否則選擇消極怠工；如果教師在某階段選擇消極怠工，則以后都選擇消極怠工。

1.證明該策略組合是納什均衡。設(shè)教師選擇策略s2。則，督導(dǎo)組選擇客觀評價，且教師努力工作時，督導(dǎo)組獲得的效用為：u1（1）=R（e）-C+δ（R（e）-B-C）+δ2（R（e）-B-C）+δ2[B（e）-e]∧。如果督導(dǎo)組在第i階段首先選擇主觀差評，則教師從第i階段開始，以后會選擇消極怠工。督導(dǎo)組從i+1階段往后，如果選擇主觀差評，獲得的效用是R（s）+F，而選擇其他戰(zhàn)略，它在以后任何階段的利潤都不會大于R（s）+F。因此，督導(dǎo)組以后都會選擇主觀差評。其效用為：u1（1）=R（e）-C+δ（R（e）-B-C）+∧+δi-1·[（R（s）+F）+δi·[R（s）+F]+∧。當(dāng)u1（1）≥u1（2）時，督導(dǎo)組會選擇給出客觀評價，并且只要教師在第i階段選擇努力工作，督導(dǎo)組在第i+1階段會繼續(xù)選擇客觀評價。令u1（1）≥u1（2），得：R（e）-B-C≥R（s）+F。由此可知，如果教師努力工作時，校方獲得的收益扣除發(fā)給教師的獎金和客觀評價付出的成本花費(fèi)之后的剩余收益不小于教師怠工時校方獲得的收益與從教師身上獲取的罰金之和，那么，督導(dǎo)組的最優(yōu)策略為s1。設(shè)督導(dǎo)組選擇策略s1。則，教師選擇努力工作時，教師可以獲得的效用為：u2（1）=B（0）-e+δ[（B（e）-e）]+δ2[B（e）-e]+∧。如果教師在第i階段首先偏離合作狀態(tài)，即在督導(dǎo)組客觀評價下，教師選擇消極怠工，則從第i+1階段開始往后，督導(dǎo)組都會采取主觀差評。因此，教師以后也會選擇消極怠工。則教師所獲得的效用為：u2（2）=B（0）-e+δ[（B（e）-e）+∧+δi-1[B（e）+S]+δi（-F+s）+δi+1（-F+s）+∧。當(dāng)u2（1）≥u2（2）時，教師會選擇努力工作，并且只要督導(dǎo)組在第i階段選擇客觀評價，教師在i階段及以后都會繼續(xù)選擇努力工作。令u2（1）≥u2（2），得：δ≥■。當(dāng)δ≥■時，教師的最優(yōu)策略為s2。貼現(xiàn)系數(shù)δ越大，則說明未來利益比較重要，而教師的未來利益取決于現(xiàn)階段的表現(xiàn)和督導(dǎo)組的評價方式。因此，只要督導(dǎo)組采取客觀評價，教師的最優(yōu)反應(yīng)策略就是選擇努力工作。綜上所述，當(dāng)R（e）-B-C≥R（s）+F，并且δ≥■同時成立時，上述策略組合（s1，s2）是督導(dǎo)組與教師進(jìn)行無限次重復(fù)博弈的納什均衡。

2.證明該策略組合是子博弈精練納什均衡。在督導(dǎo)組和教師之間無限次重復(fù)博弈的納什均衡中，子博弈可以分為如下兩類：①始于督導(dǎo)組選擇評價方式的子博弈。如果到達(dá)督導(dǎo)組信息集的直接前列集中教師的策略是選擇努力工作，則該子博弈就等同于原博弈，那么，（s1，s2）是該子博弈的納什均衡。如果到達(dá)督導(dǎo)組信息集的直接前列集中教師選擇的行為是不努力工作或消極怠工，則督導(dǎo)組將選擇主觀差評，而教師以后將選擇消極怠工，那么，策略組合（s1，s2）同樣是該子博弈的納什均衡。②始于教師選擇行為的子博弈。如果到達(dá)教師信息集的直接前列集是督導(dǎo)組進(jìn)行客觀評價，則該子博弈同樣等同于原博弈。如果到達(dá)教師信息集的直接前列集是督導(dǎo)組以隨機(jī)概率或個人偏好選擇主觀好評或主觀差評，則在這個子博弈中教師將一直選擇消極怠工，而督導(dǎo)組將選擇主觀差評。因此，策略組合（s1，s2）仍然是該子博弈的納什均衡策略。綜上所述，當(dāng)R（e）-B-C≥R（s）+F，并且δ≥■同時成立時，策略組合（s1，s2）是督導(dǎo)組與教師之間無限次重復(fù)博弈的子博弈精練納什均衡。

3.該策略組合的現(xiàn)實(shí)解釋。在督導(dǎo)組與教師之間的博弈中，如果督導(dǎo)組將教師的績效考核作為一種教學(xué)制度實(shí)施，在考核過程中認(rèn)真、客觀地收集教師教學(xué)評估的材料，并在教學(xué)過程中對教師的教學(xué)效果進(jìn)行全程跟蹤、監(jiān)督，那么，教師將會選擇努力工作。教師努力工作后，在督導(dǎo)組的客觀評價下，又會獲得相應(yīng)的獎金作為努力工作付出的回報。此時，高校督導(dǎo)組和教師之間是一種長期的合作伙伴的關(guān)系，雙方達(dá)到雙贏的結(jié)果。但是，在現(xiàn)實(shí)諸多高校的專職教師績效考核中，當(dāng)高校進(jìn)行客觀評價時，仍然存在教師選擇不努力工作或者消極怠工的風(fēng)險。一旦教師選擇不努力工作或消極怠工，高校進(jìn)行客觀評價就會支出考核成本，因此，高校會采取主觀評價，使得整個考核過程流于形式。此時，就會進(jìn)入一種非合作狀態(tài)的博弈結(jié)果，呈現(xiàn)出高校績效考核流于形式，而專職教師也不努力工作甚至消極怠工的局面。

四、結(jié)論及展望

通過對督導(dǎo)組和教師之間的博弈關(guān)系分析，得出以下幾點(diǎn)結(jié)論和建議。

1.高校績效考核應(yīng)該作為一種長期的教學(xué)活動展開。只有當(dāng)績效考核成為高校與教師之間的無限次重復(fù)博弈時，高校的績效考核才能達(dá)到高校與教師的雙贏。

2.高校績效考核應(yīng)該努力保證績效考核的客觀公正性。博弈分析結(jié)果表明，只有當(dāng)督導(dǎo)組選擇客觀評價時，專職教師才會選擇努力工作。

3.規(guī)范績效考核獎懲機(jī)制，充分發(fā)揮高校教師績效考核的激勵和開發(fā)功能。在督導(dǎo)組和教師進(jìn)行長期博弈過程中，達(dá)到（客觀評價，努力工作）納什均衡的基本前提是，在客觀評價下，教師努力工作可以獲得的獎勵為B，教師不努力工作則不會獲得獎勵，如果怠工則會被處以罰金F。

4.促進(jìn)考核形式的多樣化，同時降低高校在評價過程的考核成本。博弈分析的結(jié)果表明，督導(dǎo)組進(jìn)行客觀評價付出的成本越低，督導(dǎo)組選擇客觀評價的可能性越大。

本文通過建立督導(dǎo)組與教師之間的完全信息動態(tài)博弈模型，對高校績效考核中督導(dǎo)組和教師之間的博弈關(guān)系進(jìn)行了分析。分析結(jié)果表明，為了達(dá)到以督導(dǎo)組為代表的高校和專職教師的雙贏狀態(tài)，督導(dǎo)組應(yīng)該公正、客觀地執(zhí)行長期制度化的績效考核，并且規(guī)范和落實(shí)獎懲制度，提升績效考核效果。

參考文獻(xiàn)：

[1]司林波，趙曉冬.高校教師績效考核方案設(shè)計及評價[J].統(tǒng)計與決策，2008，（18）：150-152.

[2]李華東.高校教師從教行為激勵的博弈分析[J].系統(tǒng)工程，2008，26（7）：92-96.

[3]楊雪瀅，張恩忠.基于博弈論的高校教學(xué)督導(dǎo)效能經(jīng)濟(jì)學(xué)分析[J].西安電子科技大學(xué)學(xué)報（社會科學(xué)版），2009，19（04）：126-129.

[4]李光久.博弈論基礎(chǔ)教程[M].北京：化學(xué)工業(yè)出版社，2005.

[5]施錫銓.博弈論[M].上海：上海財經(jīng)大學(xué)出版社，2000.

作者簡介：彭超華（1987-），女，四川鄰水人，四川大學(xué)錦城學(xué)院專職教師，助教，主要研究方向：系統(tǒng)工程，工業(yè)工程。

教育教學(xué)論壇2013年49期

教育教學(xué)論壇的其它文章: 生活，離學(xué)生還有多遠(yuǎn)？; 高職專業(yè)課程技能抽考評價模式初探; 小學(xué)背誦內(nèi)容學(xué)習(xí)研究; 開拓農(nóng)村小學(xué)語文教學(xué)的視野; 小學(xué)語文教程中的愛國主義教育; 城市和農(nóng)村的交流——小學(xué)語文學(xué)習(xí)