王 云
(巢湖職業技術學院,安徽 巢湖 238000)
據資料顯示,截至2009年,我國設置獨立高職院校達1215所,在校生964.8萬人,招生人數313萬人,與本科院校招生規模大體相當,高等職業教育已在我國高等教育中占有重要位置。僅就數量而言,高職教育已能基本滿足社會需要,然而在質量上卻未能盡如人意。究其原因,高職學生過多地將時間與精力放在專升本等提高學歷層次的學習上而忽視了在校課程的學習。這一點在高職學生的學習時間分配上表現得尤為突出:高職學生尤其是畢業班學生往往在校期間鉆研專升本課程,課余時間突擊專升本習題,將在校學習僅當作獲取畢業證的途徑,致使學生對專業基礎知識掌握不牢,同時造成其專升本課程的學習效果不佳,進而嚴重影響高職教育的質量。本文擬運用博弈論的分析方法,根據不同的假設條件,尋求在校課程與專升本課程在學習時間上的最佳分配方案。
要運用博弈論方法分析高職學生在校課程與專升本課程的學習時間分配情況,首先應明確相關理論。
每一個博弈中的企業通常都不止擁有一個競爭策略,所有策略的集合構成了該企業的策略集。在企業各自的策略集中,一個參與人的最優戰略不依賴于其他參與人的策略選擇,即不論其他參與人選擇什么策略,他的最優策略是惟一的,則稱其為占優策略(Dominant Strategy),與之相對的其他策略為劣勢策略。
納什均衡(Nash Equilibrium)又稱為非合作博弈均衡,是博弈論中最常見的均衡之一。用語言表述為:假定有n個人參與博弈,給定其他人戰略的條件下,每個人選擇自己的最優戰略(個人最優戰略可能依賴于也可能不依賴于其他人的戰略),所有參與人選擇的戰略一起構成的一個戰略組合(Strategy Profile)。納什均衡指的是這樣一種戰略組合,這種戰略組合由所有參與人最優戰略組成。即在給定別人戰略的情況下,沒有人有足夠理由打破這種均衡。從實質上說這是一種非合作博弈狀態。
如果一個戰略規定參與人在給定信息情況下以某種概率分布隨機地選擇不同的行動,稱該戰略為混合戰略(Mixed Strategy)。具體定義為:在n位參與人博弈的戰略表述 G={S1,…,Sn,u1,…,un}中,假定參與人 i有 K個純戰略:Si={Sil,…,SiK},那么,概率分別為 δi=(δi1,…,δik)稱為i的一個混合戰略,這里 δik=δ(Sik)是 i選擇 Sik的概率,對于所有的 k=1,…,K,0≤δik≤1,且
對于高職學生在校課程與專升本課程學習時間上的博弈,在不同的假定下會有不同的結果。下面的各個模型均為建立在局中人理性的假設條件下的完全信息靜態博弈模型。
1.建立高職學生學習時間博弈矩陣一
高職學生在校課程與專升本課程學習時間的博弈結果與兩種策略存在的收益現值差異息息相關。假定有A、B兩個高職學生(可以將這兩個學生作為全部高職學生分成的兩個部分),他們都面臨將大部分時間用于在校課程學習(以下簡稱“在校課程”)還是專升本課程的學習(以下簡稱“專升本”)兩個策略的選擇。現在有三種選擇:
方案一:博弈雙方都僅專注于在校課程,則高職學生普遍學歷層次提高較慢,這勢必對他們未來的求職造成一定負面影響,假定收益現值為1.5個單位。
方案二:博弈雙方都將全部時間用于專升本課程的學習。這將直接導致專科階段基礎知識不牢,而且如果專升本人數眾多且水平相當,必然會加劇競爭,專升本考試通過率將大幅降低。即使最終通過考試,畢業后求職的壓力仍會很大。考慮到上述因素,博弈雙方只能獲得2.0個單位的收益現值(比都專注于在校課程時的收益現值略有上升,是考慮到學歷層次的提高使得求職時略優于以高職學歷直接求職等現實因素)。
方案三:博弈雙方中一方專攻專升本課程,而另一方專攻在校課程,則前者由于專升本考試成功率增大使畢業后求職的壓力也減輕,可獲得3.0個單位收益現值;而后者也會因為對方的選擇使得獲得相對理想一點的工作崗位的機率上升,相應地也減輕了工作壓力,可獲得1.8個單位的收益現值。

圖1 高職學生學習時間博弈矩陣一
圖1表示的即是A、B雙方在每一策略下的博弈矩陣。從這一博弈矩陣得到的結論是:在收益現值的影響下,雙方從自身利益出發,博弈的結果只能是(專升本,專升本),即大家最終都會選擇將大部分時間花在專升本的學習上。這一結果極不理想,因為這會造成教育資源的巨大浪費,在對高職院校畢業生就業率造成負面影響的同時也會對高校畢業生就業產生巨大壓力。
2.建立高職學生學習時間博弈矩陣二
如果修改假定條件1,選擇(專升本,專升本)的收益現值比選擇(在校課程,在校課程)的收益現值(1.5,1.5)還要低,只有(1.4,1.4)。這一假定的根據是學費逐年遞增,考試制度逐步改革,專升本的會計成本與機會成本也會不斷提高。由于未能較好掌握在校課程,相應地增加了專升本學習時間。如果博弈一方選擇專注于專升本課程而另一方選擇專注于在校課程,由于競爭壓力降低,則專注于專升本課程一方會獲得較高的收益,假定現值為1.6個單位,而僅專注于在校課程的一方可能會因為畢業院校知名度不高而獲得相對低一點的收益,假定現值為1.2個單位,具體如圖2所示:

圖2 高職學生學習時間博弈矩陣二
分析該博弈的均衡可以發現:博弈雙方A與B都有占優策略即專升本,最終使得(專升本,專升本)成為上策均衡。盡管從圖2可知,(在校課程,在校課程)策略的收益現值高于(專升本,專升本),但由于博弈的A、B雙方都將注意力放在1.4與1.2的比較上,單方面改變策略,導致(在校課程,在校課程)策略不能構成納什均衡。博弈矩陣二清楚地顯示了若博弈雙方都只從自身利益出發,選擇自己認為的最優策略,最終將陷入“囚徒困境”。
通過上述博弈模型的分析發現,各模型的博弈結果均不理想:
首先,博弈矩陣一的結果是不理想的。造成這種結果的原因在于專升本的收益現值過高。要避免這種情形,只需降低專升本學習在畢業后所顯見的實際收益水平。國家和用人單位可以制定政策,縮小新就業本、專科畢業生的收入水平差距,從而使兩者收益現值大體相當。則圖1的博弈模型相應地可改為圖3:

圖3 高職學生學習時間博弈矩陣三
圖3的博弈模型結果以(專升本,在校課程)和(在校課程,專升本)為納什均衡。通過計算發現,混合戰略均衡為博弈雙方以(1/6,5/6)的概率選擇(專升本,在校課程),基本達到理想目標。同時,不同水平畢業生的收益差距可以通過“后發效應”體現。
其次,博弈矩陣二是一個典型的囚徒困境模型。要走出困境,可以增加“獎勵矩陣”來改變博弈雙方的收益結構。如圖4所示的獎勵矩陣,將每個選擇專注于在校課程學習的高職學生的收益現值統一增加了0.5個單位:

圖4 高職學生學習時間博弈矩陣四
這樣,博弈矩陣就改變成如圖5的形式:

圖5 高職學生學習時間博弈矩陣五
通過增加獎勵矩陣,博弈均衡變成了(在校課程,在校課程),但使求職壓力加大,降低了高職學生提高學歷層次的積極性。因此,需要國家政策的正確引導,使得(在校課程,在校課程)的收益現值和(專升本,專升本)的收益現值相當,而選擇(專升本,在校課程)策略或(在校課程,專升本)策略的收益現值比都在校課程學習或僅專注于專升本學習時要高,從而促使高職學生走出囚徒困境,將主要時間和精力用于在校課程的學習,同時利用課余時間進行專升本課程學習。
通過上述分析可知,較理想的博弈均衡是高職學生將主要時間用于在校課程的學習,利用課余時間進行專升本課程學習。然而,受社會傳統價值觀念、思維方式以及少數用人單位過分強調“人才高消費”思想的制約,加上部分高職院校缺乏有效就業指導機制的正確引導,許多高職學生在認識上仍存在一定的偏差,盲目追求本科學歷,在專升本課程的學習上花費了過多的時間與精力。鑒于此,要實現上文的博弈均衡,需要多方的共同努力:一方面,社會應為高職院校畢業生提供平等的就業機會,用人單位應當重視畢業生整體素質而不僅僅是一紙文憑,使廣大畢業生認識到即便是從高職院校畢業,也擁有平等的競爭機會;另一方面,學校等教育機構應給予高職畢業生正確引導,幫助他們走出“高學歷是美好未來的惟一解”的誤區;同時,高職學生也應轉變觀念,調整心態,注重自身素質的培養,合理安排在校課程學習與專升本學習的時間以更好地踐行國家的人才培養計劃并使高職學生的未來發展道路更加光明。
[1]唐華,曲楠楠.基于博弈原理的審計業務關系分析[J].財會研究,2010(5).
[2]吳耀宏,昌廣東.我國民辦高校與公辦高校教育營銷博弈分析[J].現代教育管理,2010(3).
[3]夏菊子.基于博弈分析的會計信息質量檢查問題研究[J].開發研究,2010(5).