蔡聰裕
(福建省閩江學院中文系,福建 福州350108)
博弈最簡單的理解就是在下棋時,下棋雙方如何去決策,不僅要考慮自身決策對對方的影響,還要考慮對方決策對自身的反應和構成的影響。而在博弈G = {S1,... Sn;u1,... un}中,博弈方i的策略空間Si = {S1,... Sik},博弈方i 以概率分布Pi= (Pi1... Pik)隨機在其K 個可選對策略中選擇的“策略”,稱為“混合策略博弈”,其中0≤Pij≤1 對j =1... K 都成立,且Pi1+... +Pik=1。[1]簡而言之,混合策略博弈是博弈方以一定的概率在可供選擇的策略中隨機選擇的策略。其實,純策略也可以看作混合策略,即選擇相應純策略的概率為1,選擇其余純策略的概率為0 的混合策略,純策略的博弈方確定性地選擇某個策略。
要研究大學生逃課現象中的博弈,必須從博弈方著手。從表面上看,博弈方似乎是教師與多名學生。其實不然,這個可以從一個情境假設得到驗證。某個大學教師給101 個學生上課,在第一次課堂上要求101 個學生必須保證每一次課的到課率,如果一次的點名發現有學生逃課,逃課的同學每次逃課扣除平時分10 分,其他100 個同學扣掉1 分,期末按照百分比折合算入期末成績。從這個情景可以看出:教師可以選擇“點名”或者“不點名”,學生可選擇“逃課”或者“不逃課”,教師對學生的處罰方式是扣除平時分,并且一個學生的逃課將影響到全班其他同學的平時分。假設其中任意一個學生為X,其他100 名學生為Y,那么X,Y 形成了完全信息靜態博弈。如果全班學生都選擇不逃課,那么他們每個學生將因為上課獲取到知識而得到A 單位的效用收獲,但同時付出了A 單位的時間和精力。……