◆胡雪嬌 王艷萍 劉繼升 馬國棟 李慧
教育裝備是現代教育教學的重要手段,是改善學校的辦學水平、提高教學質量和效率的重要途徑[1]。先進的教育裝備為學校提供了豐富的教學資源和良好的教學環境,在培養學生創新精神和實踐能力方面起到重要作用。
近年來,學校在教育裝備方面的投資逐漸增大,增添和更新了許多教學設施。因此,在當前的教育教學中,教育裝備已經成為教學過程中不可缺少的重要條件。由于教育裝備的理論研究還不成熟,學校對教育裝備的管理還處于初級階段,使得教育裝備不能發揮應有的使用效能[2-3]。
為保障教學質量,滿足教育需求,學校需要及時對教育裝備進行更新和維護。由于教育裝備經費有限,因此在決定是否對裝備進行更新時,要考慮裝備更新的成本以及舊裝備維修費用等問題。教育裝備更新問題屬于教育裝備資源分配的一種,而教育裝備資源分配中的許多決策優化問題屬于多階段決策問題,動態規劃是求解多階段決策問題的有效工具[4]。本文將隨機性動態規劃應用于教育裝備更新問題,以確定一種裝備在使用多少年后更新,使得某段時間內總費用達到最小,為教育裝備的更新提供最優化策略。
動態規劃(Dynamic Programming)是運籌學的一個重要分支,它是1951年由美國數學家R.Bellman等人創立的用來解決多階段決策過程優化問題的一種方法[5]。所謂多階段決策問題,就是將問題劃分為若干個相互聯系的階段,每個階段都有一組可供選取的決策,當決策確定后,下階段的初始狀態也隨之確定。動態規劃的特點是將多階段決策問題變換為一系列相互聯系的單階段問題,然后逐個加以解決[6]。其基本概念如下:
1)階段:根據時間順序或空間特征將問題劃分為若干個相互聯系的子問題,這些子問題即為階段。描述階段的變量稱為階段變量,通常用k表示,n表示階段的個數,當某個問題被劃分為n個階段時,其階段變量為k=1,2,…,n。
2)狀態:每個階段在開始時所處的狀況。通常用Sk表示每個狀態的變量。
3)決策:當問題處于某個階段的某個狀態時,決策者做出的決定使該狀態演變到下一個狀態,這種決定就稱為決策。通常用Uk(Sk)表示決策變量,即為階段k的狀態為Sk時的決策變量。
4)狀態轉移方程:描述過程由一個狀態到另一個狀態的轉變過程。反映這種演變過程的公式記為:

5)策略:是由各個階段的決策按順序排列組成的。由k階段開始到終止狀態的決策按順序排列組成的序列稱為k子過程策略,記為:

6)指標函數:指標函數包括階段指標函數和過程指標函數[7-8]。階段指標函數記為gk(Sk,Uk),它表示在第k階段處于Sk狀態下,使用決策Uk后產生的效應。過程指標函數是用來描述實現過程效果優劣的數量指標,記為Vk(Sk,Uk),是各個階段的指標函數的累積。
7)最優指標函數:指從某一階段開始到終止階段選取最優策略得到的指標函數值,記為:

opt即最優化optimization,根據具體問題可取max或min[9]。
根據決策過程所面臨的方案是否確定,可以將動態規劃分為確定性動態規劃和隨機性動態規劃[10]。由于教育裝備在使用過程每年受到的磨損程度不同,需要的維修費也不同,根據每個階段裝備的受損程度來判斷是否進行更新,因此,采用隨機性動態規劃制定更新策略。
假設某一種裝備的使用規劃是n年,隨著使用年數的增加,需要的維修費用和更換新設備使用的費用也隨之增加。以年為單位,將裝備更新問題看作多階段發展的問題,則在每年年初都有兩種決策可以選擇:維修后繼續使用或進行更新。則設:
R表示更新設備;
K表示繼續使用;
Sk表示狀態變量,k表示裝備使用的年數(k=1,2,…,n);
R(Sk)表示第k年初裝備的維修費用;
Ck表示第k年初更新裝備的費用;
fk(Sk)表示裝備使用了k年后的最優指標函數;
xk為決策變量,在每一階段每一狀態所需作出的決策只有兩個,繼續使用(Keep)或更新(Replacement),則裝備更新問題的狀態轉移方程為:

當決策繼續使用時,函數指標值為R( Sk)+fk+1(Sk+1);當決策更新時,函數指標值為Ck+R(0)+fk+1(1)。則最優指標函數為:

某學校的某種裝備已使用一年,為保障教學效率,學校需要考慮該裝備在5年內的更新問題。因此,學校要在每年年初做出決策,是繼續使用還是更新。已知該種裝備在使用不同年限后,每年所需的維修費用和更新費用(單位:百元)分別如表1和表2所示。為確保使用經費最少,學校需要做出5年內每年的更新策略。

表1 裝備維修費用表

表2 裝備更新價格表
根據1.2節建立的隨機性動態規劃模型求解本例,首先將問題分為5個階段,每年為一階段。狀態變量Sk表示為第k年年初裝備使用的年限(k=1,2,3,4,5),如S1=1表示裝備已使用了一年;S2=1則表示上一年設備進行了更新,新裝備從第二年年初開始使用;S2=1則表示上一年設備繼續使用。
其次,根據表1和表2可以得到每個階段的維修費用和更新費用如表3所示。

表3 裝備維修費用和更新價格表
再次,根據公式(5)可以得到不同狀態下的最優指標函數:
穩態調節是對動植物生命活動的調節,在植物生長過程中會通過生長素或其他相關激素來對其生命進行調節,而動物則會利用體液和神經調節的方式進行有序的生命活動。在種植水果或蔬菜時,人們會利用催熟劑來促進植物快速生長,如乙烯具有催熟果實的重要作用。而人在調節身體平衡狀態時,都是通過自身免疫力的調節來預防疾病發生,如食用維生素。以上都是生活中常見的穩態調節。

用逆序遞推法求問題的最優解。
當k=5時,S5=1,2,3,4,5。
根據公式(6)可得到f5( S5)在S5取不同值時的指標值,見表4。

表4 第五階段決策表
當k=4時,S4=1,2,3,4。
根據公式(6)可得到 f4(S4)在S4取不同值時的指標值,見表5。

?
當k=3時,S3=1,2,3。

表6 第三階段決策表
當k=2時,S2=1,2。
根據公式(6)可得到f2(S2)在S2取不同值時的指標值,見表7。

表7 第二階段決策表
當k=1時,S1=1。
根據公式(6)可得到 f1( S1)在S1取不同值時的指標值,見表8。
根據求解結果可以得到該種裝備更新的最優決策為:第一年繼續使用,第二年繼續使用,第三年更新,第四年繼續使用,第五年繼續使用,使用的總費用為5100元。

表8 第一階段決策表
教育裝備更新是學校在管理教育裝備過程中必然遇到的問題,裝備何時更新才能保證使用的教育經費最低是學校考慮的最重要的問題。從經濟角度考慮,舊裝備每年的維修費用不斷增加,新裝備雖然有較低的維修費用,但初始投資大。因此,本文利用動態規劃的最優化原理,通過比較每年舊裝備的維修費用和更新裝備費用的大小,只有當更新裝備的費用小于舊裝備的維修費用時,才對舊裝備進行更新,使得教育經費的消耗最低。
[1]許成果.教育裝備效能綜合評價研究[D].北京:首都師范大學,2007.
[2]艾倫,興喬.話說裝備(二):教育裝備理論研究的必要性[J].中國教育技術裝備,2012(14):9-10.
[3]艾倫,姚玉琴,等.教育裝備從經驗管理走向科學管理[J].中國教育技術裝備,2009(32):17.
[4]李慧.教育裝備運籌規劃[M].北京:北京大學出版社,2010.
[5]姜啟源.數學模型[M].北京:高等教育出版社,2003.
[6]朱麗娜,馬家余.淺論動態規劃優化模型在設備更新中的應用[J].沿海企業與科技,2006(3):71-72.
[7]胡運權,郭耀煌.運籌學教程[M].北京:清華大學出版社,2003.
[8]吳強.基于動態規劃的供應鏈整合[J].科技創業月刊,2006(8):77-78.
[9]楊克昌.動態規劃最優化路徑搜索設計[J].岳陽師范學院學報:自然科學版,2000(13):55-58.
[10]麻榮永.水電站水庫隨機優化方法[M].北京:中國水利水電出版社,2001.