教育裝備評價研究

2008-04-29 00:00:00胡又農

中國教育技術裝備 2008年7期

教育裝備評價的概念

綜合評價的概念評價一詞有名詞和動詞2種形態。動詞形態的評價（Evaluate）是指：通過評價者（Evaluators）對評價對象，根據評價標準進行量化和非量化的測量，最終得出結論的過程。而名詞形態的評價是指：衡量評定的價值。

由于評價對象大多比較復雜，所以評價過程通常是綜合計算、復合分析的過程。綜合是指把被評價對象的各個部分、各種關系聯合在一起，合成一個整體。綜合評價是指對被評價對象所進行的客觀、公正、合理的全面評價。綜合評價問題具有普遍性，是一個有限方案的決策過程。

由此可見，評價是一個非常復雜的過程。它本質上是一個判斷的處理過程。Bloom將評價作為人類思考和認知過程的等級結構模型中最基本的因素。根據他的模型，在人類認知處理過程的模型中，評價和思考是最為復雜的兩項認知活動。他認為：“評價就是對一定的想法（ideas）、方法（methods）和材料（material）等做出的價值判斷的過程。它是一個運用標準（criteria）對事物的準確性、實效性、經濟性以及滿意度等方面進行評價的過程?！?/p>

多指標評價問題是指：評價主體根據自己的某種準則，對被評價對象的多項指標的信息加以匯集，而從整體上認識被評價對象在其準則下的優劣狀況。其基本思想是要反映評價對象的全貌，就必須把多個單項指標組織起來，形成一個包含各個側面的綜合指標，其數學實質是，把高維空間的樣本投影到一條直線上，通過投影點來研究樣本的規律。

如果把被評價對象視為系統的話，上述問題可抽象地表述為：在若干個（同類）系統中，如何確認哪個系統的運行（或發展）狀況好，哪個系統的運行（或發展）狀況差，這是一類常見的所謂綜合判斷問題，即多屬性（或多指標）綜合評價問題（the comprehensive evaluation problem）。對于有限多個方案的決策問題來說，綜合評價是決策的前提，而正確的決策源于科學的綜合評價。甚至可以這樣說，沒有（對各可行方案的）科學的綜合評價，就沒有正確的決策。

綜合評價的研究對象通常是自然、社會、經濟、軍事等領域中的同類事物（橫向）或同一事物在不同時期的表現（縱向）。具體的綜合評價一般表現為以下幾類問題。

第1類綜合評價問題（分類問題）：對所研究對象進行分類。俗話說：物以類聚，人以群分。把多個事物中性質相同或近似的事物歸為一類，有利于對客觀事物進行科學的管理。

第2類綜合評價問題（序化問題）：表現為對上述分類的序化，即在第1類問題的基礎上對各個小類按優劣排出順序。

第3類綜合評價問題（整體評價）：表現為對某一事物做出整體評價，當然也必須有參考系，否則無法做出評價，如果已經有了一些同類事物的評價結果（即了解其綜合表現情況），就稱其為有訓練樣本，這樣只需將所有被評價對象與這些有訓練樣本進行比較，用訓練樣本的先驗信息對該對象進行評價。

構成綜合評價問題的要素有：

1）被評價對象。同一類被評價對象的個數要大于1。世界上唯一的事物不具備可比性，也就沒有判斷或評價的必要。假定（均為同一類的）被評價對象或系統分別記為s1，s2，…，sn（n>1）。

2）評價指標。描述系統的狀況可用一組表示其屬性的數據來實現，在數學上就是一個向量x，向量中每一個分量都從某一個側面反映系統的現狀，故稱x為系統的狀態向量，它構成了評價系統運行狀況的指標體系。不失一般性，設系統有m項評價指標并依次記為x1，x2，…，xm（m>1），它們的數據分別為x1，x2，…，xm，即：

x=[x1，x2，…，xm]T

每個評價指標都是從不同的側面對系統所具有的某種特征的度量進行描述（刻畫）。評價指標體系的建立，要視具體評價問題而定。

3）權重系數。相對于某種評價目的來說，各個評價指標之間的相對重要性是不同的。評價指標之間的這種相對重要性的大小，可用權重系數來刻畫，每個指標都對應各自的權重系數，如指標x1對應的權重系數是wl，權重系數也是一組數據，也可以用向量來表示，即：

很顯然，當被評價對象及評價指標（值）都給定時，綜合評價（或對各被評價對象進行排序）的結果就依賴于權重系數了。即權重系數確定的合理與否，關系到綜合評價結果的可信程度，因此，對權重系數的確定應特別謹慎。

4）綜合評價模型。所謂多指標（或多屬性）綜合評價，就是指通過一定的數學模型（或算法）將多個評價指標值“合成”為一個整體性的綜合評價值?？捎糜凇昂铣伞钡臄祵W方法較多。問題在于如何根據評價目的（或準則）及被評價系統的特點來選擇較為合適的合成方法。也就是說，在獲得n個系統的評價指標值{xij}（i=1，2，…，n；j=1，2，…，m）的基礎上，如何選用或構造綜合評價函數：

y=f（w，x）

式中w=[wl，w2，…，wm]T為指標權重向量，x=[x1，x2，…，xm]T為系統的狀態向量。

由y=f（w，x）可求出各系統的綜合評價值yi=f（w，xi），xi=[xi1，xi2，…，xim]T為第i個系統的狀態向量（i=1，2，…，n），并根據yi值的大小（或由小到大或由大到?。⑦@n個系統進行排序或分類，從而根據評價者決策的需求，選出評價值極端或居中的系統。

5）評價者。評價者可以是某個人或某團體。評價目的的給定、評價指標的建立、評價模型的選擇、權重系數的確定都與評價者有關。因此，評價者在評價過程中的作用是不可輕視的。

教育裝備評價的定義和作用

1）教育裝備評價的定義。教育裝備評價目前無統一的定義，但大家公認教育裝備評價是一種活動，價值判斷是評價的本質，評價必須采取科學客觀的手段。教育裝備評價：按照教育的性質、教育的目標以及裝備的特點，采取定性和定量等手段，針對教育裝備全系統、全壽命的客觀事物進行測量、分析、價值判斷以及提供決策信息的一種活動。

2）教育裝備評價的作用

①導向作用。評價是一種有目標、有計劃的活動，教育裝備思想作為其核心價值觀，始終指導著評價行為。對被評價對象來說，評價實際上起著反饋作用，引導被評價對象向評價體系的核心價值觀靠攏和發展。從控制論的觀點來看，教育裝備評價是對教育裝備建設、教育裝備效能、教育裝備使用、教育裝備管理及教育裝備全系統、全壽命問題的反饋，最終是對教育裝備目標的反饋，通過反饋控制教育裝備工作的發展方向，使其能夠向既定目標發展。

②管理作用。教育裝備評價是一種管理手段，是通過評價對教育裝備全系統、全壽命的各個環節進行調節管理。每次評價都是對前期工作的總結，為今后的工作提供決策依據。

③激勵作用。合理評價有利于公平競爭，能調動多方面的積極性。

④診斷作用。教育裝備活動是一種有目的的活動，為了達到其目標，必須對活動中的各要素進行有效的調控。正確的調控來源于合理的診斷，即找出關鍵問題的所在。只有找出了關鍵問題，才能采取及時有效的措施，對問題進行調控。教育裝備評價恰能起到上述作用。

⑤鑒定作用。教育裝備評價是對教育裝備活動中各要素做出某種價值判斷或者資格證明。例如：評價結果可以用于教育裝備的選擇與建設、裝備工作者勞動效率和成果的評定、教學方法使用情況的評定等多方面。

教育裝備評價的類型

1）按評價的方法分

①橫向評價和縱向評價。橫向評價是把評價對象與其他對象相比較，不考慮被評價對象的過去和未來，只考慮被評價對象特定時間和空間的狀態，因此也稱為“靜態評價”。縱向評價是對被評價對象的過去和現在進行比較，關注其發展潛力和趨勢，因此也稱為“動態評價”。評價實踐中往往將兩者結合起來考慮。

②絕對評價和相對評價。絕對評價是將被評價對象與被評價對象總體以外的某個客觀標準進行比較，又稱“目標參照性評價”。相對評價是將被評價對象與被評價對象總體之內的特定元素進行比較，或在被評價對象總體之內排序。相對評價也稱“常模參照性評價”。

③定性評價和定量評價。定性評價是對教育裝備活動的性質方面進行分析，從質的方面說明問題。定量評價是對教育裝備活動的數量方面進行分析，從量的方面說明問題。任何事物都具備“質”和“量”這兩個方面，教育裝備活動也不例外，因此在評價工作中應注意將兩方面結合，走“定性→定量→定性”的道路。如果在教育裝備評價工作中能做到定性和定量的統一，其科學性、可靠性必將得到提高。

2）按評價的功能分

①形成性評價。在教育裝備活動過程中，對正在開展的活動進行監控，及時發現問題，提供反饋信息，給活動的調控做出決策依據。

②終結性評價。在某項教育裝備活動終止時，對其成果進行評價，或給出資格證明。

3）按評價的內容分。幾乎所有與教育裝備有關的內容都可以作為被評價對象，例如教育裝備效能的評價、教育裝備使用的評價、教育裝備目標的評價、教育裝備管理的評價、教育裝備經濟指標的評價等等。

教育裝備評價體系的設計原則

教育裝備評價的原則評價的結果是為決策服務的，評價結果勢必牽扯到各方面的利益。簡而言之，評價要做到“滴水不漏”，令各方面“心服口服”。因此，綜合評價是一個相當復雜的難題，它不但要求所使用的綜合評價方法具有科學性、客觀性和合理性，而且還要求綜合評價的過程具有“透明性”或“可再現性”。主觀臆斷和玩弄數字游戲是不可取的。

“裝備”一詞有名詞和動詞2種形態。名詞形態的“裝備”是指直接服務于教育教學的物；動詞形態的“裝備”是指對這些物的配備行為（從論證引進、設計開發到裝備退役的全過程）。因此，在討論教育裝備評價時，不僅是對物的評價，還應包括對與之相關的行為的評價。

教育裝備評價不能脫離“教育”二字，離開“教育”二字，就變成了裝備評價，而不是教育裝備評價了。教育裝備：實施和保障教育活動的所有硬件、軟件的統稱，是學校建設的物質基礎，實施教學活動的基本手段，成為衡量學?，F代化水平的重要標志。教育裝備的目的是滿足教學需求、提高教學水平。因此，在教育裝備評價時，絕不應該離開教育這個大前提。

教育裝備評價指標體系的設計原則

1）教育性原則。教育裝備服務于教育。因此，在教育裝備評價時，應注意裝備的教育適應性和裝備對教育的貢獻性。

2）方向性原則。評價結果對被評價對象來說起著反饋和導向的作用。因此，設計評價體系時應把握住評價體系的方向，這樣才能使被評價對象向正確的目標邁進。

3）一致性原則。各指標應與分析的目標一致，所分析的指標間不相互矛盾。

4）系統性原則。評價體系應能全面反映被評價對象的綜合情況，從中抓住主要因素，既能反映直接結果，也要反映間接效果，以保障評價的全面性和可信度。

5）獨立性原則。指標間應該是不相關的，指標間應減少交叉，防止相互包含。

6）可測性原則。指標應該能夠定量表示，即指標能夠通過數學公式、測試儀器或實驗統計的方法獲得。指標本身具有實際意義，含義明確，具備收集渠道，具備可操作性。

7）可接受性原則。評價體系的設計要考慮到人力、物力、財力和時間的因素；評價指標的參數獲得不能過于復雜，要具有可操作性；評價結果應能被社會認可。

8）簡明性原則。對于復雜的被評價對象，要遵循從系統到模塊，從復雜到簡單向下劃分的原則，采取分層細化的方法對被評價對象進行研究。指標不是越多越好，關鍵要考慮指標所起的作用。

9）完備性原則。影響被評價對象的所有指標均應該在指標集內，指標集應具有廣泛性、綜合性和通用性。

10）時效性原則。隨著科學技術、生產力、社會文化的發展，人們的價值觀也會不斷變化，因此評價指標和評價模型需要與時俱進、不斷調整，否則會因不合適宜導致決策的失誤。

11）客觀性原則。評價指標、評價模型的確定應避免個人的主觀意愿，指標含義應該盡量明確，參與評價指標、評價模型確定的人員應具有權威性、廣泛性和代表性，還要廣泛征集社會的意見。

各設計原則之間沖突的解決思路

1）有效性和簡便性之間的矛盾。當有效性和簡便性發生矛盾時，應該在滿足有效性的前提下，盡可能地使評價簡便，而不是反而求之。

2）系統性和可測性之間的矛盾。評價體系必須要包括各有關方面的多種因素。但是，實際情況有可能出現某些指標不易獲得或不易測度的情況，從而不能得到評價所需要的全部數據。在設計評價體系時，對與評價關系重大的指標，雖然目前一時無法獲得數據，仍要作為建議指標提出，以保證評價體系的系統性和科學性。

3）精確性和可信度的問題。評價應盡可能地精確。如果某些指標做不到精確，與其為了追求精確而假設數據，或將得不到的數據舍去，不如由專家根據經驗做定性的描述。

教育裝備評價指標體系主要內容在裝備全系統全壽命理論的指導下，教育裝備評價指標體系主要內容應包括以下3個方面：

1）裝備方面。這里的裝備是名詞屬性的裝備，主要指“物”。主要評價裝備的質量、性能、數量以及裝備系統的結構是否合理等情況。

2）管理方面。即評價裝備的管理工作，如裝備的研發、生產、采購、建設、維護、使用、退役等情況。因為在相同投資和條件下，管理水平的高低往往成為教育裝備工作好壞的關鍵。

3）教育方面。教育裝備的任務是保證教育活動的高質量完成，提高教學水平是教育裝備的目標。所以在教育裝備評價中，教育方面的指標應該占據重要位置，否則就不叫教育裝備評價了。

綜合評價的一般步驟

綜合評價的一般步驟綜合評價的一般步驟如圖1所示，具體是：1）明確評價目的；2）確定被評價對象；3）建立評價指標體系（包括收集評價指標的原始值、評價指標的若干預處理等）；4）選擇或構造綜合評價模型；5）確立與各項評價指標相對應的權重系數；6）計算各系統的綜合評價值并進行排序或分類。

有關問題一個綜合評價問題是一個很復雜的問題，是一個將主客觀信息進程綜合集成的過程。如果不持謹慎態度，不做科學分析，就會出現“表面上的科學性掩蓋實際上的不科學性”現象，從而導致決策失誤，造成損失。在做教育裝備評價時應首先明確以下問題：

問題1：評價的用意是什么？

問題2：被評價的對象有哪些？

問題3：我們要做什么樣的評價？分類？排序？還是其他形式？

問題4：我們有前期的經驗和公認的結果嗎？

問題5：哪種評價指標體系和評價模型最適合？

問題6：怎樣獲取評價指標？如果某個指標值靠不住，將會怎樣？

問題7：如何處理評價指標？定性指標如何量化？如何使指標的類型（極大型、極小型、區間型、居中型）一致？如何消除指標數據單位的影響？

問題8：評價指標間的相對重要性如何體現？

針對上述問題，可采取的措施有：

措施1：明確評價目的。評價是有明確的目的性的，泛泛的、無目的的評價是沒有意義的。評價的目的是為了決策，因此評價就要針對具體要求展開。一般來說，對被評價對象進行評價的目的有2個，一是用于總結性評價，如對裝備的效能、裝備的使用情況進行評價；二是用于發展性評價，如選擇最優方案或對候選裝備進行排隊等。評價目的取決于評價者或決策者。

措施2：評價是為了有限多個方案的決策問題服務的。評價時應嚴格劃清被評價對象的界限，在界限內的對象應了解充分，不能置之不理，被評價對象的采樣要有普遍性、可比性、可測性。對界限外的系統要排除其干擾。

措施３：針對體的要求進行評價。

措施4：前期經驗不足時，可采取經驗積累的方法，逐步實施評價。對前期已經有某些公認結果的評價，在評價時可以借鑒這些結果，在做出“顛覆性”結果時要考慮公眾的接受程度。

措施5：建立適當的評價指標體系和選用恰當的評價模型。建立評價指標體系，要視具體評價問題而定，但評價指標體系的建立應遵循如下原則：系統性、科學性、可比性、可測性、相互獨立性等。綜合評價模型有許多種，有傳統的模型，也有基于新原理、新算法的現代模型。

措施6：應保證指標的可信性。如果通過機理分析、經驗審核等途徑，發現某個指標值靠不住時，或將此值作為異常值而剔除，或對其進行重復觀測并取其平均值作為該指標的觀測值。對某些只能來源于主觀的指標，要制定客觀、合理且可操作的打分規則和標準，盡量減少主觀評價的出現次數。

措施7：評價時應采用性態一致的評價指標。通過數學變換形式，將定性指標轉化為定量指標，使指標的性態一致。指標類型不一致時，可用數學變化的方法使它們的類型一致。對指標進行無量綱化處理的方法有許多，如“標準化”處理法或功效系數法等。

措施8：權重系數的確定，是綜合評價中的一個核心問題。確定權重系數的途徑有2類：一是主觀賦權法，二是客觀賦權法。確定權重系數的具體方法有很多。

案例

某中學籌建計算機網絡教室時的方案評價計算機網絡教室主要由計算機硬件、網絡、相關軟件組成。計算機網絡教室的服務目標是信息技術課以及其他課程的新教學模式的實驗。方案評價的目的是在眾多的計算機網絡教室建設方案中選出一個最佳方案，為建設計算機網絡教室的工作做決策。

評價指標體系主要有技術先進性、教育適應性、經濟節約性和保障性4大部分內容。

被評價的計算機網絡教室方案主要分類有臺式計算機+100 M網絡、臺式計算機+1 000 M網絡、筆記本計算機+無線網絡。方案對比如表1所示。

評價的結果：臺式計算機+100 M網絡方案最佳。

就技術先進性而言，1 000 M網絡方案明顯優于100 M網絡方案，代表今后的發展方向。但是，對一般的教學任務而言，1 000 M網絡方案并無明顯的優勢，反而價格貴了很多。

就靈活性而言，筆記本計算機+無線網絡方案明顯優于臺式計算機+固定網絡的方案。但是，教學模式對靈活性沒有要求，而筆記本計算機+無線網絡方案的網絡速度相對要慢，對教學效果構成了一定的影響，且后期保障困難、使用費用很高。

以上就是臺式計算機+100 M網絡方案勝出的原因。后來的實踐證明，該網絡教室一直很好地發揮著教學支撐作用，沒有因網絡速度相對較慢而影響教學工作的完成。

某大學籌建電子電路實驗室時的方案評價電子電路實驗室主要由實驗箱和相關儀器組成。電子電路實驗室的服務目標是電子電路課以及學生的課外實驗活動。方案評價的目的是在眾多的電子電路實驗室建設方案中選出一個最佳方案，為建設電子電路實驗室的工作做決策。

評價指標體系主要有技術先進性和經濟節約性，遺憾的是教育適應性被忽略了。被評價的方案主要分類有專業方案、改造方案和廉價方案。方案對比如表2所示。

評價的結果：技術很先進的專業方案獲得了最高分數。

忽略教育適應性，單就技術先進性而言，專業方案明顯優于其他方案，適合電子專業的學生使用。但是，該實驗室并不是專門為電子專業學生建設的，主要服務于該學校理科非電子專業的公選電子電路課。實驗室建成使用后的實踐證明，該實驗室對使用它的非電子專業的學生來說有些復雜，很多實驗環節無法在規定的時間內完成，嚴重影響了教學效果。

這2個案例帶來的啟示是：做教育裝備評價工作時，一定要全面地看問題，教育裝備的“教育”二字絕不能忽視。在教育裝備問題上，現在一些教育專家對此認識不足、缺乏裝備經驗，而裝備專家缺乏教育經驗，并且對未來教育的發展也無法很好準確地預測，有很多問題有待研究。因此，做教育裝備評價工作要慎之又慎，否則會帶來不小的損失。

（作者單位：首都師范大學教育技術系）

注：本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。

中國教育技術裝備2008年7期

中國教育技術裝備的其它文章: 用好實驗設施上好中小學實驗課; 運用多媒體技術激發學生學習地理的“興奮點”; 淺談中小學校園中的氣象災害與防減對策; 信息技術與初中物理教學整合初探; “工廠供電”課程教學安排及體會; 利用趣味實驗激發學生學習化學的興趣