試析交叉學科研究的真實性評價

2007-01-01 00:00:00馬躍蔡兵雷斌

西南交通大學學報(社會科學版) 2007年6期

關鍵詞：交叉學科研究；真實性評價；評分測度規則

摘要：交叉學科研究真實性評價是檢驗交叉學科研究項目進展成效的一種評價方式，它要求研究者(組)運用所掌握的交叉學科知識和技能去再現研究成果的獲取過程或模擬真實環境下研發裝置的實際運行。真實性評價方式有自我評價、組內互評、文檔評定、表現評定和項目規劃評定等。真實性評價中的評分測度規則的構成要素包含評分準則、質量等級、評分策略和具體示例。在交叉學科研究中其評價主體應注意分析范例樣本、確定評分準劃、選擇評分策略、描述質量等級、草擬評分測度規則和在試用中修訂評分測度規則。以使研究者對自己正在研究的任務和設計方案的進展能正確評價，并由此改善其研究狀況以提高研究成果的質量。

中圖分類號：G644 文獻標志碼：A 文章編號：1009-4474(2007)06-0021-06

交叉學科研究真實性評價(以下簡稱真實性評價)是檢驗交叉學科研究項目進展成效的一種評價方式，它要求研究者(組)運用所掌握的交叉學科知識和技能去再現研究成果的獲取過程或模擬真實環境下研發裝置的實際運行。與其他評價方式相比，真實性評價特別重視交叉學科知識和技能的結合，可更直接、更真實地考察研究者(組)的研究成效。

一、真實性評價的現實背景

1、評價主體和客體的關系單一

交叉學科研究是多學科交叉融和的復雜活動，許多創造性思維產生于各學科知識的相互作用和碰撞之中，因此，對交叉學科研究知識產生過程的考察就顯得非常重要，這種考察往往需要在再現(或模擬)的研究過程中進行，需要評價主體和評價客體的互動，此時，評價主體的評價過程同時也是學習新知識、新理念的過程。從某種角度來說，評價主體在評價他人的研究過程中，自己的知識結構也同時受到考驗。但是以往的科學研究評價活動絕大多數限于評價主體對評價客體的單向評價，很少有研究者之間的評價和研究者自我的評價，更談不上評價客體在評價過程中對評價主體的知識評價。因而，無論是評價主體還是評價客體。在評價關系中都顯得單一和不足。

2、評價方式機械

目前對科學研究成效的評價大多數停留在以評價研究結果為主的層面上。評價客體事先按照評價大綱準備評價材料，評價主體審讀評價材料，進行參觀答辯，對研究成果進行孤立的、靜態的考察。但對于交叉學科研究成果，這種機械式的評價遺漏了對成果的形成過程和交叉學科思維演進軌跡的考察，忽略了對該研究成果豐富學科知識潛在價值的評估，無法有效地在具有特殊性的研究個案的基礎上對交叉學科知識的規律進行探索和概括，因而不能真實地評價交叉學科研究的效果。

3、評價內容膚淺片面

還有一些科學研究評價偏重于對知識目標的評價，即對評價客體基本知識的評價。所考察的是靜態知識的再現，而對于評價客體的思維結構、研究技能、品質、科技道德等具有啟發性的方面卻疏于評價，而這些品質和素質在交叉學科研究中的作用往往是決定性的。

由此可見，目前原有的對科學研究評價績效的評價方式，至少在具體執行中存在很大的弊端。在這種評價方式的導向下，交叉學科研究的復雜性及豐富性無法充分體現，研究過程的個性差異被淡化，研究的內容、方式、目標等也簡單趨同。

采取真實性評價方式，有可能在很大程度上彌補目前科學研究原有評價方式的不足，可以對評價客體在交叉學科研究過程中的目標、情感、態度、品行以及績效等多個方面進行評價，體現“關注過程、促進發展”的要求。

二、真實性評價的理論基礎

1、多元智力理論

多元智力理論由美國哈佛大學教授、發展心理學家加德納于20世紀90年代提出。這一理論打破傳統的將智力看作是以語言能力和邏輯—數理能力為核心的認識，認為人的智力是由言語/語言智力、邏輯/數理智力、視覺/空間關系智力、音樂/節奏智力、身體/運動智力、人際交往智力、自我反省智力、自然觀察者智力和存在智力等9種智力構成的。而各種智力只有領域的不同，沒有優劣之分、輕重之別和好壞之差。

既然有多元智能的存在，就應該以多種評價手段和方法去衡量不同的評價客體，才能發揮研究者(組)的智力優勢，讓評價客體展現自己的長處。多元智能理論提出的智能測試和傳統的智力測驗是不同的：(1)多元智能理論提出的智能測試是借助物質、器材、交談提出需要解決的問題，而傳統的智力測驗僅使用紙和筆。(2)其評估的結果只被認作是被評者智能的部分表現，不是其智能的唯一指數，也不與其他人比較排序；它只將受評者的強項和弱項加以比較，以利于提出未來探索研究方向的建議。

2、建構主義教育理論

建構主義教育理論自20世紀后期盛行至今，雖然流派紛呈，但其核心是以學生為中心，強調學生對知識的主動探索、主動發現和對所學知識意義的主動建構(而不是像傳統教學那樣，只是把知識從教師頭腦中傳送到學生的筆記本上)。

建構主義教育理論進一步主張，知識不是通過教師傳授得到的，而是學習者在一定的情境下，借助其他人(包括教師和學習伙伴)的幫助，利用必要的學習資料，通過意義建構的方式而獲得。

對上述理論的主體和行為進行重新定義，即形成真實性評價的理論基礎，評價的重點在于展現評價客體將交叉學科知識和技能遷移到不同的情境中解決評價問題的能力。因此，它要求在交叉學科研究的評價中必須關注研究者(組)的研究過程，以及在研究中的態度、情感、思維變化和與他人合作的能力等，通過對評價客體完成任務總體過程的觀察，對研究業績給予整體的評價。

如果將真實性評價作為交叉學科研究的一個組成部分，則評價的目的主要是產生一種獎勤罰懶的激勵作用，診斷評價客體的研究進展情況，并及時反饋評價客體信息，使評價客體得到相應的提示和建議，從而幫助評價客體不斷地改進和完善研究過程和結果。

三、真實性評價的方式

1、自我評價

自我評價(自評)是研究者(組)以自己作為評價主體而對自己的研究狀況進行評價的方法。自評對提高研究者(組)從事交叉學科研究的能力，改善知識結構，形成自信和良好的研究動機具有重要意義。自評的方式有多種，采用最多的是自由記述(研究日志、研究札記、自我推演等)的形式。還可以填寫學科專家或研究組負責人設計的自我評價表，在自評的基礎上，研究組內部進一步開展交流和對話，以取得研究工作共識。

研究日志(以及研究札記、自我推演)是研究者針對某個指定課題，長時間思考、體驗和表達意見的記錄。日志一般有兩種：(1)研究者獨立寫出自己的想法或感受(如長期觀察實驗過程中各種現象的記錄，在實驗過程中產生的情感體驗，對各種知識點流動的思考等)；(2)研究者在完成指定的研究任務中，按照規定的限制和準則，對自己親身經歷的研究過程的記載和體會。

通過研究者在自評過程中的真實表述，研究組或科技管理機構可以深入了解研究組內部成員對研究任務和研究動態的理解水平、對某種知識或概念交流的流暢度和探究過程，還可以了解研究者對待參與研究的學科的興趣和態度。

2、組內互評

組內互評(互評)是研究組內部成員之間相互促進的評價。在研究活動中，發現同伴的優點或有價值的進展時應給予肯定；對同伴在工作中表現不足的地方應提出建議，使大家相互激勵、共同提高。因此，互評有益于增強研究組內部成員之間的關系，主要表現在以下幾個方面：

(1)人際關系。由于自己的優點、特長和研究進展在被他人承認時產生的喜悅心情而增強自信心，從而使研究組成員之間相互激勵、相互信賴，最終結成和睦的人際關系。

(2)集體關系。用研究組成員的優點來對照自己，以發現自己的不足，并不斷修正自身；同時培養自己發現問題和解決問題的能力，以尋求相互合作伙伴和形成相互促進的集體。

(3)伙伴關系。通過組內活動，增強合作伙伴的集體榮譽感與和諧的人際關系，從而使他們從相互排斥走向相互合作。

3、文檔評定

(1)個人文檔。通過個人文檔的評定，以確定研究者在某方面的能力和成就。個人文檔應包含所選擇的研究內容及參與課題研究的情況，有大致的素材選擇的標準、判斷優良的標準以及研究者在研究探索中的自我反思等。個人文檔中的資料或信息可以包含：實驗報告、調查方案、設計圖、研究記錄、問題解決記錄、研究活動的反省記錄、著述活動、表達探究過程的著述草稿、圖式構成圖、觀察表格、元認知活動、自我評價、對將來目標的陳述、自選照片、計算機表格、完成研究任務過程的錄像。

(2)專家文檔。即研究組專家或負責人記錄自己帶領研究組成員進行項目研究活動過程及其相關成果的系列化的累計資料庫。專家文檔中的主要資料和信息包括：對研究項目關鍵部分的陳述和研究組所處的環境分析，對科技管理機構和研究組成員的記述，有關的研究現場或進展的錄像帶，來自研究管理機構、研究組成員和其他人員的評價，有關研究技術的自我評價，參加學術會議和有關成果等反映研究業績和過程的記述，研究方案及協調研究工作的分解計劃，研究組成員各自的研究規劃和研究實績的樣本和錄像帶，有關自身專業發展目標和成長過程的評估資料等。

4、表現評定

表現評定又稱實作評定。由評價主體、研究組負責人或專家觀察研究者的表現，或者對他們各方面的表現進行抽樣觀察。在進行觀察前，應當建立一個衡量的標準尺度。評定要求應事先告知研究組，并讓他們作好準備工作，主動地改進在技能或其他方面的弱點。評價主體在特定的時間與狀態下評價研究組的表現。評定記分通常根據表現任務的水平及各分解任務的等級、任務對照表(對評定內容的規定)或總體水平等幾個方面來綜合確定。

觀察內容一般包括：研究者運用概念與技能的能力、科學表征的能力、知識抽象表達的能力；研究任務涉及到解釋某個人的操作或所涉及到的過程、設計的假設、解釋科學條件、進行概括、描述各種形式或解法等；適當地應用了實驗室儀器設備、測量工具、實驗室安全程序等。

5、項目規劃評定

項目規劃評定可用于評定研究者的創造力、計劃能力、整合與歸納知識的能力、與他人合作的能力，即研究組成員在真實環境中完成任務的能力。其要點包括：有關的項目或任務通常包含的豐富的設計成分，并且所需時間較長；評定的任務與現實生活中的情況類似；讓研究者在真實環境中扮演或再現現實的角色，用真實的技能來解決真實問題；允許研究者自行發現其他解決問題的方案，正確的答案不應該是唯一的；使研究者有機會進行集體工作，也有機會單獨工作；讓研究者在研究過程中有自行創造的機會。

6、運用真實性評價應注意的事項

(1)要有助于研究者運用自主和協作的方式進行研究，引導、提高、維持研究者的探索、抽象、調查和實驗的欲望。

(2)引導研究者適時反思自己的研究過程，修正思考和研究的方法，以發現解決問題的新方法和提出新的問題。

(3)真實性評價不是強調相對等級、競爭和揭露研究者的短處，而是關注研究者的優點與進步，把研究者在研究過程中的失誤或困惑，看作他們實現正確理解或發現成功解決問題方案的轉折，重視對個體的內在激勵和肯定性評價。

(4)真實性評價不是采用一般的測度分數來衡量研究者的研究業績，而是重視研究者的實際表現和對研究中所見所聞的真實情況記錄。

(5)重視對研究者在研究過程表達和討論方面表現出的優點、意圖和態度，同時重視研究者對研究成果報告書、成果優點和特色等方面歸納描述能力的評價。

(6)真實性評價是多角度、多觀點、多種形式的。研究者對研究過程和成果屬性可進行自評和互評，重視科技管理機構、合作者和其他專家的評價，同時，評價主體要對研究者抱以肯定性和成功性評價的態度。

四、真實性評價中的評分測度規則

1、評分測度規則的內涵

一般說來，“評分測度規則”是由評價主體與評價客體協同設計和開發的描述性評分方案，是指導評價的工具。評分測度規則旨在指導評價主體詳細評價和分析評價客體研究過程以及研究成果，測定研究者在完成任務時知識理解和能力發展所達到的程度，判斷研究者自行設計的問題解決方案或其他研究成果的質量水平。與此同時，評分測度規則還為研究者提供了詳細的反饋信息。

2、評分測度規則的構成要素

評分測度規則包含4個構成要素：評分準則、質量等級、評分策略和具體示例，以便研究者在評價結束后知道應當做什么和能做什么。

(1)評分準則。評分準則是對評價內容的質的規定，即對被評屬性的規定。事實上，評分準則表明了研究者表現成功的決定性因素，提出了圓滿地完成真實性評價任務的指標以及研究者研究過程和成果的重要因素。從操作層面上講，它顯示了完成評定任務意味著什么。為了讓研究者能夠清楚知道自己的研究目標，評分準則必須要予以公布。

(2)質量等級。質量等級就是規定要達成目標的程度，即表征研究者在某一評分準則上成功或不成功的程度。質量等級詳細描述了某一評分準則的不同等級水平的(行為)表現特征，說明研究者在完成研究任務時所具有的長處以及經常遭遇的問題。一般說來，每個評分準則都可被劃分為4個不同的等級水平。

(3)評分策略。評分策略主要有整體評分和分項評分。對于整體評分策略，評價主體要綜合考慮所有的評分準則，對研究者的研究過程和階段成果的質量水平進行全面的、一次性的判斷。分項評分策略則與之不同，它要求依據描述性的成果質量等級對應每個評分準則分別進行評價，然后綜合逐項評價，得出評分結果。這兩種評價策略可以用于不同目的的評價，也可以結合起來加以運用。

(4)具體示例。評分測度規則中的具體示例旨在用研究者的研究進展材料或研究成果的樣本解釋評分準則和等級水平。在真實性評價中，研究者要明晰自己的研究成績和能力水平，必須要能親眼看見樣本或其質量的具體示例。評價主體需要從以前的研究者資料中收集一系列樣本或示例，諸如研究者創作的圖表、實驗分析報告、理論思辨手稿。科學實驗設計等。當然，評價主體在指導研者運用評分測度規則時，也應提供一些有缺陷的或質量較差的樣本。

以交叉學科研究論文為例，其真實性評價的評分測度規則見表1所示。

完整的評分測度規則是真實性評價的有效工具。運用良好的評分測度規則不僅能客觀、真實地、評判研究者的研究過程和研究成果，而且還能給他們提供有關其研究中的長處和不足之處的有價值的信息，幫助研究者提高學科知識的分類及綜合能力。如在交叉學科研究論文的評分測度規則中。不僅要求研究者在論文中證明自己具有良好的學科交叉知識的思維能力，同時也指導了研究者如何達到這個目標。

3、評分測度規則的編制

在交叉學科研究真實性評價中，評價主體需要與評價客體共同開發和設計評分測度規則。為了讓評價客體積極參與評分測度規則的編制，評價主體應當注意以下幾點：

(1)分析范例樣本。評價主體給研究者提供已有的優秀樣本和質量差的樣本，讓研究者分別討論和界定各自的特征并記錄下來。

(2)確定評分準則。根據對范例樣本討論的結果，開列出樣本質量的決定性因素，然后將其分解或綜合為評分準則。

(3)選擇評分策略。在分項評價中，評價主體應將每個評分準則劃分為3-5個等級并給予描述；而在整體評價中，須綜合所有的評分準則形成單一的描述性評分方案。

(4)描述質量等級。首先描述最好的和最差的等級質量特征，然后完成中間等級水平的描述。可嘗試利用“完全肯定(yes)”、“肯定但存在問題(hut)”、“否定但存在優點(no，but)”、“完全否定(no)”的方法，或采用“優”、“良”、“中”、“差”的簡捷等級描述。

(5)草擬評分測度規則。

(6)在試用中修訂評分測度規則。

在評分測度規則的編制過程中，應當注意不要使用不明確的描述語言且不要使之過于繁雜，不要使用消極或否定的描述語言，不要羅列過多的評分準則。

4、評分測度規則的運用

評分測度規則是否恰當主要取決于評價的目的。評分測度規則能在表現性評定和文檔評價中加以運用，但不能用于填空、選擇和簡答等單純知識記憶型能力的評價。

評分測度規則使得研究者對自己正在解決的任務和設計的方案的進展情況加以評價，這種自評的目的不在于評分或等級，而在于讓研究者由此改善自己的研究狀況并提高最終研究成果的質量。自評結束后，研究者要付出一定的精力以便修改自己的樣品，然后進行研究組內同伴間的互評。互評也是為了幫助每個研究者改善自己的研究狀況。研究組負責人或專家要檢查研究組成員間的反饋是否合理、正確。如果研究者的評價與研究組負責人或專家的評價不符，需要讓研究者自己提出相關論證。互評之后，研究組負責人或專家讓研究者對自己的樣品進行修改也是非常關鍵的。

科技管理機構、研究者的依托單位、跨學科專家和同行專家等也可運用評分測度規則對交叉學科項目研究組進行真實性評價，以明確對研究組研究工作質量的評價標準，從而更加有效地指導研究組實施研究計劃。評分測度規則能夠真正地讓科技管理機構、研究者的依托單位、跨學科專家和同行專家參與到研究組的研究過程中來，溝通評價主體和評價客體之間的聯系。

西南交通大學學報(社會科學版)2007年6期

西南交通大學學報(社會科學版)的其它文章: 從體驗構式語法淺析［能＋ＶＰ＋嗎］構式; 我國當前傳媒與公共領域問題研究現狀與反思; 英漢語“吃＊＊”的賓語代入現象及其分類; Ｆｉｓｈｅｒ判別法在高校財務風險分析中的應用; 大學英語課堂生態環境的現狀、問題與對策研究; 基于多層主成分分析的企業競爭力評價