賈志先
摘要:到目前為止,填空等試題的計(jì)算機(jī)評(píng)分方法,基本上是利用評(píng)分關(guān)鍵字與考生的答案匹配進(jìn)行評(píng)分,評(píng)分結(jié)果并不理想。由于考生的答案多種多樣,存在著不一致(inconsistent)或不確定(uncertain)的問(wèn)題。R.Reiter缺省邏輯(default logic)推理可以有效地解決在不一致或不確定的情況下進(jìn)行邏輯推理的問(wèn)題。在N.D. Belnap四值邏輯的基礎(chǔ)上,可將經(jīng)典缺省邏輯推理推廣到四值邏輯的雙格結(jié)構(gòu)上。將四值缺省推理應(yīng)用到填空等試題的評(píng)分方法中,可使填空等試題的評(píng)分結(jié)果更加準(zhǔn)確和科學(xué)。
關(guān)鍵詞:四值邏輯; 缺省邏輯; 計(jì)算機(jī)評(píng)卷
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-2163(2014)04-0047-04
Abstract:So far, the grading methods of filling in the blanks and other topics are almost by matching keywords of grading with answers of examinee, and the results of grading are not satisfactory. Due to the answers of examinee with diversity, there are inconsistent or uncertain problems. The default reasoning by R.Reiter can effectively solve the problems of reasoning in the case of inconsistency or uncertainty. On the basis of four-valued logic by N.D. Belnap, the classic default logical reasoning can be extended to four-valued. The default reasoning based on four-valued can be used to grade filling in the blanks and other topic, so as to make the results of grading more accurate and scientific.
Key words:Four-valued Logic; Default Logic; Computer Grading
0引言
隨著計(jì)算機(jī)技術(shù)的發(fā)展,大部分考試和評(píng)分都實(shí)現(xiàn)了智能化和數(shù)字化。一些傳統(tǒng)的考試題型,例如填空題,由于計(jì)算機(jī)自動(dòng)評(píng)分難于實(shí)現(xiàn)所致,已在大部分考試中少獲采用。
近年來(lái),國(guó)內(nèi)外學(xué)者在填空等試題計(jì)算機(jī)評(píng)分方面進(jìn)行了一系列的研究[1-3]。到目前為止,填空等試題計(jì)算機(jī)評(píng)分方法,基本上是利用評(píng)分關(guān)鍵字與考生答案的相互匹配來(lái)完成評(píng)分。但在實(shí)際應(yīng)用中,這些評(píng)分方法的評(píng)分結(jié)果卻都未臻理想。并且,由于考生答案呈現(xiàn)的多樣性,這就決定了考生答案中也必然存在著不一致(inconsistent)或不確定(uncertain)的問(wèn)題,由此即可推知填空等試題的計(jì)算機(jī)評(píng)分將是一個(gè)非單調(diào)推理活動(dòng)[4]。
在非單調(diào)邏輯的作用下,可能會(huì)由于某個(gè)新結(jié)論的產(chǎn)生或者新條件的加入而推翻先前的某個(gè)結(jié)論,從而使推理過(guò)程回返至上一步[5]。Reiter于1980年提出了缺省邏輯推理(default reasoning)[6],即已有效地解決了在不一致或不確定的情況下,進(jìn)行邏輯推理的問(wèn)題。
經(jīng)典邏輯演算是二值的,即對(duì)于任何命題都只有兩個(gè)可能的真值,真(t)和假(f)。但是二值邏輯對(duì)于不完備信息和不一致信息的情形卻已宣告為無(wú)效。為了克服二值邏輯的不足,1977年,Belnap在經(jīng)典邏輯真值中,增加了兩個(gè)邏輯值⊥和┬,由此則構(gòu)成了四值邏輯[7]。1986年, Ginsberg 進(jìn)一步推廣了N.D. Belnap的四值邏輯結(jié)構(gòu),并建立了雙格概念[8],這種四值邏輯的雙格結(jié)構(gòu)為知識(shí)表示提供了方便。
本文中,在四值邏輯的基礎(chǔ)上,將經(jīng)典缺省邏輯推理外拓至四值邏輯的雙格結(jié)構(gòu)上。并且應(yīng)用四值缺省推理到填空等試題的評(píng)分方法中,則可使填空等試題的評(píng)分結(jié)果更趨準(zhǔn)確與科學(xué)。
1缺省推理
在推理過(guò)程中,經(jīng)常涉及到一些在多數(shù)時(shí)候是真,但不總是真的事實(shí)的推理。前提真,結(jié)論卻可能矛盾。應(yīng)用缺省推理,則在可能的情況下,能夠消除矛盾,并從矛盾的結(jié)論中得到可接受的結(jié)論[5]。
填空類型分為完全相同和包含等類型。其中,完全相同類型表示考生的答案與標(biāo)準(zhǔn)答案完全相同才能得分。包含類型則表示考生的答案中包含標(biāo)準(zhǔn)答案,并且在應(yīng)用缺省推理過(guò)程中,滿足理由才能得分。
一般情況下,填空等試題的答案不止一個(gè),用key_number表示答案的個(gè)數(shù)。根據(jù)答案?jìng)€(gè)數(shù)key_number,即可確定缺省推理評(píng)分結(jié)構(gòu)數(shù)組keys。
4結(jié)束語(yǔ)
由于填空等試題,評(píng)分難度較大。對(duì)填空等試題的題目進(jìn)行合理設(shè)計(jì),是降低評(píng)分難度的一個(gè)重要方面,答案應(yīng)該選擇相對(duì)確定和唯一。
在考生回答填空等試題過(guò)程中,可能在答案中出現(xiàn)了一些多余的字符,例如,空格、標(biāo)點(diǎn)符號(hào)等,另外還會(huì)存在英文字符的大小寫與試題答案不一致等問(wèn)題。因此,在評(píng)分之前,需要對(duì)考生的答案進(jìn)行規(guī)范化處理。
應(yīng)用缺省推理進(jìn)行填空題的評(píng)分,相比利用評(píng)分關(guān)鍵字與考生的答案相匹配進(jìn)行評(píng)分的方法,評(píng)分結(jié)果更為準(zhǔn)確和科學(xué)。
參考文獻(xiàn):
[1]高思丹, 袁春風(fēng). 主觀試題的計(jì)算機(jī)自動(dòng)批改技術(shù)研究[J]. 計(jì)算機(jī)應(yīng)用研究, 2004, 21(2):181-185.
[2]史娟. 考試系統(tǒng)中填空題自動(dòng)評(píng)分的設(shè)計(jì)與實(shí)現(xiàn)[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2010, 27(9):197-199.
[3]梁振球. 填空題自動(dòng)評(píng)分系統(tǒng)的研究與實(shí)現(xiàn)[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2007, 16(2):109-111.
[4]HUNTER A. Using default logic in information retrieval [A]. Symbolic and Quantitative Approaches to Uncertainty (ECSQARU'95), edited by FROIDEVAUX C, KOHLAS J, Lecture Notes in Computer Science [C]. Springer ,1995, 946:235-242.
[5]張韌弦. 基于缺省邏輯的一般會(huì)話含義例證的形式處理[J]. 當(dāng)代語(yǔ)言學(xué), 2008, 10(2):158-167.
[6]REITER R. A logic for default reasoning [J]. Artificial Intelligence, 1980, 13(1&2):81-132.
[7]BELNAP N D. A useful four-valued logic [A]. EPSTEIN G, DUMM J, editors. Modern Uses of Multiple-Valued Logic [M]. D. Reidel Publishing Company, Boston, 1977:8-37.
[8]GINSBERG M L. Multivalued logics: a uniform approach to reasoning in artificial intelligence [J]. Computer Intelligence, 1988,4: 256-316.
[9]岳安步, 林作銓. 基于四值語(yǔ)義的缺省邏輯[J]. 計(jì)算機(jī)學(xué)報(bào), 2005, 28(9):1447-1458.
[10]周北海, 毛翊. 一個(gè)關(guān)于常識(shí)推理的基礎(chǔ)邏輯[J]. 哲學(xué)研究(增刊), 2003:1-10.
[11]FITTING M. Bilattices and the semantics of logic programming [J]. The Journal of Logic and Algebraic Programming, 1991, 11(1&2): 91-116.
[12]BOU F, RIVIECCIO U. The logic of distributive bilattices [J]. Logic Journal of the IGPL, 2011, 19(1):183–216.
[13]賈肇聰. 四值邏輯的直觀語(yǔ)義[D]. 北京: 北京大學(xué), 2013.
[14]ARIELI O, AVRON A. The value of the four values [J]. Artificial Intelligence, 1998, 102(1):97-141.
[15]HUNTER A, WILLIAMS M. Aggregating evidence about the positive and negative effects of treatments [J]. Artificial Intelligence in Medicine, 2012, 56:173-190.