謝少華

摘要本文首先評介國內外具有代表性的作文自動評分系統,介紹語義網的相關概念及特點;然后分析語義網技術如何應用于英語作文自動評判系統及構建實施方案流程圖;最后展望該技術應用于中國英語學習者作文自動評分所面臨的問題和發展前景。
關鍵詞語義網技術英語寫作作文自動評判
中圖分類號:H319 文獻標識碼:A
0引言
自動作文評分就是利用計算機技術對作文進行評估與記分。自動評分系統采用了統計學、自然語言處理以及人工智能等方面的最新成果,并于1999年進入實際應用。自動評分系統有諸多優點:可靠性—計算機評分系統效果很好;客觀性—電子判分系統客觀評分標準明確,評分不受人為因素影響;經濟性—自動評分系統運作快捷而準確,節省大量人工。然而,計算機并不能像人一樣評判一篇作文,因為計算機只是“編程讓它做什么”它就做什么,不能像人一樣“欣賞”一篇文章。另外,計算機存在構念方面的缺陷。自動作文評分研究在國外,尤其是美國,得到了發展,并已付諸應用。在這些研究中,充分利用了計算機統計技術、自然語言處理技術、信息檢索技術甚至人工智能技術。
1國內外作文自動評分系統
1.1PEG(ProjectEssayGrader)
自動評分技術的研究起始于20世紀60年代。美國杜克大學教授EllisPage率領研究團隊于1966年開發出第一套作文自動評分系統PEG(ProjectEssayGrader)。其特點是重語言表面結構分析而相對忽略語言內容。
1.2IEA(IntelligentEssayAssessor)
IEA是上世紀90年代末由PearsonKnowledgeAnalysisTechnology公司開發的。IEA注重對作文內容的分析,利用信息檢索中的潛在語義分析法進行作文自動評分。
1.3E-rater(ElectronicEssayRater)
E-rater是由美國ETS的JillBurstein博士等人在上世紀90年代末開發的。目前ETS正利用該系統對GMAT中AnalyticalWritingAssessment部分進行評分,并于2005年開始應用于托福考試的作文評分。
1.4IntelliMetricTM
IntelliMetricTM是由美國VantageLearning公司開發的第一套基于人工智能的作文評分系統。它能夠模仿人工評卷,在1到4或者1到6的分值范圍內對作文的內容、形式、組織和寫作習慣進行評分。
近年來,該方向的研究在國內也逐漸得到外語教學界和自然語言處理界的重視,但與國外相比,國內的相關研究具有明顯的探索性和探討性,研究的針對性和實用性較弱。國內最早涉足自動作文評分領域的是梁茂成教授,其研究方向是中國學生英語作文的自動評分。由梁茂成教授主持開發的“大規模考試英語作文自動評分系統”已于2005年申請了國家專利,并研制完成,投入使用。另外,浙江大學與杭州增慧網絡科技有限公司共同研發一套自動作文評分系統2009年始在華東地區高校使用。然而,作文自動評分系統,也受到了一些專家和學者的質疑,自動評分系統的準確性還有待進一步證實;學生使用計算機的熟練程度在很大程度上會影響他們的得分;學生可以采取很多技巧取悅電腦評分器而得高分。此外,現有的英語作文自動評分系統,計算機評分無法發現有些幽默表達及獨特的風格,評語牽強模糊無針對性。由此可見,計算機評分還有一段很長的路要走。縱觀國內外的作文自動評分系統研究,語義網技術的應用和研究用于英語作文自動評分系統還處于空缺或起步階段。
2語義網技術應用于英語作文自動評判系統
與21世紀是計算機和網絡時代一樣,作文評判如果能借助現代技術,特別語義網技術,有可能實現作文自動評判的科學化和人性化。也能為大規模的學習輸入性學習提供有效的技術手段,同時也是從新的角度、新的視野改革傳統的語言學、教育學、人文學教學內容及教學方法。
我國大學英語寫作,是順應我國國力提高、培養高素質的社會主義建設人才的一門十分重要的課程。評閱作文,是必須的教學環節和教學實踐。研究實用的,面向大學英語寫作教學的自動作文評判方法,將有望突破寫作批改量大、難度大的瓶頸,為教、學雙方帶來切實的幫助。也能為教學改革提供有益的方法和手段,使教學改革從方法、內容、手段達到新的高度,使教學改革走提高核心競爭力的道路。
“語義網”技術的問世可以使計算機模似人評判作文、“欣賞”文章。“語義網”的理念是伯納斯·李在發明萬維網10年之后,于1998年,提出的下一代的萬維網。廣義上,語義網可以認為是能將當前的網絡信息理解為一種帶有語法、句法的網。語義網是按照能表達網頁內容的“詞語”鏈接起來的全球信息網;換言之,是用機器很容易理解和處理的方式鏈接起來的全球數據庫。狹義上,語義網更接近本體含義,理論上被認為是一種能對知識進行描述的網,因而能最完善地解決計算機信息,特別是知識類信息智能化問題的方法。語義網還是能理解人言的智能網,具有和人一樣的智能,懂得思考,學習。語義網最核心的技術,就是將網絡中的語言,即自然語言,仿照人的理解方式合理安排,使網絡處理的信息內容(自然語言)進行語法、句法、語義的處理,提高人機交互的效率和便利。語義網技術,就是語義理解,包括語義、語境、語法等方面信息,是語言學與現代技術的高度結合,是十分重要的未來技術。
近十年來,語言學家、信息技術專家在這個未來人工智能領域做了大量的研究和有效的實踐,已經奠定了可喜的應用基礎,并在網絡進行了有益的嘗試。
3實施方案流程圖
語義網技術研究成果及有益的嘗試,使我國高校英語作文智能化自動評判的實現成為可能。語義網核心技術,能自動標注自然語言語法、語境、語義,并具有自然語言理解的學習功能。如圖1所示,如果大學英語教師運用該技術對學生作文的評判從語法、語境、語篇、語體進行深入研究,并讓該系統自動學習教師的方法,該系統就能像大學英語教師一樣,對作文的各方面進行評判,不僅是評分,并能反饋詳盡而有針對性的文字。尤其是那些能夠為學生提供有用的、對寫作改進具有指導意義的反饋。
4展望
語義網技術的研究成果,從自然語言的語義層面,理解人類思維,對于未來網絡在超大內容中,對特定信息精確搜索及獲取,起著不可估量的作用。但本研究是采用先分解自然人的思維過程,通過語義網技術的學習功能,對人的思維過程進行摸擬,達到一定程序的自動學習機理,從而實現計算機智能學習系統,來逐漸完成作文自動評判,探索計算機智能學習能力的機理,特別是自然語言理解的機理,解開自然語言研究中的空白,語言理解機理及學習機理,為突破語義網技術的瓶頸打下良好的語言學的理論基礎。
語義網技術的研究成果可實現對中國學生英語作文的人性化計算機評判,讓計算機像人一樣評判學生英語作文,給高校英語寫作與評判帶來的將是巨大的變革。研究成果將網絡信息時代語義網技術用于英語作文自動評判系統的構成和創建模式,以及為英語寫作課教師作文批改提供個性化知識傳遞和個性化教學服務。同時,本研究完成,能充分利用互聯網,提供范圍更廣的服務,為學習者提供便利的學習條件,也能為已經畢業的工作人員提供繼續學習的條件,在遠程教育及逐步發展而來的社會化學習、終身學習社會中,為提高我國人力資源素質具有十分重要的戰略意義和不可替代的重要作用。
參考文獻
[1]白同強,劉磊.語義網的研究與展望[J].吉林大學學報(信息科學版),2004(2).
[2]鄒申.語言測試[M].上海:上海外語教育出版社,2005.