毛延生
(哈爾濱工程大學外語系,黑龍江哈爾濱 150001)
完形測試中的語篇信息加工
——以少數民族EFL學習者為個案
毛延生
(哈爾濱工程大學外語系,黑龍江哈爾濱 150001)
在以邊疆少數民族高/低水平英語學習者的調查發現:高分組在語篇內信息的調用頻次和成功率兩個方面均遠遠高于低分組。并且兩組受試者在語篇內信息調用的策略上截然相反:高分組主要依據語篇內信息答題,然后再用分句內信息輔助確認,而低分組主要依靠分句內信息答題,再用語篇內信息輔助確認。研究結果表明完形填空能夠很好地區分不同水平的英語學習者,作為一種語篇理解能力測試手段,其效度良好,具有一定的普適性。
完形填空;效度;訪談法
完形填空是一種考察受試語篇信息處理能力的測試手段。它要求測試對象補全某一個語篇中被以任意比例或者固定比例刪掉的詞或短語,刪詞比例一般在5到10個詞之間不等[1]189。基于格式塔心理學中的完形概念,完形填空強調受試綜合語言運用能力的考察[2]44。實際上,完形填空是Taylor(1953)設計用于測試文章可讀度的程序[3]42,后來被用于測試英語本族語者的閱讀能力,再后來才被用于考查學生外語或二語綜合運用能力[4]59。與國外研究相比,國內完形測試研究存在一個怪圈:國外很少使用完形測試但是相應研究很多;而國內經常使用完形測試但是研究很少(李筱菊2001:247)。就研究內容而言,國內學者著重探究其測試效度問題,其難度問題并沒有得到充分的重視(毛延生、張建麗2008)。難度在語言測試研究中有兩層含義,因視角不同而表現出不同的內涵特點。從數理統計的角度來看,難度具有統計學意義,此時它指受試在某個題項上答對或答錯的比例(Hughes 2001)。從試題研發的角度來看,難度還具有心理學意義,因為試題難度會影響受試的心情(morale)和具體語言學能表現(language performance)(Meyers 1962)。“難度”被界定為“某一測試(項目)落入某一特定受試(群體)能力范圍之內的程度”,它“常常和測試所關注的潛在能力有關”(Davies 2002:45)。從難度的定義來看,試題難度研究不但需要關注難度的統計結果分析,更應該充分探究受試能力發揮的心理認知過程(曾用強2001)。因此,結合心理學或認知科學而展開試題難度研究顯得尤為必要。
基于前人研究文獻,我們發現破解完形填空難度問題最好的結合點之一是以受試的語篇信息加工能力為切入點。因為這一研究視角一方面立足于夯實的認知基礎之上。從認知視角出發探討二語學生在完形測試中的語篇信息加工能力可以更好地了解完形測試的難度與效度。如果不能充分了解學生在完形測試中的語篇加工能力,很難說我們真正地了解完形測試的難度。鑒于試題“難度對于建構測試的效度是個關鍵”(Davies 2002:45),因此不了解完形測試的難度就談不上保證其測試效度。另一方面,從認知視角出發研究完形填空測試中受試的語篇信息加工可以直接觸及二語學生的語言學能“瓶頸”,進而為提高他們的語言能力提供有效反饋。語言測試研究本不應該盲目相信基于成績統計的數據分析(王正元2005),重要的是如何回歸到“以人為本”的語言習得實踐中來(Swain&Deters 2007:831)。基于認知框架討論二語學生在完形測試中的語篇信息加工能力正是這樣的一種努力。無論是以漢族英語學習者為例,還是少數民族學習者為例,國內完形填空研究在這一方面尚屬研究空白。本文僅以新疆少數民族英語學習者為例進行探討。換言之,本文將以定量定性研究相結合的方法談論少數民族英語學習者的身上完形填空如何深入地測量受試的內在心理結構。從方法論上來說,這一方面,從心理認知維度為以往完形填空效度研究提供佐證,另一方面,也拓寬以往研究在少數民族英語學習者群體當中的普適性。
(一)研究概覽
本研究具有如下幾個特點。首先,從研究對象上看,本研究關注的對象是多被忽視的少數民族英語學習者。國內外語界對少數民族英語學習者的語言習得與測試研究相對關注不夠,因此探討少數民族英語學習者在完形填空測試中的表現對于了解該群體英語學習者的語言習得與測試特點意義重大。其次,從研究對象分組標準上看,我們采取綜合語言能力測試與任課教師的評價相結合的辦法,而非依賴某一方面的語言能力,以求避免對于完形填空效度的某種偏見性預測。再次,從關注焦點上看,本研究并不瞄定于某一特定測試(如CET4或TEM4)中完形填空效度的測算,而是探究一般性完形填空的效度特點,因此其效度建模的量化嘗試不是我們關心的重點。最后,從研究設計上看,出于測試情景真實性考慮,本研究測試的答題時間為限定時間,并運用訪談法從定性角度探討高/低水平英語學習者在答題過程中信息使用上所表現出來的差異。本文中,我們擬回答如下幾個問題:第一,測試過程中,完形填空刺激受試使用了哪些類型的語篇信息來完成測試?少數民族高/低水平英語學習者是否存在差異?第二,受試答題過程中成功調用了哪些類型的語篇信息?高/低分組之間是否存在差異?第三,受試答題過程中,是否涉及語篇信息調用的策略問題?高/低分組之間是否存在差異?
(二)研究對象
8名研究對象均是中國西北少數民族聚集地區一所高校英語專業三年級學生,其中維吾爾族4名(男女各兩名),哈薩克族4名(男女各兩名)。依據某一年TEM4真題的部分試題,我們對該年級200多名學生進行普測,從而確定高水平(4名)/低水平(4名)共8名研究對象,其綜合能力相關數據如表1所示。初步分組后,又征求各科任課教師意見,均表示同意初步分組結果。最后,高分組與低分組研究對象具體構成情況表2所示。

表1 高/低分組英語綜合能力概況

表2 研究對象民族與英語水平交叉表
(三)研究工具
本研究共涉及兩個研究工具。第一個是某年TEM4真題的聽寫、語法與結構、閱讀理解和寫作部分。出于保證研究對象英語水平分組的理據性,我們把它作為高/低分組別判斷的綜合水平參數。
鑒于閱讀過程實質上就是讀者在頭腦中建構起關于文本內容、層次及主題的表征系統的過程,這個過程不僅包括對一個個句子和詞的理解,更重要的是要將當前加工的信息與文本先前的、不在讀者當前工作記憶中的背景信息相整合,以形成局部與整體都連貫的心理表征。所謂局部連貫(local coherence)是指把最新讀到的句子的每一個命題與當前工作記憶中處于激活狀態的命題(特別是指前一到三個句子中的命題)進行聯系;所謂整體連貫(global coherence)是指新出現的命題與文章中先前遇到的命題(已超出工作記憶的范圍)或與有關的一般世界知識建立聯系的過程。本研究的第二個研究工具——完形填空試題設計主要遵循局部連貫與整體連貫原則設計而成。研究工具的母本源自于英語教科書[6]267。依據Bachman(1985)對于完形填空需要補足信息類型的四分法[7]191,我們按照任意比例挖空法在該語篇內設置16個空格。其中,測試分句內信息和語篇外信息的空格數為0;測試分句間信息的空格數為3,其余13個空均測試語篇內信息。試題所涉及的16個空格所需信息類型的具體分布題號如下表3所示。

表3 試題信息類型分布
以往研究[6]268表明,該試題測試信度良好:其歌德曼對半測試信度值為0.84;一般信度(Cronbach alpha)為0.80。考慮到本研究受試對象的特點,我們做了幾處修改:其中的Japan/Japanese被換成了China/Chinese。
(四)數據收集與分析
為了將試題類型對于受試的影響降到最低,確定8名研究對象后,在正式測試前一個月,研究者親自訓練受試解答此類沒有選項的完形填空4次。正式試驗展開時,研究者親自參與整個試驗過程。研究對象在安靜的教室完成測試,只有研究者和一名研究對象,數據采集共分8次完成。為了保證測試情景的真實性,我們采取測后個別訪談法①(after-test individual interview)。在正式開始訪談之前,研究對象統一接受了簡單的訪談訓練。受試答題過程中,我們不打擾研究對象,但所有研究對象必須在限定的時間內完成試題,然后馬上接受口頭訪談,以免遺忘。被訪者可以講漢語,也可以講英語。訪談過程中,研究者不能給研究對象任何帶有傾向性的提示,只是激發他們報告思維運行的情況和內容。參照一般性完形填空測試的答題時間(如CET4/6,TEM4),本研究的測試時間規定為20分鐘。研究對象的實際答題時間被記錄。在訪談結束以后,所有訪談信息被轉寫,以備定性分析。
(一)信息調用類型與組間差異
由于受試水平差異較大,加之答題時間有限,所以部分受試對于試題采取猜測(例子中帶下劃線的部分)或者放棄作答(例子中的斜體部分)的應對方式,高分組和低分組受試都存在這種情況。如例(1)和例(2)所示:
例(1)低分組(哈男):第9題不會…12題不會…14題是and,感覺吧,不確定這個…15題是社會,society,感覺…
例(2)高分組(維男):第 1題填 however,感覺中間的關系有點轉吧…第3個沒做,呵呵…第7題填example吧,這個是蒙的,呵呵…
所以出于定性數據分析的科學性考慮,數據統計中除了包括Bachman(1985)提出的四種信息[7]191之外,我們又加入了猜測與空白兩類情況[8]85。因此,受試完形填空中所用信息類型就包括如下六種情況:分句內信息,分句間信息,語篇內信息,超語篇信息,猜測和空白。下表給出了兩組受試答題過程中所調用信息類型的總體情況。

表4 語篇信息調用頻次與百分比
測試效度是指測試在多大程度上測出了預期要測量的東西[5]124。試題設計本身(考察語篇信息的空格總數為13,占該測試空總數的81.25%)就是要測試研究對象語篇信息應用能力。從或然率的角度看,通過比較兩組受試實際使用語篇內信息頻次的多少以及相應比率,就可以從宏觀上了解完形填空在多大程度上測到了要測的東西。其原因在于只有這種信息類型調用的比率越大,答對的機率才能越高。從兩組受試整體信息調用分布來看,語篇信息調用占40%,其次是分句內信息和分句間信息,各占14%和15%;最后是超語篇信息,占4%。而猜測與空白兩種情況各占11%和16%。盡管試題設計上我們排除了分句內信息和超語篇信息,但是少數民族EFL學習者卻調用上述類型信息應對局部連貫與整體連貫的建構。
從組間差異性上來看,除了在語篇內信息的調用頻次(高分組共使用31次,而低分組共使用20次)以及空白頻次(高分組3次,低分組17次)上兩組受試存有明顯差異之外,兩組受試在分句內信息(高分組12次,低分組8次)、分句間信息使用頻次(高分組10次,低分組9次)以及超語篇信息使用(高分組3次,低分組2兩次)三個方面相差無幾。由此可推,高分組受試語篇內信息調用意識明顯強于低分組。換言之,高分組受試利用整理連貫信息進行完形補全的意識更強一些。低分組對于語篇內信息調用的不力,可能是導致他們思維混亂,無從下手,不知所云,最后放棄答題,直至出現空白的主要原因:
例(3)低分組(維男):第7題沒填…第9題填waste,但是原因我說不出來,嗯。后面的3個我都沒填,嗯,不知道怎么填。
例(4)低分組(哈女):我腦子好亂啊,第 1個空我沒有填出來,第2個空,呵呵,我也沒有填出來…第10題應該說的是什么樣的不同點,應該是少有的不同點,我覺得可以填common要么填real,我考慮了兩個,但是讀的有點糊涂,我不知道是,因為它講到了很多,從種族呀,性別呀,各方面,年齡各方面嘛,我不知道他們在講中國還是美國,這兩個,嗯他們觀點的共同點還是什么。然后我腦子有點混亂,所以我兩個都沒填。
高分組與低分組受試在語篇內信息調用上的差異還可以解釋為什么低分組答題時間比較短(如下表5所示)。該測試設計本身對于受試的語篇理解能力要求就很高,如果不能調用足夠的語篇內信息,就會導致頭腦混亂,無法作答,進而放棄答題。這些特點在規定時間內答題過程中表現的十分明顯(如例(3)和例(4)所示),以往研究[6]269之所以對此沒有報告,很可能是因為采取的不是限時答題研究方法的原因。

表5 研究對象完形成績與答題用時概況
(二)信息調用成功率與組間差異
以上我們從受試在回答完形填空測試過程中,各個類型信息調用的總體分布以及組內差異角度初步分析了完形填空的效度特點。下面我們再從各個類型信息調用正確率與組間差異角度對其效度特點做進一步的探究。表6給出了受試答題過程中所調用的各個類型信息的成功率。

表6 高/低分組各類信息成功調用率
由上表可見,受試使用的最得心應手的是分句間信息(題項3、8),即局部連貫信息,其調用成功率最高(分別為93%和88.75%),且組間未見顯著差異。這可以從受試的訪談信息中得到證明:
例(5)高分組(哈女):第8題填while。句子前后,這個和這個是一種對比,前面是Americans prefer,然后后面是 Chinese feel…
例(6)低分組(哈男):第 8個,應該是 but,嗯,因為前面說的是American,后面說的是中國,然后就是一種轉折,所以就填but.
例(7)高分組(維女):因為它說嘛因此“people can say‘no’”然后后面說原因是 because they are,因為他們是…所以第3題填because.
例(8)低分組(維男):…然后,第三個就是說,就是嗯,他嗯,就是嗯,看到這個給他,比如說,就是他能夠很自由的對一個人,拒絕一個人,給一個人說no,為什么呢?是因為他們之間的那個關系是,是很獨立的。所以填的是because。一種解釋的關系。
除了在超語篇信息方面,兩組受試信息調用的成功率沒有差異之外,在分句內信息和語篇內信息的調用成功率上,高分組均高于低分組:高分組兩種類型信息的調用成功率分別為77%和68%,而低分組兩種類型信息的調用成功率分別為33%和42%。可見,受試答題過程中,成功調用的信息中包括語篇內信息,并且組間差異明顯。高水平受試不但使用語篇內信息的意識比較強,且成功率較高,而低水平受試不但語篇內信息調用的意識較弱,且成功率較低:
例(9)高分組(哈女):第 7個空是 difference,前面有個first,因為前面有個,就是but there are important differences in attitudes towards social relationship.然后是first,second,下面是third,所以這里肯定是difference。
例(10)低分組(維女):第 7題,嗯,我,我填的是example。第一那里面有個first,然后后面就是美國人的例子,談了好多,這里是second,所以也該是例子,所以,嗯,我填example。
從例(9)和例(10)可以看出,高分組受試運用語篇內信息的時候,常常考慮的更全面,因此成功率較高。而低分組受試則因為語篇內信息掛一漏萬,因此即使調用了語篇內信息,也容易理解偏狹,因此很難回答正確。
(三)信息調用策略與組間差距
兩組受試在句內信息與語篇內信息調用上還存在一個明顯區別:即在答題過程中,兩組受試調用分句內信息與語篇內信息的策略大相徑庭。當兩組受試均運用分句內信息與語篇信息來答題時,其采納的思路恰好相反。高分組常常能夠運用分句內信息(斜體加黑)來確認通過語篇內信息(下劃線)而做出的答案,如例(11)所示:
例(11)高分組(維男):第 5個空,嗯,填 group。前邊出現了一個,嗯,group members,就是while individuals are important,people also try to do everything they can for the other group members,就這,group,然后通過下文的理解,就是succeeds then each member will succeed,通過那個就是說明團隊成功了,也就,后面其它各個成員也就成功了。并且,就是后面的動詞是succeeds,所以這個一定是單數的,所以填group,嗯,對,就是。
而低分組則先是依靠分句內信息(斜體加黑)完成答題,然后再調動語篇內信息(下劃線)來確認剛才答案的正確性,如例(12)所示:
例(12)低分組(哈女):第4個空,我覺得整個應該,再者加上什么in addition,這個應該用在句子的后面,但是我看它。因為它第一段用的是on the other hand,下邊又來一個on the other hand,它肯定要補充第二個on the other hand,所以填in addition,在另一個方面。
兩組受試在語篇內信息調用策略上的差異直接受試語篇內信息調用的成功率差異:高水平受試能夠把握好語篇內信息與分句內信息之間的關系,因此“雙管齊下”,保證答題正確率。低分組受試雖然也是“雙管齊下”,但是由于分句內信息先入為主,加之語篇內信息缺少精微把握,自然誤入“歧途”,結果要么答錯,要么放棄答題。因此,從信息調用策略與組間差異的角度看,高分組受試和低分組受試之間存在顯著差異。
以上我們以少數民族高/低水平英語學習者為研究對象,從定性分析的角度對真實測試情景下完形填空答題過程中各類信息的使用進行考察,結果發現:高/低分組在沒有作答的題目數量上存在顯著差異,且兩組受試答題時間差異明顯。其原因很可能在于兩組受試在試題本身所要求的語篇內信息的使用上存在差異,主要表現在三個方面:第一,從或然率角度看,高分組受試使用語篇信息的頻率明顯高于低分組;第二,從成功率的角度看,高分組受試使用語篇信息的正確率也明顯高于低分組;第三,從策略性的角度看,高分組主要依靠語篇內信息答題,分句內信息主要用來輔助確認,而低分組恰恰相反。以上定性維度的分析均表明少數民族EFL學習者在完形測試中的語篇信息處理表現出一定的特征。據此,在具體教學過程中,一線教師需要注意語篇知識的傳授,注重傳統語法與詞匯知識的同時,強調培養學生在閱讀過程中局部連貫與整體連貫的解構與二次建構能力。這對于提高少數民族EFL學習者的閱讀能力以及寫作能力均有重要意義。
注釋:
①這里之所以采取訪談法,除了出于保證測試情景真實性的目的之外,還為了驗證以往其它內省法研究結論的普適性。
[1]Henning,G.1987.AGuide To Language Testing[M].CambridgeMass.:Newbury House.
[2]Alderson,J.2000.Accessing Reading[M].Cambridge:Cambridge University Press.
[3]Lennon.P.1998.Learner-centered Testing:ARoleforCloze[J].Language Learning Journal17.
[4]Alderson,J.1980.Native and Non-native Speaker Performance on Cloze Tests[J].Language Learning 30.
[5]李筱菊.語言測試科學與藝術[M].長沙:湖南教育出版社,1997.
[6]Yamashita,J.2003.Processesof Taking aGap-Filling Test:Comparison of Skilled and LessSkilled EFLReaders[J].Laguage Testing 20.
[7]Bachman,L.F.1985.Performanceon cloze testswith fixedratio and rationaldeletions.TESOLQuarterly 19.
[8]Sasaki,M.2000.EffectsofCulturalschemataon students’test-taking processes for cloze tests:amultiple datasource approach[J].Language Testing 17:85-114.
An Em pirical Study on Textual Information Processing——With EFL LearnersofMinoritiesasa Case
MAO Yan-sheng
(Haerbin Engineering University,Haerbin,Heilongjiang 150001)
To shake off inadequacies in termsof research subject and methodology,this paper takes an empirical study of cloze test by testing and interview ing EFL learnersofm inorities in Xinjiang Uygur AutonomousRegion.By exploring“How do theymanipulate information of different types”,we try to dig further for cloze test validity.We find that the higher proficiency group always givesbetter performance than the lower proficiency group in terms of both frequency and success rate in theirmanipulation ofacross-sentence-but-within-text information.Besides,there is great difference between the two groupswith regard to information manipulation strategy:the high proficiency group givespriority to across-sentence-but-within-text information for cracking the testing items,then they turn to within-clause information to check,while the low proficiency group takesa totally opposite orbit instead.Our findingsofferhard evidence for cloze testasameansof comprehension testwith idealvalidity and applicability.
cloze test;validity;interview ing
H319
A
1674-831X(2012)04-0049-05
2012-05-11
中央學校基礎科研項目(HEUCF121205)
毛延生(1980-),男,哈爾濱工程大學副教授,博士,主要從事語言測試和語用學研究。
[責任編輯:葛春蕃]