張江麗
(北京華文學院,中國北京102206)
第二語言詞匯量測量工具研究綜述
張江麗
(北京華文學院,中國北京102206)
詞匯量是反映第二語言學習者語言水平的重要指標。本文對英語第二語言和漢語第二語言教學界有關詞匯量測量的工具進行了綜述,分析了詞匯測量結果產生差異的原因,以期為編制高水平的詞匯測量工具提供參考。
詞匯量;測量工具;第二語言學習
詞匯量是反映學習者詞匯習得水平的重要指標,一直以來受到語言教學研究者和語言學習者的關注。語言教學研究者想了解第二語言學習者到底掌握了多少詞匯量,第二語言學習者想知道自己掌握的詞匯量到底達到了什么水平。在制定第二語言教學大綱時,詞匯量是需要考慮的重要指標。要想制定適合并能反映學習者水平的詞匯量標準,首先就要了解不同水平的第二語言學習者詞匯量的現狀,這就離不開對他們的詞匯量進行測量。
在第二語言習得研究中,有關詞匯量的測量直到20世紀80年代才開始受到重視。第二語言學習者詞匯量的測量始于英語第二語言教學領域的研究。20世紀80年代,英語第二語言教學界的一些學者先后編制了測量學習者英語詞匯量的工具。直到21世紀,隨著漢語第二語言教學的發展,一些學者才開始編制漢語詞匯量測量的工具。
1.Nation(1983)編制的“VLT”
新西蘭學者Nation在1983年設計了Vocabulary Levels Test(詞匯等級測試卷,簡稱VLT),該問卷設計之初,主要是為了幫助教師調查學習者的接受性詞匯量。Read(1988)對該測量工具的效度進行了驗證。該測試包括五個水平的詞匯量的試卷:即2000、3000、5000、10000詞匯。
在第二語言詞匯測量工具缺乏的時代,這一問卷在當時影響很大,一經問世就被廣泛采用。1990年,Nation出版了第二語言詞匯研究的專著Teaching and Learning Vocabulary,書中介紹了VLT的具體設計,這也進一步推動了VLT的傳播。1993年,Nation又制定了不同版本的VLT,后來形成了4個版本,即Version A,Version B,Version C,Version D。
2.桂詩春編制的詞匯調查量表
1983年秋至1984年春,中國英語專業教材編審組先后在我國十余所外語院系對英語專業二、四年級學生進行了一次英語水平測試。
英語詞匯量調查是這次測試的一個重要組成部分。這一測試以10000個英語常用詞為調查范圍,使用分層隨機抽樣的辦法從中抽出200個樣本,配以漢語的正確答案和干擾項目,組成一份試題,然后根據成績推斷出學生的英語詞匯量。這一詞匯量表開創了中國英語第二語言教學界詞匯測量的先河,后來被很多學者采納和使用,學者們在不同類型的學生群體中進行過多次試驗,取得了較可信的結果。
3.Nation(1990)編制的“10000水平詞匯量測試”
該測試是一個控制性產出詞匯量的測試(controlled productive vocabulary test),旨在衡量被試對詞匯的掌握程度。這是一個具有一定的信度和效度、在國外被研究者普遍采用的測量工具(Laufer,1998;Laufer&Nation,1995;Meara&Fitzpatrick,2000)。
在詞匯范圍的選取上,與VLT一樣,這一新的測試也旨在測量學習者在高頻、中頻、低頻和學術類詞匯方面的詞匯知識。測試采用完形填空的方式,為了避免其他可能的答案,題目中給出了目的詞的前一個或幾個字母,通過句子填空來估算學生產出性詞匯量。
該測試共有18個不完整的句子,要求被試根據語境和所提示的開頭幾個字母填入合適的單詞,詞性和詞形必須正確。填對一個單詞得一分。這種測試方式對被試提出了更高的要求,不僅要求被試正確拼寫單詞,而且還得掌握詞匯知識。
例如:“The crowd soon disp_____ when the policemoved.”正確單詞應該是disperse。Disperse的其他形式均被視為錯誤。
4.Read(1993)編制的詞匯深度知識測量工具
Read于1993年推出了自己制定的詞匯深度知識測量工具。這一測試采用詞匯聯想測試(Word Associate Test)的方式,旨在測試學習者詞匯習得的深度。
1998年,Read對原試卷進行了修訂。該試卷所測試的詞語均為高頻詞,一共包含40個目標詞。每個目標詞均有8個選項,每4個一組放在左右兩個方框中,要求學生選擇4個在語義上與測試詞有聯系或能與測試詞構成搭配關系的詞。
該測試主要從詞語搭配的角度來測試學習者的詞匯使用能力,分別測試目標詞的聚合關系,即近義詞及詞的多義項以及詞的組合關系,共4個正確選項。

如sound:__________________________________________________________________ logical、healthy、bold、solid snow、temperature、sleep、dance
在左邊方框中,與目標詞“sound”意思接近的有3個:logical、healthy和solid。在右邊方框里與“sound”可以搭配的詞有1個,為“sleep”。正確答案數量不確定,左邊方框中與目標詞意思接近的詞可以是1個、2個、3個、4個。右邊方框中可以與目標詞搭配的詞數量同樣也不固定。這樣可以減少受試的盲目猜測。每選對一個得1分,選錯為0分,總分為160分。
5.Schmitt等人(2001)編制的“VLT”
Schmitt,Schmittand Clapham(2001)在Nation(1983,1990)詞匯量測試問卷的基礎上設計了一套新的試題。該測試包括五個水平的詞匯量的試卷:即2000、3000、5000、10000以及學術詞匯。所測試的詞匯量越多,所測試的詞的頻率越低。其中2000詞匯和3000詞匯代表英語中的高頻詞,5000詞匯處于高頻詞和低頻詞之間,10000詞匯代表低頻詞。其中的學術詞匯來自Coxhead(2000)學術詞表,該詞表覆蓋了28門學科中出現頻率最高、使用度最廣的詞語,一共包含570個詞語。
在平衡了詞匯的難易程度及詞匯教學的需要后,Schmitt等人將學術詞匯部分置于3000詞和5000詞之間。
Schmitt等人編制的試卷每個部分包含10道題。題型采用詞義匹配的方式,每道有六個目標詞,三項英語釋義,要求被測者從六個目標詞中選出符合英語釋義的三個詞,被試答對一個得1分,答錯為0分,總分為156分。英語的釋義均采用1000到2000詞匯水平的高頻詞,避免受試因看不懂英語釋義而影響測試的有效性。該測試的一大優點是能給出各個詞頻層次上的詞族量,能對詞匯量的發展提供更精細的指標。
2000、3000、5000、10000以及學術詞匯這五個水平各有十道題,現各選一道題展示如下:
The 2000 word level
(1)copy _____end or highest point
(2)event _____thismoves a car
(3)motor ______thing made to be like
(4)pity
(5)profile
(6)tip
The 3000 word level
(1)bull ______formal and seriousmanner
(2)champion ______winner of a sporting event
(3)dignity _____building where valuable objects are shown
(4)hell
(5)museum
(6)solution
Academ ic Vocabulary
(1)area written agreement
(2)contract ______way of doing something
(3)definition ______reason for believing something is or is not true
(4)evidence
(5)method
(6)role
The 5000 word level
(1)analysis _____eagerness
(2)curb ______loan to buy a house
(3)gravel ______small stonesmixed with sand
(4)mortgage
(5)scar
(6)zeal
The 10000 word level
(1)alabaster _____small barrel
(2)tentacle _____softwhite stone
(3)dogma_____tool for shaping wood
(4)key
(5)rasp
(6)chandelier
6.Nation和Beglar(2007)編制的“VST”
雖然VLT在英語詞匯量測試中被廣泛運用,但是Nation并不滿足于此。在他看來,VLT只能模糊說明受試的詞匯量水平。后來他在VLT的基礎上進行了修訂,在2007年,Nation和Beglar兩人于2007年合作編制了Vocabulary Size Test(詞匯量測試卷,簡稱VST)。隨后Beglar(2010)證實了VST的效度。Beglar認為VST為教師和研究人員測量二語學習者的書面接受性詞匯量提供了一種新的工具,該工具提供的測量是可靠的、準確的、全面的,是能夠精確判斷學習者詞匯量的水平測試。
VST包含最常用的14000個英語詞族。其中每1000個詞為一個等級,每一個等級有10個測試項。VST總計有140個測試項。每個測試項的每一個被測詞放在一個簡短的語境中。測試采用多項選擇的方式。
測試范例如下:
Miniature:It is aminiature.
a.a very small thing of its kind
b.an instrument to look at small objects
c.a very small living creature
d.a small line to join letters in handwriting
在漢語第二語言教學中,有關詞匯量的調查并不多。值得關注的有以下幾個:
錢旭菁(2002)以《漢語水平詞匯和漢字等級大綱》中的甲、乙兩級詞(3051個)為測量常用詞的詞匯范圍。選取了其中的名詞、動詞和形容詞。并給名詞、動詞、形容詞分別編號,然后采取等距抽樣的方法,隔七選一個,最終選取了300個詞作為測量試卷中的目標詞。問卷采用釋義法和翻譯法的形式分別進行調查。
張和生(2006)設計了“留學生漢語詞匯量測量表”。采用隨機抽樣的方法從《漢語水平詞匯與漢字等級大綱》中隨機抽取,但這種抽取又非完全隨機,而是考慮詞語的等級(詞頻)、音節、詞類、詞義選擇樣本,并適當考慮詞語樣本書寫筆畫的多寡等因素。在不得不考慮控制測量時間長度的限制下,每一級詞匯的選擇比例均控制在1.5%,共選取132個詞語作為測量樣本。該統計僅限于測量被試對詞語書面形式的辨識程度,并且采用五點量表的統計方法讓學習者進行主觀評定。
沈禾玲(2009)采用學生自我評定的方式測試了美國高級漢語水平的學生對8500常用詞匯的掌握程度。這8500常用詞主要來自北京語言學院語言教學研究所1986年編寫的《現代漢語頻率詞典》,選取其中的1%作為樣本進行測試。試卷樣本如下:
1.自己
I.Ihave no idea of this word.
II.Iam not sure if Iknow thisword,but Iguess ismeans____________(W rite out themeaning in English)
III.Iknow thisword,Itmeans___________(Write out themeaning in English)
IV.I can use thisword in a sentence___________(Write a sentence in Chinese)
在沈禾玲設計的測量問卷中,IV是讓學習者用目標詞寫出一個句子,這實際是在測量學習者的產出性詞匯的質量。所以這一測量是綜合了理解性詞匯量和產出性詞匯量這兩個指標。
綜上所述,在詞匯測量工具的研制和開發上,英語第二語言教學的起步較早,成果較為豐碩,在第二語言教學界的影響也相對較大。而漢語第二語言界的相關研究較為滯后,并且尚未出現公認的影響力較大的權威測量工具。
從第二語言教學界有關詞匯量測量工具的形式來看,主要包括單選(Schmitt,2001)、詞匯聯想測試題(Read,1993、1995、1998)、完形填空(Laufer&Nation,1999)、翻譯(錢旭菁,2002)、自我評定(張和生,2006)等。
在設計詞匯測量工具的題型時,學者們都有自己的考慮,單選題是為了方便學習者進行選擇,但對干擾項的設計要多加考慮。詞匯聯想測試題可以減少測量工具的長度,縮短測量所需的時間,降低學習者的焦慮和煩躁情緒。完形填空是為了測得有控制條件下的學習者的詞匯量。翻譯這一題型相對簡單,問卷容易設計,但是在測量起來,容易出現學習者可能理解詞的意思卻不會表達的情況。自我評定類問卷的設計較為簡單,但由于學習者的風格不同,所以容易出現過高或過低估計自己詞匯量的情況。
從英語和漢語第二語言教學詞匯量測量工具中目標詞的來源來看,均來自常用詞表,多數采取了分層抽樣的方法,也有少數通過隨機抽樣得到。雖同為常用詞表,每個詞表內部所包含的詞也不盡相同。此外,對詞表的分級也不一致,有的以2000詞匯、3000詞匯、5000詞匯為分級界限,有的以1000詞匯為界限進行逐層分級。
不少學者對國內英語第二語言學習者的詞匯量進行了調查,測試結果差異較大。鄧昭春,曾中平(1998)對本科涉外專業和非涉外專業學生的詞匯量進行了調查,調查結果顯示,入學時他們的平均詞匯量分別為3500和3533個。邵華(2002)的測試顯示普通高師院校學生的入學詞匯量為2574個,二年級學期結束為3811個。呂長竑(2004)對西南地區重點理工科大學新生的詞匯量進行了調查,結果顯示他們的詞匯量為2145個。崔艷鄢、王同順(2006)調查發現英語專業學生的接受性詞匯量一年級為3391個,四年級為7199個。
在漢語第二語言教學領域,錢旭菁(2002)以3000常用詞為選詞范圍,運用釋義法和翻譯法測量了學習了一年半到兩年半漢語的日本學生的詞匯量,測量結果顯示,這兩種方法的測量結果分別為2750個和2169個。江新等(2004)對十余萬字的“外國學生漢語作文語料庫”進行了統計,分析了一至三年級以漢字文化圈為主的留學生作文用詞情況。統計結果顯示,各年級留學生使用的詞語總量為3985個。因為語料庫反映的是學習者筆語輸出的情況,基于語料庫的調查結果反映的是學習者的產出性詞匯量。張和生(2006)統計結果顯示,學習時間在25個月以上的學習者的詞匯量約為3986個。沈禾玲(2009)測試了美國高級漢語水平的學生對8500常用詞匯的掌握程度。調查結果顯示,學習了三年的漢語學習者掌握的消極詞匯的平均數量為2229個,其中最高的是5050個。學生掌握的積極詞匯的平均數量為1314個,最高的數量為3400個。
以上研究的結果表明,第二語言教學界詞匯測量的結果有時會有一定的差異,造成這些差異的原因大概有以下幾個方面:
1.對詞匯知識的認識不一
詞匯知識包含哪些內容?Richards(1976),Nation(1990),Wesche&Paribakht(1996),Chap-pelle(1998),Henriksen(1999),Qian(1999)等學者先后提出了各不相同卻又互補的理論框架。
目前學界普遍將詞匯知識分為接受性詞匯(receptive knowledge)和產出性詞匯(productive knowledge)(Henricksen,1999;Melka,1997),也有人稱作消極詞匯和積極詞匯(沈禾玲,2009),或認知型詞匯和活用型詞匯(吳麗君,2004)。接受性詞匯是學習者能夠辨識的詞匯,而產出性詞匯指學生在口語或書面語表達中能夠使用的詞匯。針對產出性詞匯,Laufer和Nation又將其細分為控制性產出詞匯和自由產出詞匯。控制性產出詞匯是學習者在受到任務刺激時可以產出的詞匯,如單詞造句或完形填空,這兩種形式都在一定程度上給了被測者一種提示,因此是有控制的;自由產出詞匯是在自由寫作或談話過程中學習者自主使用的詞匯。
詞匯知識還可以分為詞匯廣度知識和詞匯深度知識。廣度知識是指學習者詞匯量的大小(Wesche&Paribakht,1996;Hazenberg&Hulstijn,1996)。深度知識(depth of knowledge)包括詞的語音形式、文字形式、概念義、聯想義、語法特點、搭配、語用等(Henricksen,1999;Read,1993;Wesche&Paribakht,1996)。
對于詞匯深度知識到底包含哪些,不同的學者也有不同的觀點。一種將詞匯知識進行分類描述,如Cronbach(1942),Nation(1990),Laufer(1990,1993)等。他們認為一個詞的詞匯知識包括這個詞的意義和用法的不同方面。Cronbach(1942)認為理解一個詞包含下列五個含義:類化(generalization)(能給該詞下定義)、應用(application)(選擇該詞的一個適當用法)、意義的寬度(breadth ofmeaning)(回憶該詞的不同意義)、意義的準確度(precision ofmeaning)(在各種可能情形中正確地運用詞義)以及易聯想性(availability)(能產出性地使用詞語)(Read,1997)。Nation(1990)認為,了解一個詞意味著知道它的形式(口頭和書面)、位置(語法句型、搭配)、功能(頻率、得體性)和意義(概念、聯想)(Laufer&Paribakht,1998)。另一種觀點認為詞匯的發展是連續的,如Dale (1965),Faerch等(1984),Palmberg(1987),Henriksen(1996)等。他們認為詞匯知識是由不同水平和知識面組成的連續體,所調查到的詞匯知識不過是詞匯習得過程中某一特定階段詞匯知識的反映。如Faerch等(1984)認為這種詞匯連續體的起點為對詞形的模糊了解(即知道這個詞是目標語中的一個詞),終點為在自由產出中正確使用這個詞的能力。而Dale(1965)將這個連續體分為五個階段:I.我以前從未見過該詞;II.我聽說過該詞,但不知道其含義;III.我在語境中認識它,它與……有關;IV.我知道該詞;V.我能夠把該詞跟其它在意義上與其密切相關的詞區別開來(Read,1997)。
桂詩春(1985)在介紹自己設計的詞匯量測試工具時,曾客觀地指出,這一調查只能測試學生對單詞的基本意義的理解。有些人對某些詞的基本意義不知道,然而懂得其次要意義。該調查無法反映這種情況。
學界對接受性詞匯、產出性詞匯、詞匯廣度知識的界定基本一致,對于詞匯深度知識,我們認為,它是一個包含詞的意義和用法的不同方面的連續體。詞匯量的測試只能反映學習者在一定學習時期對詞的意義和用法的掌握情況。
2.對詞的定義不一
在進行英語詞匯量測試時,一些學者把詞的屈折形式、派生詞和合成詞分列為不同的詞(鄧昭春,1998),另外一些學者則將這些形式看作一個詞。
Bauer和Nation(1993)認為一個基礎詞及其派生詞和屈折形式構成一個詞族。測量時應該以詞族為單位統計詞匯量。我們認為在英語中,詞匯的派生詞和屈折形式無需一一逐個學習,將其看作一個詞族符合心理詞匯的構成方式,也有助于詞匯測量研究的標準化。
3.詞匯量表中詞的抽樣方法、抽樣數量、詞匯來源不同
張和生(2006)設計的“留學生漢語詞匯量測量表”,采用隨機抽樣的方法從《漢語水平詞匯與漢字等級大綱》的甲乙丙丁四個等級的詞匯中抽取,并加以人工干預。錢旭菁(2002)以《漢語水平詞匯與漢字等級大綱》中的甲、乙兩級詞(3051個)為測量常用詞的詞匯范圍,隔七選一進行等距抽樣。前者最終抽取132個詞匯樣本,后者選取了300個詞匯作為樣本。
鄧昭春、曾中平(1998)面向英語學習者的詞匯量測量采用分層隨機抽樣的方法,從1000個常用詞中抽取了200個樣本進行測試。
關于詞匯量表中詞的來源,最常見的有兩種,一是從第二語言的詞匯大綱中抽樣選取,二是從常用的詞頻統計表中抽取。常用的詞頻統計表基本上是根據母語者的詞匯使用情況而做出的統計,面向第二語言學習者并非完全適用。第二語言教學的詞匯大綱通常是建立在母語者的詞匯頻率統計的基礎上,并考慮第二語言學習者的學習需要,加以人工干涉而編制的,更適合第二語言學習者的實際情況。
4.調查對象和時機不同
桂詩春(1985)與鄧昭春、曾中平(1998)測試所采用的問卷完全相同,但是測量結果不同。因為桂詩春的測試是面向英語專業二年級和四年級進行的,而鄧昭春、曾中平則是面向涉外專業和非涉外專業的學生入學時的水平進行的。
我們認為開展面向不同學習背景、不同水平的第二語言學習者的詞匯量調查是十分有必要的,這對于我們了解和把握學習者在不同階段的詞匯習得情況,編制更為完善和科學的教學大綱是非常有益的。
詞匯測量需要考慮的因素還有很多。所要測量的詞匯量是理解性的還是產出性的?是口語的還是筆語的?測量中的詞匯是獨立的還是嵌入文本的?測量對象是在母語環境下學習的還是在目的語環境下學習的?這些都可能影響詞匯測量的結果。在編制詞匯量表時,這些都是應該考慮的因素。漢語第二語言的詞匯測量剛剛起步,相關的研究還不夠豐富,有關詞匯測量的工具有待進一步開發。我們可以借鑒英語第二語言教學詞匯測量的經驗,開發出適合漢語第二語言的詞匯測量工具。
大學英語教學大綱修訂組《大學英語教學大綱(修訂本)》,上海:上海外語教育出版社,1996年。
鄧昭春、曾中平:《本科生英語詞匯量調查與教學思考》,《外語與外語教學》,1998年第10期。
桂詩春編:《中國學生英語詞匯量調查》,《公共外語教學研究文集》,上海:上海外語教育出版社,1983年。
呂長竑:《詞匯量與語言綜合能力、詞匯深度知識之關系》,《外語教學與研究》,2004年第2期。
錢旭菁:《詞匯量測試研究初探》,《世界漢語教學》,2002年第4期。
沈禾玲:《廣度與深度——美國高年級學生詞匯習得調查》,《世界漢語教學》,2009年第1期。
張和生:《外國學生漢語詞匯學習狀況計量研究》,《世界漢語教學》,2006年第1期。
Coxhead,A.A new academic word list,TESOLQuarterly,2000.34(2):213-238.
Henriksen,B.Three dimensions of vocabulary development.Studies in Second Language Acquisition,1999.21(3):303-317.
Laufer B.&Nation P.A vocabulary size testof controlled productive ability.Language Teating,1999.16,(1):33-51.
Laufer,B.&Nation,I.S.P.Vocabulary size and use:Lexical richness in L2 written production.Applied Linguistics,1995.16:307-22.
Laufer,B.The development of passive and active vocabulary in second language:Same or different?Applied Linguistics,1998.19:255-71.
Laufer,B.&Nation,I.S.P.Vocabulary size and use:Lexical richness in L2 written production.Applied Linguistics,1996.16 (3):307-322.
Nation,I.S.P.Testing and teaching vocabulary.Guideline,1983.5(1):12-25.
Nation,I.S.P.Teaching and Learning Vocabulary.New York:Newbury House Publishers.1990.
Nation,I.S.P.&Beglar.Vocabulary size test.The Language Teacher,2007.31:9-12.
Paribakht,T.S.&Wesche,M.Toward a lexical processingmodel for the study of second language vocabulary acquisition: Evidence from ESL reading.Studies in Second Language Acquisition,1997.19(3):309-329.
Qian,D.Investigating the relationship between vocabulary know ledge and academic reading performance:An assessment perspective.Language Learning,2002.52(3):513-536.
Read,J.Validating a test tomeasure depth of vocabulary knowledge.In A.Kunnan(ed.).Validation in Language Assessment.Mahwah,NJ:Lawrence Erlbaum,1998.41-60.
Read,J.The development of a new measure of L2 vocabulary knowledge.Language Testing,10(3):355-371.
Richards,J.The role of vocabulary teaching.TESOLQuarterly,1976.10(1):77-89.
Schmitt,N.,D.Schmitt&C.Clapham.Developmentand exploring the behavior of two new versions of the vocabulary levels test.Language Testing,2001.18(1):55-88.
Wesche,M.&T.Paribakht.S.Assessing second language vocabulary knowledge:depth versus breadth.Canadian Modern Language Review,1996.53(1):13-40.
Review on Vocabulary M easurement Instruments of Second Language
ZHANG Jiangli
(Beijing Chinese Language and Culture College,Beijing 102206 China)
Vocabulary quantity is an important index of reflecting the second language learners'language proficiency.This paper summarizes themeasuring instruments in teaching English as the second language and teaching Chinese as the second language,analyzes the reason of the difference between the results of vocabulary survey.We expect to provide a reference for better vocabulary measurement instruments.
vocabulary quantity;measurement instruments;second language learning
H195
:A
:2221-9056(2017)02-0277-08
10.14095/j.cnki.oce.2017.02.015
2015-11-14
張江麗,北京華文學院副教授,語言學及應用語言學專業博士,研究方向為漢語第二語言教學與習得。Email:zhangjiangli@huawen.edu.cn
本研究受到了2014年度國家社科基金青年項目“外國留學生漢語書面語詞匯進步模式研究”(14CYY020)和北京
華文學院年度課題“基于語料庫的華裔學習者詞匯量調查研究”(HW-15-B01)的資助。