楊家明,石永珍
(西北工業大學 外國語學院,陜西 西安 710129)
?
基于語料庫的工科學生英語寫作中的詞匯研究
楊家明,石永珍
(西北工業大學 外國語學院,陜西 西安 710129)
基于批改網139名工科學生的英語作文語料,統計分析其中實詞的使用、基本動詞結構掌握、常用動詞搭配。結果表明,范圍上,工科學生英語寫作中實詞詞匯使用范圍小,范圍狹窄,產出性實詞非常有限,對生活中常用動詞掌握好,能熟練正確使用基本動詞的搭配但受母語影響較大;數量上,對大部分動詞只會識義,學生能熟練使用的詞塊數目較少,長度偏短,缺乏應有的變體,盡管詞匯認知量很大,但在寫作中相對本族語使用者更傾向用基本動詞。因此,教師在加強詞匯教學的同時,應重視學習和記憶英語語塊,將消極詞匯轉化為積極詞匯,本研究對二語習得和教學具有啟示意義。
語料庫;詞匯;寫作
英語的輸出一般體現在兩個方面,一是口語輸出,二是寫作輸出。由于口語輸出具有語料收集困難等缺點,寫作輸出相對來說更易于研究,因此工科大學生的英語寫作教學研究,一直是應用語言學研究的焦點。一方面工科學生相對于英語專業學生在英語學習時間上的限制,迫切需要找到英語輸出的標準,語料庫可以提供客觀詳實的語言證據,揭示最典型的語言特征,發現語言在實際中的使用規律,反映語言的真實面貌,為開展各種語言教學研究提供真實、可靠且豐富的數據資源,即學生通過了解本族語者詞匯使用習慣,提高自己的寫作水平;另一方面,受應試教育的影響,目前大學生英語寫作因語言輸入量不足,我國工科學生在寫作用詞上有比較明顯的傾向,中國學生使用的語塊與本族語者相比有較大差異,具有口語化傾向[1]。丁言仁、戚炎發現,在英語口頭復述故事和限時寫作中無論是口語還是寫作,學生個體之間在詞塊使用上存在較大差異[2]。本文旨在探究工科學生在英語寫作中的用詞傾向,揭示他們的詞匯運用原則。
當前,國內學者基于語料庫對二語學習者詞匯的研究較多,使用學習者語料與本族語語料對比的研究中,王立非、張巖的 “基于語料庫的大學生英語議論文中的語塊使用模式研究”用SWECCL(中國學生英語口筆語語料庫)語料庫的作文字庫參照LOCNESS(The Louvain Corpus of Native English Essays,書面語料來自美國大學生寫的英語議論文)研究中國大學生英語議論文中語塊的使用特點,中國學生使用的語塊與本族者相比有較大差異,具有口語化傾向。王立非、陳功的“大學生英語寫作中的名物化現象研究”通過對比中國大學生(WECCL)和英語本族語者(LOCNESS) 的英語作文語料,得出結論,中國學生的名物化總體使用不足,名物化隨英語水平的提高呈現上升趨勢。劉向紅、王家義等的“基于語料庫的工科學生英語寫作用詞特點透視”分析工科學生作文中實詞的使用、基本常用動詞結構的掌握和虛化動詞現象,作文語料來自真實的學生作文,將學生作文輸入電腦,對文本進行相應處理,用AntConc軟件統計分析后得出學生在寫作中使用的產出性實詞非常有限,學生使用虛化動詞的頻率較低。
較前人的研究,本研究使用的是基于批改網工科學生的真實語料,句酷批改網是輔助老師批改英語作文的在線服務系統,能對學生提交作文各項數據進行科學系統的分類,結果相對于研究者手動輸入真實客觀,避免因此產生的偶然誤差。中國大學生口筆語語料庫中的語料來自英語四六級考試,近年來學者對它的使用比較頻繁,基于批改網的工科學生詞匯研究較少,筆者希望借助真實語料對學生寫作用詞特點進行探究,希望對教學和二語習得有啟示。
本研究采用語料庫的方法,通過分析試圖回答以下三個問題:(1)工科學生寫作中實詞的使用情況如何;(2)對常用動詞+名詞搭配掌握是否準確;(3)中國學生使用詞匯和本族語者相比存在哪些差異。
相應語料來自西北工業大學139名工科大一學生的英語作文“We Are What we Read”,學生需要在規定的時間內(一周)上交作文至批改網。用于參照的本族語語料庫為The Corpus of Contemporary American English(美國當代英語語料庫,目前單詞容量為4.5億,同時也是世界上最大的英語平衡語料庫)。本研究對每萬詞為單位的標準化頻數進行對比,采用卡方檢驗驗證中國工科學生和本族語者詞匯使用是否具有顯著差異性。
將上述學生的作文作為語料,基于批改網統計和分析這些語料。該語料共139篇作文,單詞的總詞數為31505個,總句數1876句,最長句有92個單詞,平均句長為16.79個單詞。
如表1所示:動詞的使用數量最多,比例占到25.23%,其次是名詞、形容詞、介詞、副詞、代詞、連詞。

表1 作文中的詞性分布

表2 中外語者動詞、名詞對比(萬分率)

頻數萬分率批改網學生作文COCA語料庫批改網學生作文COCA語料庫動詞61608377426225231861名詞52349975576421432216
動詞和名詞萬分率分別為2523,2143,相比于COCA語料庫中的1861,2216,我國工科學生動詞使用多662頻次,差異性十分顯著,筆者發現,相對于本族語者,工科學生使用的句式簡單,大多主謂句式,主觀性強,口語化而且句子長度較短,因此動詞頻率較高;名詞使用少73頻次,差異性不是十分顯著,原因主要是我國學生名物化總體使用不足,相對于本族語者名物化意識薄弱,文章結構單一。
為了使研究結果更科學,筆者將與作文有關的主題高頻詞(read/learn)進行刪減,將選擇前二十位的11個動詞進行分析,卡方檢驗其差異是否具有顯著性。
表3 動詞詳細分析 (負值代表本族語者使用多于所選作文語料)

頻數萬分率批改網學生作文COCA語料庫批改網學生作文COCA語料庫卡方值Be929146548466295325-1.45Can56119760741784480.88???Have232501360573111-7.84?Do18138158615784-5.17?Make163993365522212.13??Think145911214462010.24??Will145211493346470.01Know12598762340225.22?get107107854034241.72shall9437127230911.32??may4364800814140.00
P<0.05
(一)Be動詞(is/am/are/was/were/isn’t/weren’t/been/being)
工科學生作文中“be”動詞每萬詞中頻數為295/每萬詞,比本族語者的325/每萬詞少30頻次,但該差異并不顯著(卡方檢驗χ2=-1.45,小于卡方理論值3.84,df=1,p<0.05) 。分析作文發現,作文中be動詞使用頻率最高的是現在時態以及“wh從句”,我們可以推斷,一方面,雖然學生對基本句法都掌握,但簡單句式還在作文中占有很大比重;另一方面,學生也在作文中嘗試使用能夠體現高水平英語寫作水平的同位語從句,that從句,但是使用數量不夠。
(二)情態動詞(can/will/shall/may)
學生對情態動詞can的使用頻數為178/每萬詞,比本族語者的44/每萬詞多138頻次,差異性十分顯著(卡方檢驗χ2=-80.88,遠遠大于卡方理論值3.84,df=1,p<0.05),反映出學生對該詞的過度使用。分析其中原因,一方面由于語料的容量較小,使得該詞比頻數較突出,另一方面can的過度使用反映出學生寫作用詞傾向,大部分學生傾向使用can的“能夠,能”之意,在議論文中就更加突出,學生大多使用該詞表達“閱讀能使人受益”“通過讀書能使人了解世界”等意思。
學生對will的使用頻數較少,與本族語者差異并不顯著,對于will,學生傾向使用其將來的用法,而在該議論文中,對此種詞義需求不高。
學生對shall(shall/shan’t/should/shouldn’t)的使用頻數為30次/每萬詞,相比于本族語者9次/每萬詞,高出21頻次,差異性顯著(卡方檢驗χ2=-11.32,大于卡方理論值3.84,df=1,p<0.05)。學生對should的使用遠遠多于本族語者,一方面,學生用該詞在議論文中強調“應該,不應該”之意,多為“提出建議、辦法”,我們在生活中也經常使用表達該意思的漢語,而本族語者對該詞的使用偏少,筆者對該詞在COCA語料庫中進行檢索、發現,該詞的使用頻率呈現逐年下降的趨勢,如表四:

表4 should在COCA的歷年用詞總數
筆者認為原因可能是“shall/should”表達“義務,勸告”的含義被較多使用,而在本族語者的語言中,大多數人遵循禮貌原則從而盡量避免使用該詞匯。
學生對May的使用與本族語者差異并不顯著,一方面該詞主要表“委婉語氣”,在作文中能夠使用該用法的地方較少,另一方面對于該詞,本族語者的使用數量也呈現出逐年下降趨勢。如表五:

表5 May在COCA歷年用詞總數
Have(have/has/haven’t/hasn’t/had/hadn’t)
在學生作文中出現的頻數為73頻次/每萬詞,比本族語者111頻次/每萬詞少38 次,(卡方檢驗χ2=-7.84,大于卡方理論值3.84,df=1,p<0.05),差異性顯著。學生作文多使用have “有,擁有”之意,現在時態用法較多,意思多集中于“有影響,有用處,有態度等” ,很少使用have的完成時態用法。 本族語者對“have”使用較為平均。
Do(do/did/does/don’t/didn’t/doesn’t)
學生對助動詞“do”的使用在作文中出現的頻數為57頻次/每萬詞,比本族語者84頻次/每萬詞少17次,(卡方檢驗χ2=-5.17,大于卡方理論值3.84,df=1,p<0.05),差異性顯著。學生在作文中多使用“do+動名詞”的搭配,例如“do reading/do practice等”,相對于本族語者,有過度使用此用法的傾向。
(三)實義動詞
學生對實義動詞make的使用頻數為52/每萬詞,比本族語者的22/每萬詞多30頻次,(卡方檢驗χ2=12.13,遠遠大于卡方理論值3.84,df=1,p<0.05)差異性顯著,體現出學生對此動詞過度使用。“make”是中國學生作文出現的高頻實義動詞,在表達相關用法時(犯錯/取得成就)是學生經常使用的動詞,這顯然跟平時的強化練習有關 ,“make mistakes/make achievement”此類詞組經常被重復練習,學生對此用法較熟悉。
Think:學生對實義動詞think的使用頻數為46/每萬詞,比本族語者的20/每萬詞多26頻次,(卡方檢驗χ2=10.24,大于卡方理論值3.84,df=1,p<0.05)差異性顯著,體現出學生對此動詞的過度使用。一方面, 差異性顯著的原因是該動詞的意思跟本文的主題較為貼近,學生容易聯想到該詞,另一方面,此動詞被學生廣泛使用在賓語從句中(think that) 中,議論文引用此種用法能夠使論述更有說服力,此種用法也跟平時的強化練習不無關系。本族語者對該詞的使用沒有那么多,主要原因是think表達主觀意愿強烈,在文章中使用只能表達作者的主觀意愿,不夠有說服力,造成這種差別的原因也跟各自的思考角度不無關系。
Know:學生對實義動詞know的使用頻數為40/每萬詞,比本族語者的22/每萬詞多18頻次,(卡方檢驗χ2=5.22,大于卡方理論值3.84,df=1,p<0.05)差異性顯著,體現出學生對此動詞的過度使用。學生主要使用該詞的“了解/認知”之意,與本族語者差異大也可能是由于學生能夠靈活使用的詞匯數量有限,對能表達此意的 “acknowledge/understand”不能在寫作文時靈活使用。
Get:學生對實義動詞get的使用頻數為34/每萬詞,比本族語者的24/每萬詞多10頻次,差異性不顯著,分析具體用法發現,學生多使用該詞“得到”之意的用法“get knowledge/get job”。
(四)作文中的搭配分布,以knowledge為例
分析學生作文中的搭配錯誤,發現中式英語在學生作文中出現較多。 以 “knowledge”為例:

表6 knowledge搭配
由此表可以看出學生對“knowledge”高頻搭配有 “get knowledge*/acquire knowledge/increase knowledge/learn knowledge/give knowledge/remember knowledge”,我們對所有搭配在COCA中進行檢索,發現“get knowledge/learn knowledge/give knowledge/remember knowledge”在COCA中的使用頻率極低,即本族語者在平時不會使用此用法,由此可以判定為錯誤用法,但是在學生作文中卻高頻率出現,分析其中原因,我們發現,“get knowledge/learn knowledge/give knowledge/remember knowledge”這些詞組在漢語中都可以找到對應用法“獲取知識/學習知識/給予知識/記住知識”,由此可以推斷,學生此類搭配使用受到漢語的影響很大,可以看做是母語的負遷移作用。
本研究發現,中國非英語專業大學生寫作中情態動詞存在過度使用的現象,與本族語者差異性十分顯著;搭配的使用受到母語影響較大,有些搭配錯誤可能一直存在,需要教師在指導過程中幫助學生意識到錯誤并糾正,因此通過語料庫來幫助教學是很有必要的。語料庫會幫助我們識別經常使用的中式英語,幫助我們發現傳統詞語辨析所不能發現的一些差異性特征或以更全面和更準確的方式揭示傳統詞語辨析曾發現的某些差異性特征[3]。學生寫作中能夠使用的產出性實詞非常有限,大部分學生只會使用最基本的實詞,學生對常用動詞結構掌握較好,但在使用過程中受母語影響大,出現搭配不符合英語習慣的情況。雖然大學英語一直強調學生詞匯的擴大和豐富,但僅僅滿足消極詞匯的增加,對積極詞匯的正確使用和全面掌握不深入,沒有有意識地促進消極詞匯向積極詞匯轉化。此外,學生受母語影響,動詞搭配中常出現中式搭配現象。為了更好地解決這一問題,教師可以強化學生對詞塊的學習,可以指導學生進行模擬填空寫作練習,再進行自主寫作練習,不僅使學生掌握動詞結構,也能學會正確搭配,幫助學生正確、靈活使用它們,幫助學生使用更多樣化的詞匯、更長的單詞、更多被動語態和名詞,對減弱學習者書面語中的口語化傾向,有效促進學生表達能力,增強作文連貫性和流利度有一定幫助。
本研究的不足之處在于,學生的語料數量較小,統計不夠全面,本族語語料庫的人工檢索會帶來一定的誤差,統計的范圍不夠,只對動詞、名詞進行分析,對形容詞、介詞和常用搭配沒有統計全面,有一定局限性。
[1]董洪學,初勝華.基于計算機網絡語料庫驅動的英語寫作教學模式研究[J].外語電化教學, 2010,(9).
[2]丁言仁,戚焱.詞塊運用與英語口語和寫作水平的相關性研究[J].解放軍外國語學院學報, 2005,(3).
[3]王立非,馬會軍.基于語料庫的中國學生英語演講話語立場構塊研究[J].外語教學與研究,2009,(9).
[4]劉向紅,王家義等.基于語料庫的工科學生英語寫作用詞特點透視[J].外語學刊,2009,(2).
[5]王立非,張巖.基于語料庫的大學生英語議論文中的語塊使用模式研究[J].外語電化教學,2006,(8).
[6]王立非,陳功.大學生英語寫作中的名物化現象研究[J].中國外語,2008,(5).
(責任編輯:王麗)
Based on 139 engineering students’ writing materials, the author analyses the use of lexical verbs, the mastery of basic structure of verbs, and the common collocation of verbs. According to the results, the author concludes that the range of verbs used by the engineering freshmen is limited, they are still good at using the basic verbs and collocation and their mother tongue influences their writing a lot; although the students can memorize the verbs they learned, they can hardly transform these negative verbs into positive verbs. Therefore, the teacher should guide the students to realize the importance of chunks, and help them to focus on the use instead of the memorization.
corpus; vocabulary; writing
2015-09-05
楊家明(1992-),男,山東肥城人,西北工業大學外國語學院在讀碩士,主要從事特殊用途英語研究;石永珍(1964-),女,甘肅蘭州人,西北工業大學外國語學院副教授,碩士生導師,主要從事英語語言學及應用語言學、專門用途英語研究。
H315
A
(2016)01-0033-05