林敏 劉志國

摘 要 本文主要研究通過使用Python編寫爬蟲從中國軍網英文版爬取語料,建立軍事英語語料庫,進行例句批量檢索和保存,根據大學英語實際教學需要,將例句融入大學英語詞匯教學。檢索詞匯為大學英語詞匯表,在增加詞匯軍事例句的同時,最大限度地減輕學員學習負擔;通過引入軍事英語例句,實現單詞學習中的語境凸顯,激發學員學習興趣,提升學習效果;使大學英語教學更具時效性,有效提升學員的跨文化交流能力;為通用英語教學和軍事英語ESP課程的銜接打好堅實的基礎,充分體現了軍校大學英語教學的軍味。
關鍵詞 軍事英語 大學英語 Python 自然語言處理 語料庫
中圖分類號:G424 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A ? ?DOI:10.16400/j.cnki.kjdks.2020.07.066
Abstract This paper mainly studies how to use Python to compile crawlers to crawl the corpus from the English version of the Chinese military network, build the military English corpus, retrieve and save the sample sentences in batches, and integrate the example sentences into the college English vocabulary teaching according to the actual needs of college English teaching. The retrieval vocabulary is a college English vocabulary, which not only increases the vocabulary of military examples, but also reduces the learning burden of the students to the maximum extent. By introducing military examples, the context in the vocabulary learning can be highlighted, the learning interest of the students can be aroused, and the learning effect can be improved; the college English teaching can be more timely, and the intercultural communication ability of the students can be effectively improved; the general English teaching and the connection of military English ESP courses has laid a solid foundation and fully embodies the military flavor of Military college English teaching.
Keywords Military English; college English; Python natural language processing; corpus
新軍事變革和大學英語教學改革對軍校大學英語教學提出了新的要求。隨著國內外軍事交流與合作的日益頻繁,軍校學員既要精通軍事專業技能,同時又要具備扎實的外語交流能力。目前,軍校學員一般在大學的前兩個學年進行通用英語教學,在高年級進行ESP軍事英語教學。而如何做好通用英語和軍事英語教學的銜接,既滿足學員參加大學四、六級英語考試的需要,又能提升學員的軍事英語能力和英語綜合應用能力就顯得尤為重要。本文從軍事英語例句如何融入大學英語詞匯教學出發,力圖為軍校大學英語教學特色的凸顯,通用英語教學和軍事英語教學的有機銜接提供新的思路和操作方法。
1 “注意”假設理論在詞匯教學中的運用
施密特(Schmidt)提出的“注意”假設理論為軍事英語例句在大學英語詞匯教學上的應用提供了理論基礎。“注意”假設理論認為:語言輸入并非都是等價的,真正被吸納的信息必須是被有效“注意”到并且經過加工處理的信息。影響“注意效果”的因素包括頻率、凸顯、教學、學習者個體在注意和提取信息等方面的差異、中介與系統的現狀和任務要求。斯凱恩認為:“施密特的理論強調了‘注意在語言習得中的重要性,只有學習者真正注意到的語言信息才會被理解和吸收。”[1]在大學英語的詞匯教學中,相當一部分詞匯既有日常用語的涵義,也有軍事英語的特定涵義。通過對比同一個詞匯在兩個語域中的例句,提供兩種迥然不同的語境,起到互相凸顯的效果,從而引起學員的注意和思考,進一步激發學員學習興趣,最終使學員能夠內化和應用所學詞匯。
2 軍事英語語料庫建設和例句搜索
本文使用的軍事英語語料庫語料由自主編寫的爬蟲從網絡爬取。http://eng.chinamil.com.cn是中國軍網的英文版,內容以新聞報道為主,包含各個軍種的新聞報道、外交部發言、以及國內外最新的軍事新聞等。進行文本處理所使用的第三方庫為NLTK(Natural Language Toolkit)。NLTK是由賓夕法尼亞大學的Steven Bird和Edward Loper基于Python開發的第三方庫,主要應用于科研和教學,是自然語言處理較為常用的模塊。
2.1 Python爬蟲編寫和使用
自主編寫爬蟲從網站獲取需要的信息,在本文研究范圍內主要獲取的是文本信息,如文章的標題,發布時間和正文等。獲取文本信息后保存為文本文件,作者本次共爬取近期文章文本約20萬字。使用Python自主編寫爬蟲可以定期爬取語料,保證了以新聞文本為主的語料庫具有較強的時效性。語料庫的內容便于根據需要定制和拓展,可以進一步獲取文章的圖片信息,甚至是聲音視頻等多媒體信息,與文本信息相結合,構成多媒體語料庫。
2.2 單詞例句批量搜索和文本保存
與傳統的語料庫軟件Antconc和WordSmith等相比,用計算機語言自主編寫語料庫搜索引擎具有更大的靈活性,語料庫的使用可以根據教學內容進行量身定制。針對本文所研究的例句搜索,具體步驟為:(1)首先獲得本單元的單詞詞表,以文本文件格式保存;(2)通過自主編寫的程序讀取文件,在語料庫中自動為每個單詞查找匹配到的例句,并合并為一個文本文件保存,便于進一步根據教學需要進行篩選、簡化和翻譯。部分代碼如下:
自主編寫代碼進行例句搜索的優勢是:可以更方便地批量導入生詞表,對生詞表的單詞數量沒有限制;可以進一步拓展例句篩選功能,如設置例句長度、選擇高頻詞匯例句、設置例句數量、文本時間、制作雙語例句等;例句本文可以自動保存為文本,便于進一步語料處理。
3 在大學英語教學中使用軍事英語例句應當注意的問題
軍校大學英語教學在補充軍事英語的同時,仍應堅持以通用英語教學為主體,例句篩選應當體現因材施教原則。大學英語課程作為軍校軍事語言教育的基礎課程,主要學習的是通用英語課程,為學員學習高年級軍事英語課程打下堅實基礎。因此,在補充軍事英語例句時應當注重適量和適度,應以通用英語教學為主,不能喧賓奪主,影響到通用英語教學的完整性和原版英文課文賞析的美感。
在例句的篩選過程中,應充分體現因材施教的原則,軍校學員在大學一年級剛開始大學英語學習,往往語言基礎比較薄弱,而軍事英語新聞例句往往結構比較復雜,詞匯難度較大。如果直接引入難度過大的例句,雖然保持了例句的原汁原味,但是過多的新概念和詞義可能會讓學生產生畏難情緒,起到適得其反的效果。因此,教員應當充分做好學情分析,在最大程度上保證文本信息完整性的同時,對原版例句進行大膽的簡化和縮寫,用更容易理解的表達,保留例句的核心含義和語境,減少修飾性成分,保留數量和難度適宜的專業術語,并進行對照翻譯和適當處理,確保例句語境凸顯和有效信息輸入。隨著學員英語水平的提高,可以逐漸減少或無需對句子進行簡化和縮寫,直到能夠完全適應實際使用的軍事英語表達。
應當注重翻譯語料的整理和保存。網絡獲取和自主翻譯的雙語對照例句以及術語,可以進一步制作成TRADOS翻譯記憶庫和術語庫,利用機輔翻譯逐漸加快翻譯的速度和準確性,進一步減輕備課負擔,提升備課效率。
4 結語
在信息技術蓬勃發展的今天,應當充分利用現代信息技術,在保持外語教學材料經典性的同時,又能確保外語教學材料時效性,緊跟時代步伐,及時補充相關領域最新的發展趨勢和語言材料。自主編寫代碼搜索語料,使用自然語言處理工具可以更方便地對文本進行批量處理和量化分析,極大地提升了文本分析效率。自然語言處理中復雜的語言模型在外語教學和翻譯上,還有廣闊的應用和發展空間,值得進一步的研究和探索。
參考文獻
[1] Skehan,P. A Cognitive Approach to Language Learning[M].Oxford University Press.1998:48-51.