王艷偉
(上海交通大學,上海,200240)
由北京外國語大學中國外語教育研究中心主辦,北京航空航天大學外國語學院協辦的“2011中國語料庫語言學大會”于2011年11月19日至20日在北京外國語大學召開。這是中國語料庫語言學研究會成立后的首屆全國性學術研討會。會議邀請了4位國內外知名專家做主旨發言,另有來自內地和香港的85所高校和科研院所及研發公司的130余位教學和科研工作者出席了會議并做了分組發言。11月20日下午會議還組織了由五位語料庫研究專家參與的“語料庫語言學在中國”高層論壇。
東京外國語大學的Yukio Tono教授做了題為“Linking CEFR to Learner Corpus Research: Identifying Criterial Features of L2 Development”的發言,他將語料庫語言學與二語習得相結合,利用近鄰聚類(variability-based neighbor clustering)和隨機森林(Random Forest)的統計方法從學習者語料庫中提取可供識別CEFR(歐洲語言教學評估共同綱領)各語言水平等級的標準性特征(criterial features)。香港理工大學的Martin Warren教授的報告“Extending our Understanding of Phraseology”基于John Sinclair的“成語原則”,探討和分析短語學的范圍亦或短語傾向的內部運作機制。報告具體描述了利用ConcGram1.0軟件從語料庫中自動提取多元詞語序列(n-grams),提出短語學變異(包括成分變異和位置變異)的分析框架,探討和解釋了一些重要的短語型式,并討論了同現詞語序列技術(concgramming)對于關涉(aboutness)和關鍵性(keyness)研究的啟示。
衛乃興教授在題為“Exploring Phraseology across English and Chinese: Ideas and Methods”的發言中闡述了他所帶領的研究團隊基于平行語料庫研究英漢對應短語序列的理念和方法,具體介紹了John Sinclair(1996)的擴展意義單位模型以及將Alternberg(1999)的相互對應率測量工具與Tognini-Bonelli(2002)識別跨語言可比意義單位的三步分析法相結合的方法論,最后強調了語義選擇趨向和語義韻在實現英漢對應詞項不同程度的對等中所起的關鍵作用。許家金副教授的報告“Pear/Pair Stories: Maximising Comparability in CIA”嘗試利用語料庫方法調查外語學習者的母語在概念和語言學兩個維度上對其英語口頭敘事話語的影響。該研究利用Chafe(1980)的“梨電影”(Pear Film)視頻剪輯分歩收集具有高度可比性的敘事語篇,并將這些梨故事(pear stories)進行不同向度的配對(pairing)來獲得更多跨語言比較研究的機會,從而將Sylvaine Granger(1996)首創的經典中介語對比分析法(CIA)朝著語際、語內、跨文類和跨話歩的分析擴展和延伸。
本屆大會旨在加強國內語料庫語言學界的學術交流與合作,探討學術發展動態與關鍵技術以促進語料庫語言學的學科建設和發展。會議將收到的論文摘要按10%的退拒率進行篩選,最終采納了87篇論文并具體分為9個議題在四個分會場進行分組報告和討論。
該類議題論文數占所有議題論文數的11.5%。其中實證研究占絕大多數,研究話題較為廣泛,涉及詞匯、型式語法研究、雙語詞典編纂、話語標記、對話行為和評價性語言研究;研究視角有詞匯語法、詞源學和協同語言學視角的研究視角;既有單語的研究,也有跨語言的研究。
該類議題論文只有4篇,在會議所有議題論文中所占比例最小,僅為4.6%,涉及的研究話題有基于句法依存關系的特定事件提取方法,用于多詞法律術語檢索的口語對話系統,平行語料庫檢索技術和基于海量生語料庫的中文專家系統。
該類議題論文共17篇,占總數的19.5%。其中關于中介語語料庫建設的論文1篇,語料庫在語言測試中的應用的論文1篇,語料庫驅動的實證研究論文2篇,其他基于語料庫的中介語研究論文12篇研究話題涉及中介語使用(單個詞、近義詞、反義詞、報道動詞、虛化動詞、立場副詞、連接副詞、被動結構、有靈主語)和習得(意愿與預測情態詞、語言干涉)、口語(連接詞、相鄰時態默認、會話修補策略)和書面語的諸多方面。
該類議題的研究論文共18篇,占總數的20.7%。按研究內容可分為平行語料庫建設及其關鍵技術(基于網絡的平行語料庫集成、平行詞塊抽取、雙語句對齊、語言特異組合發現法)、語言對比(中介共性、被動句歐化特征、雙語詞匯對等項的建立、政治文本中的無主分句)和翻譯研究(政治隱喻、詞匯特征、顯化、譯文特征、譯者風格)三大類。
該類議題論文所占比例較小,為8.0%。從研究話題來看,論及漢語語料庫建設的論文遠遠少于基于漢語語料庫的特定字詞、短語、框式和從句研究,基于歷時語料庫的研究也遠遠少于基于共時語料庫的研究,基于樹庫的研究更是遠遠少于基于普通語料庫的研究。
該類議題在會議所有議題中所占比例也很小,僅為4.6%,具體的研究話題僅限于手勢語和口語。
該類議題論文共11篇,占總數的10.3%。與其他議題不同的是,該議題中討論專門用途語料庫建設和開發的研究居多(6篇),其中既有單語語料庫(建筑英語、IT英語和航空航天英語),也有雙語平行語料庫(旅游英語和口譯英語)和可比語料庫(CROWN/CLOB),涉及的特定學科領域除了上述領域外,還有側重于進行基于語料庫的分析和對比的醫學英語和民歌歌詞。后者中既有技術詞匯和高頻詞簇的分析,也有語篇分析、對比和翻譯研究。
該類議題基于話語建構現實的哲學觀,論文數占所有議題論文數的10.3%,內容涵蓋通用話語的研究(英語中的家庭關系、孔子的身份、中國印象)、媒體話語的研究(關于地震、反恐、圣誕節新聞報道的用詞、主題詞分析),以及特定話語類型的研究(話語標記、情態模糊限制語、適當性自我修正程式語)。
該類議題論文數占總數的10.3%。研究話題廣泛,涉及語料庫在語言教學眾多領域的應用,如自建語料庫在大學英語備課、教材評估、教材元話語建構和詞匯教學中的應用,基于語料庫的自助寫作教學模式、會話教學和同義詞辨析,還有平行語料庫在旅游英語課程中的應用。
11月20日下午,大會舉辦了“語料庫語言學在中國”的高層論壇,由五位中國語料庫語言學研究領域的領軍專家做概括性發言,將本屆語料庫語言學大會推向了高潮。論壇上首先發言的是教育部語言文字應用研究所的馮志偉教授。馮教授談了雙語平行語料庫的建設與應用,以及語言學對于計算語言學的理論支撐作用,最后呼吁計算語言學家應關注語言學研究。北京外國語大學中國外語教育研究中心的王克非教授圍繞他主持的國家社科基金重大課題“大規模雙語語料庫的建設與加工”,給與會者分享了很多他在雙語語料庫建設的取樣、研究思路及現存問題方面的思考。北京航空航天大學外國語學院的衛乃興教授就其所做的一系列研究和研究范式以及語料庫研究的一些理論視角做了深入探討。北京外國語大學中國外語教育研究中心的梁茂成教授談了他對語料庫研究中一些問題的思考,并介紹了北外語料庫團隊所做的一些研究項目。解放軍外國語學院的濮建忠教授討論了語料庫語言學的研究思路、研究領域和素質要求。
本屆大會反映出國內語言學研究的當前趨勢是專門用途語料庫、語料庫應用于話語分析和外語教學的研究態勢喜人,多媒體網絡資源和技術、統計和自然語言處理技術等語料庫相關技術的應用前景廣闊。大會也反映出一些存在的問題,如研究多以書面語語料庫為主,基于口語尤其是多模態語料庫的研究相對薄弱;中介語語料庫、平行語料庫或翻譯語料庫的研究蒸蒸日上,而語料庫加工處理技術研究和漢語語料庫的建設和研究卻相對滯后。大會也預示出國內語料庫語言學研究的未來走向:語料庫研究將呈現多視角、多層次的特點。展現在我們面前的語料庫語言學研究是一個可供學人們縱橫馳騁的廣闊領域。