999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語料庫的高校網頁英文簡介對比研究

2013-11-15 00:50:44程張根
武漢紡織大學學報 2013年4期
關鍵詞:詞匯文本

程張根,何 瓊

(武漢科技大學 外國語學院,湖北 武漢430081)

隨著國際交流日趨頻繁和我國文化軟實力提升,越來越多的國內高校都在網站增設了英文界面。其目的主要是加強對外宣傳,提高國際知名度,尋求合作辦學,促進學術交流與合作。尤其是對于一些知名大學來說,英文網站不僅是有意來校深造的國外學生了解本校的窗口,也是向海外科研機構及學者傳達信息的主要方式。

一、基于高校簡介語料庫的對比研究

(一)研究問題

本研究擬通過對比分析國內外高校英文簡介的詞匯難度、詞頻、詞塊、主題詞、詞性分布等措辭特征,以回答如下問題:中國財經類知名高校與商科排名靠前的英語國家高校的英文簡介在詞匯層面上各自有何特征,這些詞匯特征有何語篇意義,其背后原因是什么。

(二)語料庫建設

為了回答上述問題,筆者自建了兩個語料庫即中國高校簡介語料庫 AUMC(About University in Mainland China)和英語國家高校簡介語料庫 AUEC(About University in English-speaking Countries),各含20所高校的英文簡介文本,均采自各高校校園網英文版的類似“About the University”部分。本研究將對象鎖定為財經類高校,國內高校選取各種排名靠前的 20所財經類高校,包括上海財經大學, 中央財經大學等;因國外少見中國式的財經類大學,故國外高校選取2011年度QS經濟類專業世界排名的前25位高校,包括哈佛大學,麻省理工等,但是只保留以英語為母語國家的20所高校,剔除東京大學等本族語為非英語的國家高校,以保證語料庫語言的純正性和地道性。

(三)研究工具

詞匯難度分析工具采用AntWordProfiler,該軟件的基本原理是“將某一個文本中的詞匯與某一詞匯表進行比較,通過觀察哪些詞出現或未出現在該詞匯表中以及出現在該詞匯表中詞匯的比率,就可以知道該文本的用詞情況了”(鳳群,2011)。AntWordProfiler內置了三個詞匯表,這三級詞匯表代表了英語中出現頻率較高的詞匯,每一級詞匯難度遞增。運行該軟件,它會將所分析的文本中的詞匯與上述三級常用詞匯表做比較,用以衡量文本的詞匯難度。文本可讀性分析采用中國外語教育研究中心的許家金博士與賈云龍老師研發的 Readability Analyzer。該軟件能統計文本的詞次、詞形、詞目、平均詞長、平均句長,并提供文本易度、難度、水平等數據。測試結果表明(侯廣旭等,2009),在文體、題材、風格相近的情況下,尤其是對于說明文和論述文體,該軟件對文本難度分析的結果具有較強的真實性。此外,本研究使用 AntConc對詞頻、詞塊、主題詞、詞性分布等詞匯特征進行研究。AntConc具有生詞詞表,詞塊,提取主題詞和索引等多項詞匯分析功能,信度效度已得到語言學界的普遍認可。AntWordProfiler和AntConc均由日本早稻田大學Antony教授研發,二者皆為免費軟件。

(四)研究方法

本研究首先使用 AntWordProfiler和 Readability Analyzer量化分析比較兩個語料庫的用詞難度和文本可讀性(難度),用以對國內外高校簡介的文本特征進行分析和比較。其次,利用 AntConc生成詞表和詞塊表,用以分析比較兩個語料庫的重點信息有何差異;然后,借助AntConc生成主題詞表,考察兩個語料庫的主題差異;最后,對兩個語料庫進行詞性賦碼,借助AntConc的詞表和索引行功能揭示兩個語料庫的詞性分布,句法特征以及主題差異。

二、數據分析與討論

(一)文本特征對比分析

1. 總體文本特征

利用 AntConc的詞表功能可以得出兩個語料庫的形符數和類符數,據此可以計算出標準化類符/形符比。如表 1所示,AUEC形符數為 6051,AUMC形符數達到11708,說明中國高校英文簡介的平均篇幅明顯大于國外高校簡介,字數相差近一倍。國外高校簡介特點是簡明扼要,重點突出,瀏覽原始網頁發現,次要信息常通過超鏈接等形式進行補充說明;而中國高校多半將所有信息不分輕重緩急以一篇文本的形式進行羅列,追求大而全,容易使讀者產生閱讀倦怠和信息迷失,不利于重點信息的傳達。從標準化類符/形符比來看,AUEC和AUMC分別是45.33和42.55。標準化類符/形符比常用來衡量語料庫的詞匯密度,而“詞匯密度在一定程度上反映出文本用詞的多樣性”。由此可以推斷中國高校簡介用詞變化較小,不如國外高校簡介用詞豐富。

表1 國內外高校簡介語料庫的總體文本特征

2. 詞匯難度

借助AntWordProfiler,分別得出國內外高校簡介用詞難度的量化數據,結果如表2。

表2 國內外高校簡介的詞匯難度

如表2所示,AUEC文本中一級詞匯形符數為4282,類符數為747,分別占總詞數的70.50%和45.16%。AUMC文本中一級詞匯形符數為7645,類符數為774,分別占總詞數的65.04%和40.42%。可以看出,無論從形符數還是類符數來看,代表難度系數最低的一級詞匯在國外高校簡介中比例均高于中國高校簡介(相差約 5個百分點),即國外高校簡介中用的簡單詞匯比例更大。以同樣的方法對二級詞匯、三級詞匯以及不在這三級的詞匯進行分析,得出結論:二級詞匯,兩個語料庫差別不大;代表難度系數較大的三級詞匯以及不在這三級的詞匯在國外高校簡介中比例明顯低于中國高校簡介,即國外高校簡介中使用的高難詞匯比例較小。總而言之,與國外高校相比較,中國高校簡介中使用的詞匯偏難、用詞更正式。

3. 文本難度(可讀性)

表3 國內外高校簡介文本可讀性參數

表3顯示,AUEC的易讀性指數(Reading Ease)為23.50,而AUMC為10.00,可見國外高校簡介閱讀起來更為舒適,換言之,其文本綜合難度低于中國高校簡介文本。易讀性指數是基于平均詞長、平均句長、標準化詞目/形符比等參數得出來的。從Flesch-Kincaid等級水平(Grade Level)來看,AUMC(17.30)大于 AUEC(15.10),即中國高校簡介文本的閱讀難度系數更高,這主要是基于文本的平均詞長(AWL)和平均句長(ASL)決定的。中國高校簡介平均詞長和平均句長都大于國外高校簡介,尤其是平均句長的差異(27.50:20.70)從某種程度上反映出中國高校簡介遣詞造句的復雜。就標準化詞目/形符比(Lemma STTR)來看,AUMC(0.17)小于AUEC(0.24),說明中國高校簡介用詞豐富度偏低,即用詞單一,不如國外高校簡介靈活多變,這與前文標準化類符/形符比得出的結論一致。

(二)詞(塊)表對比分析

1. 詞表

詞表是一個語料庫的高頻詞列表,即語料庫文本大篇幅使用到哪些詞匯,重點傳達出什么樣的語篇信息。運行AntConc,依次生成兩個與語料庫的詞表。AUEC 的前 20 個高頻詞匯依次為:the,and,of,in,a,to,university,students,is ,’s,for,its,are,as,research,world,with,by,on,that,at,from,all,campus,an,was,teaching,one,more,than。AUMC的前20個高頻詞匯依次是:and,the,of,in,university,a,to,research,economics,has,is,for,with,students,as,are,education,’s,finance,school,center,china,level,management,programs,by,over,its,key,international。兩個語料庫的前20高頻詞匯大部分相同或類似,尤其是功能詞,實詞部分重復的是 university,student和 research,說明國內外高校簡介都重視招生和科研。劃線部分詞匯為兩個語料庫之間不重復的實詞。國外高校簡介中高頻實詞是world, campus和teaching,參照索引行,能發現國外高校在篇幅有限的簡介中注重強調自身的世界頂尖級別,重視介紹教學和校園建筑特色和配套服務。國內高校則強調自身在經濟學(economics)、金融學(finance)和管理(management)等學科中的優勢。因為所選的國內高校都是財經類大學,而國外高校多是綜合性大學,所以這不難理解。此外,國內高校還習慣在簡介中羅列下屬各個學院(school)以及各種合作辦學項目(program),尤其是國際性的(international)。

2. 詞塊

比較不同文本試圖傳達的重點信息有何差異,除了觀察高頻詞表,還可以分析高頻詞塊。使用AntConc的N元組(N-Gram)功能,分別提取兩個語料庫的高頻三詞詞塊(3-Gram)。AUEC 的前20個高頻詞塊依次為:one of the,the world ’s,The University of,undergraduate and graduate,the University ’s,ANU College of,of the University,of the world,the University of,around the world,world ’s leading,both undergraduate and,is one of,members of the ,research and teaching,teaching and research ,the United States,University of California,University of Chicago,as well as。AUMC的前20個高頻詞塊依次是:of Finance and,Ministry of Education,the Ministry of,Finance and Economics,one of the,University of Finance,as well as,by the Ministry,economics and management,of Economics and,the university has,In recent years,’s degrees in,an area of,of the top,the State Council,is ranked No,of Applied Sciences,Research Institute of,University of Applied。同詞表分析一樣,能凸顯信息差異的詞塊分別標注下劃線,然后參照索引行進行分析總結。得出結論是,國外高校普遍慣于交代自己是世界級名校(the world ’s,around the world,world ’s leading,),擁有院士級別的教授(members of the)和強大的教學和科研實力(research and teaching,teaching and research)。國內高校大篇幅強調自身在財經類學科方面的優勢(Finance and Economics,economics and management),具備授予各種學位的資質(’s degrees in),近些年(In recent years)取得的各種成就和榮譽,以及學校校區面積(an area of)等。尤其值得注意的是,國內高校普遍熱衷強調自身與政府各級行政機構的隸屬關系(Ministry of Education,the State Council),以此彰顯自己的實力和地位。這與中國高校的教育體制密切相關。

(三)主題詞對比分析

基本詞表統計能提供一個語料庫文本的詞語頻率和分布信息,卻難以說明詞語在語境中的用法與詞語之間的關系;而“主題詞統計能提供語篇層面詞語的分布與文本主題的關系以及詞語之間的關系”[6]。為了揭示兩個語料庫文本的主題差異,本研究進行了主題詞對比分析。由于AUEC和AUMC兩個語料庫屬于可比語料庫,即主題和體裁相同,而且后者庫容相當于前者的近兩倍,因此本研究中將AUEC作為觀察語料庫,將AUMC作為參照語料庫,利用 AntConc的主題詞功能同時生成正負關鍵詞表。其中,正關鍵詞表是指在國外大學簡介中出現頻率明顯高于中國大學簡介的詞匯,負關鍵詞表所列詞匯在中國大學簡介中出現頻率顯著高于國外大學簡介。限于篇幅,本研究截取關鍵性值keyness大于10的關鍵詞進行分析討論。

從詞義角度分析,正關鍵詞表的詞匯主要分六大類:(1)國外高校校名,如ANU,Oxford,Berkeley等;(2)與學習相關的詞匯,如knowledge,intellectual,discovery,scholarship;(3)配套設施和服務方面,如accommodation,museum,service等;(4)體育運動,如athletic,sport;(5)學術文化特征,如original,diverse等;(6)女性(女學生),women;(7)其他,如 community,opportunities等。由于正關鍵詞表反映的是國外高校簡介的主題特色,可以看出:有別于中國高校,國外高校在簡介中內容側重學習和學術,強調學生對未知的探索和發現;除了學術科研,高校亦注重自身對社會社區的服務功能,將服務社會視為辦學宗旨中不可或缺的組成部分。此外,簡介中務實地介紹學校食宿、體育運動設施、獎學金、各種成長成才機會、文化的多元性、甚至男女平等理念,以“人性化”的設施、服務和理念吸引莘莘學子前來就讀。

負關鍵詞主要分以下六大類:(1)專業設置,如economics,management,business,administration,disciplines等;(2)學校級別和檔次,如 key,level等;(3)師資力量,如teacher,professor等;(4)學位,如doctoral,master等;(5)下設研究所,如 institute,center;(6)學校的發展,如development。參照索引行,可以推斷:與國外高校相比較,中國高校簡介的主題特色在于詳細介紹所設專業和學位授予權,強調學校在政府機構的級別和師資力量(尤其是教授比例),以此彰顯自身實力。

(四)詞性分布對比分析

使用tree tagger對兩個語料庫進行自動詞性賦碼,然后分別加載兩個賦碼語料庫到AntConc,利用其詞表功能對高頻詞性進行排序。通過觀察對比兩個語料庫的高頻詞性的差異,并借助索引行可以窺探國內外高校簡介使用詞匯手段來傳達語篇意義的差異,統計結果見表4。

表4 國內外高校簡介中詞類頻次及千分率

續表4

如表4所示,AUEC的高頻詞性依次為:專有名詞,名詞單數,介詞,名詞復數,形容詞,限定詞,并列連詞,基數詞,過去分詞,副詞,現在分詞,三單,人稱代詞,has,am/is,are,動詞原形,所有格,過去式,比較級,關系代詞,was/were。AUMC的高頻詞性依次是:名詞單數,介詞,專有名詞,限定詞,形容詞,名詞復數,并列連詞,基數詞,副詞,過去分詞,人稱代詞,動詞原形,過去式,現在分詞,am/is,三單,are,所有格,動詞復數,關系代詞,比較級,was/were 。表4中,兩個語料庫出現比例差別較大的詞性詞類分別加粗并標注下劃線,可以看出:相比較而言,國內高校簡介較多使用專有名詞,基數詞,has;國外高校簡介更多使用人稱代詞,動詞原形和動詞過去式。

(1)專有名詞。AUMC的專有名詞使用率明顯高于AUEC,說明中國高校簡介中專有名詞使用比國外高校明顯更多、更頻繁。觀察索引行發現,國內外高校簡介中均使用專有名詞表示“校名,學校地理位置,下設的科研機構,與知名學術團體的關系”等,但中國高校簡介中專有名詞還大量表示“學校下設院系、專業和科研機構,與政府行政部門的關系,國家領導人名字,榮譽獎項”, 凸顯出鮮明的“高校管理行政化”特征,而國外高校簡介中的專有名詞少見或未見傳達這些信息。

(2)基數詞。AUMC的基數詞使用率明顯高于AUEC,說明較國外高校,中國高校簡介更多、更頻繁地采用量化數據介紹學校信息。通過觀察索引行發現,國內高校使用基數詞主要用來介紹學校重點學科、一級或二級學科數目,碩士點或博士點數量,學校面積,教師(尤其是教授)數量,學生人數,下設學院或研究中心數量,藏書數量。不同的是,國外高校的簡介中出現的數字主要是年份,用以介紹校史,學校重大事件發生的年份。

(3)Has。通過對索引行的觀察,發現國內外高校簡介中 has的主語基本上都是校名或指代校名的第三人稱代詞“it”。區別在于國內高校更多使用第三人稱視角進行自我介紹。

(4)人稱代詞。AUEC的人稱代詞使用比例是AUMC的兩倍(22:11),說明國外高校簡介中更多采用人稱代詞。載入賦碼語料庫,使用 AntConc的單詞列表功能,在檢索項輸入“*_PP”,發現兩個語料庫均使用到“Its,it,their,them,itself”等介詞。不同的是,AUEC還普遍使用“we,our,you”,據此可以初步推斷國外高校簡介中慣于使用第一人稱的敘事視角。為了明確國內外高校簡介中第一、二人稱代詞使用頻率的差異,利用AntConc的索引行功能,輸入檢索項“we|our|you|us|your|yours|ours”,發現AUEC出現23次,AUMC出現9次。借助SPSS16.0進行卡方檢驗,得出卡方值 Chi-Square=93.9670,P=0.000,可見兩個語料庫中第一、二人稱代詞的出現頻率的差異具有統計學意義上的顯著性。說明,較中國高校,國外高校在簡介中明顯更多使用第一人稱的敘事視角,敘述過程中暗示受眾 you的存在,強調互動,注重與讀者建立起親近的關系,拉近大學與讀者之間的心理距離。

(5)動詞原形和動詞過去式。AUEC動詞原形和過去式的使用率明顯高于 AUMC。觀察索引行發現,兩個語料庫的動詞原形主要用于“情態動詞+動詞”和動詞不定式兩種結構,用法差異不大。從語義角度分析,AUEC中動詞過去式主要用來描述學校歷史變遷,如founded,established,became等;而AUMC中動詞不定式比例較少,并側重于表述學校獲取的各種成就,如 achieved,awarded,ranked等。

三、結論與啟示

借助語料庫的各種統計手段,研究發現,國內外高校英文簡介的用詞差異主要體現在三個方面,即文本特征,語篇信息和敘事視角。文本特征方面,中國高校簡介篇幅更大,用詞更難,句子更長,結構也更為復雜,文本難度更大;國外高校簡介短小精悍,用詞難度和句長適中。語篇信息方面,中國高校簡介中慣于詳細地列舉各種教科研信息,如下設院系、學科、專業、碩士點或博士點、科研機構、教授比例乃至所獲的各種榮譽獎項,而且一再強調自身與官方、政府機構的關系,如211院校、省級重點專業等,以此說明自己的實力和地位;國外高校側重介紹自身和社會、社區的緊密聯系,鼓勵學生對未知的探索,并提供食宿、體育運動設施、獎學金、各種成長成才機會、文化的多元性、甚至男女平等理念等“人性化”信息,借此打動和吸引學生前來求學。敘事視角方面,中國高校簡介主要采用第三人稱敘事視角,刻板地描述各種信息;國外高校慣于采用第一人稱的敘事視角,注重拉近與讀者的距離,文本偏向“促銷”體裁。

高校英文簡介,乃至其他的英文外宣材料都是功能性很強的文本。由于國內高校的英文簡介主要源于對中文版本的翻譯,因此建議翻譯時以國外高校簡介為平行文本,做到譯文符合目的語讀者的思維習慣,認知特點甚至興趣偏好。利用各種免費的語料庫工具,可以深度挖掘文本潛在的單詞、句子、語篇、信息等層面的特點,幫助研究者準確、高效地把握平行文本的特征,以便更好仿照平行文本進行翻譯,提高翻譯的質量和效率。

[1]Hunston, S.Starting with the small words: patterns,lexis and semantic sequences[J]. International Journal of Corpus Linguistics,2008, (3): 271~295.

[2]陳雋,黃玉虹. 高校英文網頁的翻譯失誤探析---以福建重點本科院校為例[J]. 福建農林大學學報, 2012,(6).

[3]鳳群. 基于語料庫的中美大學生英語演講詞匯特征研究[J]. 合肥工業大學學報, 2011,(2).

[4]郭虹字.中國大學介紹辭漢英翻譯原則研究… 評部分“211工程"大學網站英譯[D]. 南京:杭州:浙江工商大學,2010.

[5]侯廣旭,等. 用ReadabilityAnalyzer1.0 分析《大學英語綜合教程》課文難度的循序漸進性[J]. 考試周刊,2009,(41).

[6]李文中. 基于英語學習者語料庫的主題詞研究[J]. 現代外語,2003,(3): 283-293.

[7]梁茂成,等. 語料庫應用教程[M]. 北京:外語教學與研究出版社,2010.

[8]楊惠中. 語料庫語言學導論[M]. 上海:上海外語教育出版社,2002.

猜你喜歡
詞匯文本
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
山東醫藥(2020年34期)2020-12-09 01:22:24
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
在808DA上文本顯示的改善
本刊可直接用縮寫的常用詞匯
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
一些常用詞匯可直接用縮寫
山東醫藥(2017年35期)2017-10-10 02:45:28
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
論《柳毅傳》對前代文本的繼承與轉化
人間(2015年20期)2016-01-04 12:47:10
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 人妻出轨无码中文一区二区| 高h视频在线| 亚洲视频色图| 高清乱码精品福利在线视频| 日韩中文欧美| 青草视频久久| 日本国产精品一区久久久| 爱爱影院18禁免费| 久久一色本道亚洲| 热99re99首页精品亚洲五月天| 久久9966精品国产免费| 国模极品一区二区三区| 国产毛片片精品天天看视频| 亚洲人成人无码www| 欧美精品啪啪一区二区三区| 国产在线视频欧美亚综合| 免费人成网站在线观看欧美| 国产黄色视频综合| 久久国产亚洲偷自| 欧美一级高清视频在线播放| 日韩国产一区二区三区无码| 国内精自视频品线一二区| 国产肉感大码AV无码| 三上悠亚精品二区在线观看| 久久 午夜福利 张柏芝| 91精品久久久久久无码人妻| 无码内射在线| 国产成人高清精品免费软件| 亚洲一区毛片| 国产99视频在线| 91小视频版在线观看www| 91在线精品麻豆欧美在线| 亚洲动漫h| 亚洲中文字幕无码mv| 国产女人在线观看| 91成人在线免费视频| 日韩欧美国产另类| 国产精品亚洲专区一区| 欧美h在线观看| 国语少妇高潮| 成人久久精品一区二区三区| 欧美一级夜夜爽www| 中文字幕天无码久久精品视频免费| 在线国产毛片| 国产精品女人呻吟在线观看| 69视频国产| 亚洲丝袜中文字幕| 国产欧美精品一区二区| 亚洲日韩精品欧美中文字幕| 一本一道波多野结衣av黑人在线 | 91精品在线视频观看| 蜜臀av性久久久久蜜臀aⅴ麻豆| 精品五夜婷香蕉国产线看观看| 人妻少妇乱子伦精品无码专区毛片| 无码免费的亚洲视频| 亚洲成A人V欧美综合| 久久久久久久久久国产精品| 亚洲 欧美 日韩综合一区| 亚洲国产精品无码AV| 女人av社区男人的天堂| 日韩不卡高清视频| 日韩欧美综合在线制服| 92精品国产自产在线观看| 在线免费观看a视频| 综1合AV在线播放| 精品视频一区在线观看| 国产91视频免费观看| 最新日本中文字幕| 国产主播喷水| 四虎永久免费地址| 久久永久精品免费视频| 亚洲人成日本在线观看| 久久免费视频6| 一级做a爰片久久毛片毛片| 亚洲无码在线午夜电影| 久久精品这里只有国产中文精品| 婷婷午夜影院| 久久久久九九精品影院| 99热最新网址| 亚洲欧洲美色一区二区三区| 亚洲天堂777| 亚洲日韩精品无码专区97|