河南科技學院 趙元
20世紀80年代以來,幾乎全球的旅游組織和企業都把自己的旅游資源、設施和產品等編寫成圖文并茂的材料,放在互聯網上進行銷售[1]。如今越來越多的游客借助互聯網查找旅游信息,安排行程。隨著中國旅游業的飛速發展,數以萬計的外國游客來中國觀光旅游。因此,作為旅游信息最基本的綜合體,旅游目的地英文網頁介紹變得更加重要,它成為連接旅游產品銷售者和消費者之間的最快捷、最便利的信息橋梁。為了對中國旅游目的地英文網頁介紹文本和英美國家旅游目的地英文網頁介紹文本進行對比,并觀察中西方使用哪些主題詞來反映旅游的主題,作者分別建立了約四十萬詞的中國旅游目的地英文網頁介紹語料庫(The corpus of the Chinese Tourist Destination Information on the Internet, 縮寫成CCTDII)和西方旅游目的地英文網頁介紹語料庫(The corpus of the Western Tourist Destination Information on the Internet,縮寫成CWTDII),采用基于語料庫的方法,找出兩個語料庫的主題詞和關鍵主題詞的差異,發掘中西方對外宣傳旅游地的不同特色,以期促進中外交流以及旅游業的發展。
主題詞指的是與參照語料庫相比,在一定文本中出現頻率顯著偏高的詞[2]。偏高的程度即是該主題詞的“關鍵性”。主題詞和文本的主題密切相關?!瓣P鍵主題詞”是指那些在多篇相關主題文本中以主題詞形式出現的詞,出現的篇數越多,關鍵性越強。關鍵主題詞能夠說明表達相關主題時常用的常用詞語或詞集[3]。主題詞提取的理論依據是,在同類主題的語料中,其詞語分布圍繞主題相對集中,且詞語重復頻率較高[4]?!?br>