999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

漢語釋義元語言系統研究的拓荒之作

2007-01-01 00:00:00劉婭瓊
辭書研究 2007年5期

摘要 《漢語釋義元語言研究》和《現代漢語釋義基元詞研究》是漢語釋義元語言系統研究的兩部拓荒之作。二者通過反復提取、調整,得出各自的漢語釋義元語言系統。通過對兩本專著的對讀,比較了二者的研究思路、研究方法、分析重點、提取結果等,總結了兩本專著的不同特色。二者盡管存異,但相互補充。

關鍵詞 釋義元語言 釋義基元詞 系統 研究 驗證

引言

“元語言”(metalanguage)最早是由哲學界提出的。在區別語言與語言所指事物的關系時,把與客觀對象相聯系的語言稱作對象語言(object language),而用來分析、描述對象語言的就是元語言。語義哲學中的“元語言”要解決的主要問題是對意義本原進行正確的認知與判斷。自然語言處理中的“語義原語”(primitive)要解決語義的形式化、規則化的問題。詞典學中的“元語言”指用來解釋辭典所收詞語的釋義語言。在語言學元語言理論,特別是在詞典學的釋義元語言理論的指導下,安華林、蘇新春二位先生對現代漢語釋義用詞進行了專題研究,分別出版專著《現代漢語釋義基元詞研究》(中國社會科學出版社2005年出版,以下簡稱安著)和《漢語釋義元語言研究》(上海教育出版社2005年出版,以下簡稱蘇著),填補了國內釋義元語言系統研究的空白。

“釋義基元詞[1]指用于語文詞典釋義的最低限量的基元詞?!保ò仓?)“釋義元語言就是一種語言中對其他的詞匯成分進行解詞釋義所使用的一套用詞用語系統。”(蘇著:324)20世紀20年代以后,英、法、德等語種“基礎詞匯詞表”陸續問世,使詞典編纂使用定量詞匯釋義的方法得以形成。例如著名的《朗文當代英語詞典》(Longman Dictionary of Contemporary English)雖幾經改版,但它用2000來個釋義詞解釋了5.6萬個詞項的方法始終未變,堪稱當代詞典使用定量詞匯釋義的杰作。國外資料及詞典編纂案例顯示,“在當代詞典編纂實踐中,使用定量詞匯釋義是一種主導趨勢”。(安著:7)在中國,這一主導趨勢尚未在詞典編纂工作中得以體現。漢語詞匯的計量研究雖然在20世紀20年代已經起步(安著:15),但是,基于相當規模語料的漢語詞匯計量研究大多開始于20世紀80年代以后,出版了《現代漢語三千常用詞表》(1987)、《現代漢語頻率詞典》(1986)、《漢語水平詞匯與漢字等級大綱》(1992,2001)等詞表和詞典。漢語詞匯的計量研究雖已取得一些成績,可是辭書編纂這一重要領域,特別是對辭書釋義性詞語的限量提取工作,幾乎被忽略了,國內迄今沒有一部使用限量詞匯釋義的詞典。安華林、蘇新春二位先生同時出版于2005年上半年的專著正是基于這一學術空白的拓荒之作。兩本專著同時問世,也體現了詞典編纂界對元語言理論的關注。

這兩本專著分別是兩位作者的博士論文。二位先生在攻讀博士學位之初,不約而同地選擇了這一專題,并幾乎在同時出版專著,這一“巧合”足以說明學界對該專題越來越濃的興趣。兩位作者經過分析都認為,詞典釋義用詞完全可以做到限量,基本釋義詞數可以控制在三四千個。在這一思路的指引下,兩本專著均立足于中國社會科學院語言研究所編纂的《現代漢語詞典》(1996)(下文簡稱XH),全面統計其“釋義部分”,進而建立語料庫,在現代漢語元語言系統研究的總體框架內進行研究,經過計算機統計、分析和人工比對等諸多環節,分別提取出以語文性詞語為對象的釋義基元詞集。

兩部著作雖然立題相同,但是研究思路、研究方法、分析重點、提取結果迥異,它們各自的特色引起讀者的極大興趣。

首先,二者的研究思路、方法、提取結果有別。

蘇著的研究分為三步:對XH的釋義部分進行分詞處理,統計單個詞語的絕對詞頻和反映詞語覆蓋能力的累積頻率,以詞頻高、語料覆蓋面廣的詞語作為釋義元語言的候選詞;以《同義詞詞林》的義類為參照系,分析候選詞的語義分布和語義關系,對同一義類的候選詞進行汰舊、汰僻、汰罕的篩選,保留常用詞、通用詞、廣義詞、中性詞、替代性強的詞,同一義類中通過同義系聯確定高頻的代表詞,并在語義分布調查后進行相對詞頻調查;分析初步確定的釋義元語言的語義特點和語用特點。

安著的研究分為七步:先對XH的釋義性語料進行詞頻統計,建立《XH釋義性詞語詞頻統計表》,并根據詞頻進行頻度分級,建立《XH釋義性語料常用詞表》;然后比對《漢語詞匯的統計與分析》(1985)、《現代漢語頻率詞典#8226;生活口語中前4000個高頻詞詞表》(1986)、《現代漢語三千常用詞表》(1987)、《普通話三千常用詞表》(增訂本,1987)、《漢語水平詞匯與漢字等級大綱》(修訂本,2001)等五種材料,提取各詞表的共現詞形,經過詞形分化和詞性標注處理,制定出《現代漢語受限詞匯詞表》;以《XH釋義性語料常用詞表》和《現代漢語受限詞匯詞表》為基礎,采取二者交集,提取釋義基元詞核心詞匯,并且擴大范圍,選取《XH釋義性詞語詞頻統計表》中頻次在20及其以上的詞與《等級大綱》甲、乙級詞的交集,作為釋義基元詞的擴展詞匯;通過詞形歸并、詞性調整、詞義分解、同義替代等手段對釋義基元詞核心詞匯和擴展詞匯進行初步調整,制成《釋義基元詞調整詞表》;參照XH釋義,用《調整詞表》中的釋義基元詞解釋《受限詞匯詞表》的所有詞項,檢驗效度,查缺補漏;利用同義、反義、類義等語義關系,進一步調整詞性,優化系統;最后,建立釋義基元詞義類等級系統,按照音序制定基元詞總表。

蘇著從頻率的高低與語義的分布兩方面作了兩個角度橫縱交叉的排比,提取出首批高頻釋詞4324條,并概述了它們的總體特征。安著以統計法、比對法、系統優選法和實例驗證法為基礎,經過層層篩選,提取出2800多個詞項,并對它們進行詞匯等級劃分(甲乙丙三級)和義類層級建構(分為3大類、8個中類、50個小類)。

從二者的研究思路、方法來看,蘇著的語料庫僅限于XH,這可能會影響提取結果的語域通用性、語感熟知性和釋義覆蓋面。盡管蘇著采用了絕對詞頻、累積詞頻、加權、相對頻率等多種統計數據,但這些統計技術只能保證既定范圍內提取的結果能兼顧多種因素,卻不能改變語料庫本身過于單一的局限性。而安著除了考察XH釋義語料中詞頻在50以上的詞以外,還比對另外五種常用詞或高頻詞詞表,得到它們的交集《現代漢語受限詞匯詞表》,這就保證了提取對象兼具高頻性和高分布率。可是XH釋義用中、高頻詞與受限詞匯的交集僅有794個,只占XH釋義用中、高頻詞總數的52%左右,雖然采取了調整手段,從XH釋義用詞頻次在20及其以上的詞中再次提取得到擴展詞匯,但也是通過與別的詞表比對來確定的,跟核心詞匯的提取一樣,照顧到了通用性,卻難以保證釋義的覆蓋面。不過安著最后通過驗證《受限詞表》全部的1451個詞項,對已得到的釋義基元詞詞集進行查缺補漏,這實際上彌補了提取方法可能存在的不足。

兩本專著的基本目的相同,都要完成對釋義元詞的提取和調整,但二者分析時的側重點有所不同。

蘇著重視對語言本體的分析描寫。蘇著在提取釋義元詞時,重點放在對XH語言的分析探討上。蘇著分列專章詳細分析了XH的詞目語言、釋義語言、同義釋詞方法等問題。其中對XH釋義語言的研究就包括了語法釋義、語用釋義、名詞動詞形容詞釋義的特點,比喻義、括號、辨析、參見釋義的方式及功能等問題。例如:“分四點來論述有關形容詞的釋義:‘形容’的使用;‘呈’字的使用;‘某某的樣子’;顏色詞的釋義?!保ㄌK著:146)在對XH語言本身的研究中,既分析了某部分語言對提取釋義元語言的影響,還窮究其本身所具有的特點。例如:“對釋義元語言來說,了解了《現漢》‘另見’這一專門術語的存在與基本作用也就可以了。其實,細析之下,可以發現《現漢》對它的使用是頗具匠心的。如標了‘另見’,要不要標‘某頁’,就有許多講究。例如初看上去是同在一頁的不標‘某頁’,如兩個‘得了’條……,可兩個‘寫意’條同在1394頁,卻標了多少頁……,看來是不是同屬一個音節才是更基本的要求?!保ㄌK著:170)

而在提取出高頻釋詞之后,蘇著又重點分析了釋義元語言的功能、風格、結構、詞義、數量等特征。例如:“對釋義元語言研究來說,它對‘詞’的認定不僅僅是看它表意的完整性、運用的獨立性,還更多了一層,就是看重它表意的意核性、搭配的靈活性與組合的高效性?!保ㄌK著:309)在說明“釋義元詞在結構上表現出的詞核化”問題上,蘇著認為“釋義元語言研究對那些補充式、動賓式的復合性結構也應是能分則分的原則,即使是凝固程度相當高的,如果是結構的拆分不影響到意義的表達,也應是慎言其合的?!保ㄌK著:310)他還舉了大量實例來證明此點,如“只要把‘住’在實詞義外的做動詞補充義的半虛化義獨立出來自成一類,就可以關照到一大批動詞了”。(蘇著:312)

從其對XH語言的細化分析來看,蘇著不僅是一部研究釋義元語言系統的專著,在一定程度上也是對XH釋義語言的系統性研究成果。

安著重驗證。在提取釋義基元詞之后,重點放在釋義驗證上。他用《釋義基元詞調整詞表》中的1802個詞項對由五種材料共現詞形所制定的《受限詞表》所有詞項進行釋義,以檢驗提取的釋義基元詞的可行性與效度。在驗證時,依據XH釋義,用《釋義基元詞調整詞表》的已有詞一一比對,必要時通過“詞項替換”或者“釋文改釋”的方法改釋原文,其體例、義項數、義項排序等原則上不作變動。安著中詳盡列出了對《受限詞表》中全部的1451個詞項的驗證結果。例如:“安慰(形、動,乙)XH釋義:①心情安適。②使心情安適?,F釋義:①心情安靜而舒適。②使心情安靜而舒適?!保ò仓?03)驗證的過程既是已得的釋義基元詞的實際運用,又是對釋義基元詞的一次調整。因為釋義驗證時幫助檢查《釋義基元詞調整詞表》是否存在缺漏,對不太充足的部分,適當增補必不可少的釋義詞。例如:“把(介,甲)XH釋義:①賓語是后面動詞的受事者,整個格式有處置的意思。②后面的動詞,是“忙、累、急、氣”等加上表示結果的補語,整個格式有致使的意思。③賓語是后面動詞的施事者,整個格式表示不如意的事情?,F釋義:①賓語是后面動作承受的對象,整個格式有處置的意思。②后面的動詞,是“急、氣”等加上表示結果的補語,整個格式有致使的意思。③賓語是后面動作發出的人或事物,整個格式表示不如意的事情。增補釋義詞:賓語(名)、動詞(名)、承受(動)、格式(名)、處置(動)、補語(名)、致使(動)、如意(形)?!庇纱耍苍鲅a926個新釋義詞,大大增強了原詞表的解釋力。這926個詞項與《釋義基元詞調整詞表》一起,構成了《釋義基元詞驗證詞表》,共有2728(1802+926)個詞項。為防止新增要素打破原來的格局,出現新的冗余或缺漏成分,安著還通過詞性調整、詞形分化、詞義分解、同義替代、反義查缺、類義補漏、參照增補等方法,對《驗證詞表》進一步優化,“釋義基元詞有增有刪有調整。就詞數而言,實際增補150個詞項,最終得到2878(2728+150)個詞項,制成《釋義基元詞優化詞表》。”(安著:210)

因為漢語釋義基元詞的研究成果最終要付諸詞典編纂、漢語教學等實踐工作,所以驗證尤為重要。安著中充分的驗證確保了研究結果的可靠性和可操作性。

兩本專著雖然都以現代漢語語文性詞語的釋義元語言為研究對象,都經過反復調整,力求“在語言的最大表達效果與語言要素的最低使用量上達到最佳平衡點”(蘇著:322),但是因為作者采取的研究思路、方法以及分析重點的差異使得二者體現出各自的特色。

蘇著特色在于:技術先進;分析細致。

蘇著的所有語料處理都是在數據庫上完成的。利用多利軟件,完全實現了對所有語料的存儲、管理、自動分詞、查詢、分析、頻率統計等工作。雖然需要些許的人工干預,但先進的計算機技術既提高了語料的處理速度,同時也保證了提供給研究者和讀者的數據全面翔實,例如頻率統計部分,不僅有單個詞語的絕對詞頻統計結果,還有反映詞語覆蓋能力的累積詞頻統計數據;有對同義釋詞的加權統計,有對釋詞在同一義類中相對頻率的統計,等等,各項數據綜合分析,增強了文章的說服力。

蘇著對XH語言的分析細致入微。除了上述對XH釋義語言的細化分析以外,蘇著還對XH的詞目語言專章分析。不僅概覽了XH語言的性質、價值、詞數、詞長、詞義容量等問題,還分節論述了單音字目、復音同形詞、方言詞、舊詞語、古詞語、外來詞、書語詞、百科詞語、通用詞等的釋義特點。例如:“《現漢》很注意揭示詞語的時代特色。有一類是用‘舊詞語’的形式來給詞語標名定性。‘舊詞語’的定性表明辭典編纂者把它們看作正在走出‘普通話通用詞匯’,正在逐漸逝去的詞語,處在當代活詞匯與正在消逝的死詞匯之間的過渡階段?!珪灿信f詞語1055條,其中‘舊詞’647條,‘舊義’408條。用來顯示舊詞語時代特征的標示語主要有‘舊時’、‘舊社會’、‘舊指’、‘舊式’、‘舊(小說、詩文……)’、‘舊稱’、‘舊俗’、‘舊制’、‘舊(…名、…物、…制)’、‘舊傳統’等。……從釋義的角度看,《現漢》對舊詞語這一時代特征的變化都是采取了比較簡單的變換特定釋詞的做法?!保ㄌK著:69-71)這樣的細化分析對釋義元語言的研究有較大的參考價值。例如,在“單字條目”一節中,作者寫道:“單字條目的載義量相差非常大。復音詞目義項最多的是8個,只有1條,7個義項的只有4條,而單字條目8個義項以上的有206條,7個義項的有89條??梢哉f全書中義項數多的詞目都集中在單字條目。這說明單字的意義容量多,使用起來更為靈活。這對釋義元語言中單字詞會占有一定的比重是很有參考價值的?!保ㄌK著:56)

安著的特色在于:客觀實證;系統性強。

安著緊緊圍繞著建立現代漢語釋義元語言系統這一論題,研究程序設計科學,提取標準客觀統一,論證嚴謹,驗證全面,整個研究過程客觀實證。具體操作上,安著全面統計了XH釋義用詞詞數及詞頻,在此基礎上分為高頻、次高頻、中頻、低頻、罕頻五個相對頻度等級;通過比對五種常用詞或高頻詞詞表,得到五種詞表的交集——現代漢語受限詞語——1451個,它們兼具高頻性和高分布率;在保證了通用性以后,又按照嚴格的操作步驟,經過詞形歸并、詞性調整、詞義分解、同義替代等步驟層層篩選,最終得到現代漢語釋義基元詞2878個詞項。所有的步驟都是客觀而可重復的。尤為重要的是,作者窮盡性地驗證了《受限詞表》的1451個詞項。這一步驟,盡管繁復,卻至關重要,它既證明了所確定的釋義基元詞釋義的可行性與充足性,又檢測了已有基元詞的羨余性和缺漏性,為進一步增刪調整提供了強有力的依據。

安著中,從語料庫的選擇到釋義基元詞的提取、調整、驗證、優化、確定,每個過程作者都立足于已有的語料和成果,力求建立完整的現代漢語釋義元語言系統。其最終建立的《現代漢語釋義基元詞音序總表》是等級表和義類表的匯總,它包含了詞項的標準詞形、讀音、詞性、義類、等級、排序等信息??梢哉f,安著已經建立起了一個較為完整的現代漢語釋義元語言系統。即使在細節的處理上,安著也力求保證釋義元語言自身的系統性。比如,同是分析釋義基元詞的語義,安著與蘇著的切入點卻完全不同。蘇著以《同義詞詞林》的語義系統為參照,分析了4324條釋義元詞中見于《詞林》的3780條詞項在一、二、三級義類中的分布情況。例如,“《詞林》的三級義類有1428類。經調查,3780條釋詞分布在其中的1207類中……1207類占所有1428類的84.524%。”(蘇著:241)而安著則采用歸納法,“面向《釋義基元詞優化詞表》的所有詞項,先采取同類系聯的辦法,建立一個個同類小組,然后逐層抽象,適可而止。”(安著:212)按照一詞一性,不作跨類處理,以及多義詞分別歸類的原則,最終把2800多個詞項分為3個大類、8個中類、50個小類,小類下面再分組。例如,把“2述謂詞”分為“2.1動作、行為……2.2性質、狀態……2.3數量、度量……2.4指示、稱代……”(安著:213)從而形成了”釋義基元詞語義層級體系”。

綜上,蘇新春、安華林二位先生各有側重,成功地建立起現代漢語釋義元語言系統。二位的研究互相補充,必將推動漢語釋義元語言系統的研究乃至中國元語言學的建設。遺憾的是,受篇幅所囿,未能盡觀釋義基元詞系統的全貌[2],否則,將二位先生所提取的基元詞加以對照,將是非常必要而且有意義的事情。讀者們期待著早日見到完整的釋義基元詞系統,更期待著能早日見到用有限的基元詞所編纂的漢語語文詞典。這些成果將徹底改變詞典編纂、語言教學乃至中文信息處理的現狀。

附注

[1]安著稱之為“釋義基元詞”,蘇著稱之為“釋義元詞”,二者所指相同,下文不再說明。

[2]安著列出了《XH釋義性語料常用詞表》(包括中、高頻詞共1520個)、《釋義基元詞基礎詞表》(包括核心詞794個、擴展詞1111個)、《釋義基元詞的驗證過程》(對1451個受限詞匯的驗證)、《現代漢語釋義基元詞義類表》(以甲級詞為例)、《現代漢語釋義基元詞音序總表》(每字母取前30個詞為例)。蘇著僅列出了《不含釋詞的〈詞林〉三級類類名》(包括221個類名)、《前300條高頻釋詞的詞性構成》(分詞性按照頻率高低排列)、《高頻釋詞義頻統計》(包括47個例詞)。

(復旦大學中文系上海200433)

(責任編輯葉玉秀)

主站蜘蛛池模板: 99热这里只有精品国产99| 亚洲精品国产首次亮相| 国产亚洲视频免费播放| 乱色熟女综合一区二区| 日本国产一区在线观看| 91香蕉视频下载网站| 香蕉在线视频网站| 成人一级黄色毛片| 亚洲综合第一页| 91久久偷偷做嫩草影院免费看| 色偷偷一区| 香蕉在线视频网站| 国产18在线| 国产永久在线视频| 欧美成人综合视频| 午夜激情福利视频| 一本大道东京热无码av| 青青草原国产| 97se亚洲| 欧美激情,国产精品| 高清不卡一区二区三区香蕉| 精品乱码久久久久久久| 97在线国产视频| 风韵丰满熟妇啪啪区老熟熟女| 天堂成人av| 91无码人妻精品一区二区蜜桃 | 欧美精品啪啪| 久久96热在精品国产高清| 日韩欧美高清视频| 四虎成人免费毛片| 亚洲黄色视频在线观看一区| 日韩成人高清无码| 久久国产成人精品国产成人亚洲| 久久精品女人天堂aaa| 亚洲婷婷在线视频| 99性视频| 国产不卡国语在线| 91福利免费| 国产自在线拍| 亚洲免费福利视频| 欧美三級片黃色三級片黃色1| 久草视频精品| 国产精品丝袜视频| 丁香五月激情图片| 国产亚洲欧美日韩在线一区二区三区| 亚洲va欧美ⅴa国产va影院| 无码啪啪精品天堂浪潮av| 欧美精品1区2区| 第九色区aⅴ天堂久久香| 伊人久久大香线蕉综合影视| 少妇人妻无码首页| 广东一级毛片| 亚洲美女高潮久久久久久久| 亚洲高清资源| 国产91视频免费观看| 亚洲精品自拍区在线观看| 国产欧美视频一区二区三区| 黄色三级毛片网站| 成人免费网站久久久| 亚洲第一极品精品无码| 亚洲一区二区三区麻豆| 久久精品人人做人人爽97| 欧美精品伊人久久| 日韩在线视频网| 精品福利一区二区免费视频| 午夜精品久久久久久久2023| 国产一区二区三区精品欧美日韩| 综合成人国产| 国产丝袜无码精品| 97se亚洲综合在线| 色偷偷男人的天堂亚洲av| 欧美精品亚洲二区| 女人18毛片水真多国产| 久久一日本道色综合久久| 国产精品短篇二区| 国产精品夜夜嗨视频免费视频| 99热这里只有免费国产精品| 成人午夜免费观看| 永久免费无码日韩视频| 日韩av高清无码一区二区三区| 精品视频一区二区三区在线播| 一本一本大道香蕉久在线播放|