一、引言
簡化字、繁體字和同形字之間存在一定的非對稱關系,即一個簡化字對應著多個不同的繁體字和同形字。而這種不對稱關系則是影響漢字繁簡轉換和古籍閱讀的主要障礙之一,同時對于中文信息處理系統的設計也提出了更高的技術要求。在進行繁簡轉化時,同一個簡化字在不同的語義下可能存在不同的寫法,若混淆不分則會造成轉化錯誤;在簡體排版的古籍中,存在與簡化字只是字形相同的同形字,若不加辨別也會引起一定的歧義。另外在跨地區交流和對外漢語教學中,此類非對稱關系漢字的正確轉換也是一大難題。
因此,對于簡化字、繁體字和同形字之間的非對稱關系進行系統梳理十分必要,通過梳理這種非對稱關系,可以更好地理解簡化字、繁體字和同形字之間的關系,有助于教育和學習,提高文本的規范性和統一性,便于實現準確便捷的漢字繁簡轉換。本文以《現代漢語詞典(第7版)》和《漢語大字典》為依據,重新篩選并整理出存在非對稱關系的簡化字、繁體字和同形字,并梳理三者對應關系,探討其中具體的簡化方式、字際關系及繁簡轉換情況等。同時為方便數據分析與檢索查詢,現將所整理數據錄入Access數據庫,能夠實現簡化字、繁體字和同形字之間的相互檢索、具體信息查詢和數據計量分析等功能。
二、非對稱關系的簡化字、繁體字和同形字的整理
首先在《現代漢語詞典(第7版)》中篩選出99組具有非對稱關系的簡化字和繁體字;其后再從《漢語大字典》篩選出83組具有非對稱關系的簡化字、繁體字和同形字,并對先前的99組進行補充。據此共得到182組具有非對稱關系的簡化字、繁體字和同形字,并在漢字源流(字源)、漢字讀音(字音)、漢字古今字意(字意)、各字意相應的使用示例(使用示例)、各繁體字對應的簡化方式(簡化方式)以及繁體字與繁體字、繁體字與同形字的字際關系(字際關系)等方面進行了具體的整理。通過對各方面信息的進一步整理,在篩選字形的基礎上更好地了解其具體的適用字意范圍、用例、簡化過程和內部的字際關系,從而幫助使用者更好地選擇正確的字形進行使用。
簡化字與繁體字及同形字的具體關系共有三種:(1)同形:簡化字和同形字原本為完全不同的字,只是漢字在簡化時選取了同形字的字形進行簡化,因而現簡化字與同形字字形相同。(2)繁簡:漢字簡化時形成的簡化字與繁體字的不同字形。(3)繁簡同形:簡化字對應了多個繁體字,在簡化時選取了其中一個繁體字的字形作為簡化字對應的字形,因而存在簡化字與繁體字同形的情況。
三、非對稱關系的簡化字、繁體字和同形字的分類與舉例
根據上述具體關系,可以將簡化字、繁體字和同形字三者的對應關系情況分為四大類:(1)另造合并(共22組):只存在“繁簡”關系,簡化字是對多個繁體字的合并簡化;且簡化字與多個繁體字的字形皆不相同。(2)歸一合并(共66組):存在“繁簡”“繁簡同形”兩種關系,簡化字是對多個繁體字的合并簡化;且簡化字與其中一個繁體字字形相同。(3)取代合并(共73組):存在“同形”和“繁簡”兩種關系,簡化字是對繁體字的簡化;且簡化字取得其同形字的字形,取代其同形字的音義;(4)部分合并(共23組):存在“同形”“繁簡”“繁簡同形”三種關系;且簡化字一方面取得其同形字的字形,另一方面又是多個繁體字的合并,并與其中一個繁體字字形相同。
下面舉例并說明非對稱關系下的簡化字、繁體字和同形字的對應情況。
另造合并(方括號外的字為簡化字,方括號內的字為該簡化字的繁體字):
擺[擺襬]:“擺”是“擺”和“襬”的另造合并簡化字,當“擺”表示“安放、顯示”等意義時,其繁體字為“擺”;當“擺”表示“以及長袍、上衣、襯衫等的最下端部分”的意義時,其繁體字為“襬”。
復[複復]:當“復”表示“重復”的意義時,其繁體字為“複”;當“復”表示“回答、報復”等意義時,其繁體字為“復”。
獲[獲穫]:當“獲”表示“得到”意義時,其繁體字為“獲”;當“獲”表示“收割”的意義時,其繁體字為“穫”。
歸一合并(方括號外的字為簡化字,方括號內的第一個字為該簡化字的繁簡同形字,第二、三、四個字為該簡化字的繁體字):
板[板闆]:“板”是“板”和“闆”的歸一合并簡化字,當“板”作“片狀的較硬的物體”的意義時,其繁體字為繁簡同形的“板”;當“板”作“老板”之意時,其繁體字為“闆”。
干[干乾幹]:當“干”作“冒犯、天干”等意義時,其繁體字為繁簡同形的“干(gān)”;當“干”作“空無所有、水分少”等意時,其繁體字為“乾(gān)”;當“干”作“事物的主體、能干”等意時,其繁體字為“幹(gàn)”。
蒙[蒙濛懞矇]:當“蒙”作“昏迷、遮蓋”等意義時,其繁體字為繁簡同形的“蒙”;當“蒙”作“形容雨點等很細小”之意時,其繁體字為“濛”;當“蒙”作“樸實”之意時,其繁體字為“懞”;當“蒙”作“欺騙、眼睛失明”等意時,其繁體字為“矇”。
取代合并(方括號外的字為簡化字,方括號內的第一個字為該簡化字的同形字,第二個字為該簡化字的繁體字):
趕[趕趕]:“趕(gǎn)”是“趕(qián)”和“趕(gǎn)”的取代合并字,當“趕”作“獸畜翹著尾巴奔跑”之意時,“趕(qián)”是簡化字“趕(gǎn)”的同形字,且該字音字義已被其簡化字取代;當“趕”作“追、加快行動”等意時,其繁體字為“趕(gǎn)”。
憐[憐憐]:當“憐”作“聰明、明白”之意時,“憐(lǐng)”是簡化字“憐(líng)”的同形字,且該字音字義已被其簡化字取代;當“憐”作“憐憫、愛”之意時,其繁體字為“憐(lián)”。
體[體體]:當“體(bèn)”同“笨”為“粗劣”意或當“體(cuì)”為“古代獄名”時,“體(bèn、cuì)”是簡化字“體(tǐ)”的同形字,且該字音字義已被其簡化字取代;當“體”作“親近”之意或作“身體、物體”等意時,其繁體字為“體(tī、tǐ)”。
部分合并(方括號外的字為簡化字,方括號內的第一個字為該簡化字的同形字,第二個字為該簡化字的繁簡同形字,第三、四、五個字為該簡化字的繁體字):
廠[廠廠廠]:“廠(chǎng)”是“廠(hǎn)”“廠(ān)”和“廠(chǎng)”的部分合并簡化字,當“廠(hǎn)”指稱“山崖”時,“廠(hǎn)”為簡化字“廠(chǎng)”的同形字,該字音字義已被其簡化字取代;當“廠(ān)”指稱“庵”的語義時,其繁體字為繁簡同形的“廠(ān)”;當“廠(chǎng)”指稱“工廠”時,其繁體字為“廠(chǎng)”。
只[只只隻衹]:當“只(zhǐ)”作語氣詞時,“只(zhǐ)”為簡化字“只(zhī、zhǐ)”的同形字,該字義已被其簡化字取代;當“只(zhǐ)”指稱姓氏時,其繁體字為繁簡同形的“只(zhǐ)”;當“只(zhī)”用作量詞時,其繁體字為“隻(zhī)”;當“只(zhǐ)”指“僅有”之意時,其繁體字為“衹(zhǐ)”。
術[術術術]:當“術(shú)”指稱“黏谷子或姓氏”時,“術(shú)”為簡化字“術(shù)”的同形字,該字音字義已被其簡化字取代;當“術(zhú)”指稱“白術”的語義時,其繁體字為繁簡同形的“術(zhú)”;當“術(shù)”指稱“技藝、方法”時,其繁體字為“術(shù)”。
由此四類對應情況亦可以進一步看出——非對稱關系下的簡化字、繁體字和同形字之間相互轉換存在限制。
在繁簡轉換方面,另造合并、歸一合并、取代合并和部分合并這四類對應關系在簡繁轉換時均有限制。另造合并類和歸一合并類簡轉繁時需要判斷詞義,選擇相應的繁體字;取代合并類和部分合并類則先要判斷其是否為簡化字的同形字,若是則不能進行簡轉繁,若不是則可以進一步選擇詞義所對應的繁體字字形。而這四類對應關系在繁轉簡時是沒有限制的。但取代合并類和部分合并類在進行繁轉簡之后,亦需要具體分析其是繁體字對應的簡化字,還是簡化字對應的同形字,如“取代合并”類里的“蠶”,“蠶”指的是桑蠶、柞蠶,其繁體字為“蠶”,與其同形字“蠶”的意義“蚯蚓”無關,如果直接轉換為其同形字“蠶”,難免會造成語義不明,不能一概而論。
在古籍閱讀方面,另造合并、歸一合并、取代合并和部分合并這四類對應關系均會對其產生一定影響。其中另造合并類和歸一合并類的影響主要是由于其對應的繁體字本為兩字或多字,簡化后卻為一字,在閱讀簡化字編排的古籍時則需要具體分析其對應的繁體字字意,而不能一概而論。取代合并類和部分合并類的影響主要是由于“簡化字”和“簡化字對應的同形字”的字形一致,而其字音字義卻又有所區別,因而需要充分了解其本字本義進而加以區分。如在《說文·它部》:“它,蟲也。從蟲而長,象冤曲而垂尾形。”中,其中的“蟲”字實際是簡化字“蟲(chóng)”的同形字“蟲(huǐ)”,指的是毒蟲。如果不明其同形字與簡化字之別,則會影響對古籍的閱讀與理解。
四、非對稱關系的簡化字、繁體字和同形字的數據庫建設
通過對存在非對稱關系的簡化字、繁體字和同形字進行具體的信息錄入和分類整理,建立了“非對稱關系的簡化字、繁體字和同形字數據庫”。該數據庫構建起簡化字表和繁體字同形字表之間的“一對多”關系,從而梳理清楚了182個簡化字所存在的非對稱關系。該數據庫的主要內容包括匯總字表、查詢系統和計量分析三大部分。在匯總字表部分可以查閱“非對稱關系的簡化字、繁體字和同形字”的全部信息,包括:簡化字的字形、字音和字意,共182條數據;以及繁體字和同形字的字形、字源、字音、字意、使用示例、簡化方式以及字際關系等內容,共514條數據。在查詢系統部分,可以在查詢窗口中輸入簡化字或繁體字及同形字,從而實現對應信息及三者之間字際關系的快捷查詢。在計量分析部分,可以查看簡化方式、字際關系等的數據計量分析情況,如可以清晰地看到“音同音近替代”的簡化方式數量最多,共有100組,占比33.44%;而“草書楷化”的簡化方式最少,僅有1組,占比0.33%。非對稱關系的簡化字、繁體字和同形字數據庫的建設,一方面有序匯總了信息,并將簡化字與繁體字和同形字之間復雜的關系利用數據庫加以明晰;另一方面可以提供給使用者以方便快捷的檢索和數據化內容的展示,以期對規范使用繁簡字以及進一步探究其關系有所幫助。
五、結語
漢字作為一種表意體系的文字,能夠從字形推斷字意。不過由于漢字總體發展的趨勢是逐漸簡化的,這種表意特征越來越不明顯,同時也造成了繁體字與簡化字、同形字之間的復雜關系。通過梳理這些關系,構建便于查詢的數據庫,可以更好地處理和轉換繁簡字,提高信息處理的準確性和效率,有助于推廣和規范漢字的正確使用,有利于保持和傳承中文書寫的統一性和準確性,加強中文的國際交流和傳播。同時對中文作為第二語言的學習者來說,梳理繁簡字的關系能夠幫助他們更好地掌握中文書寫體系,提高書寫和閱讀的準確性。
參考文獻:
[1]連登崗.《簡化字總表》歸并字代替字研究[A].史定國主編.簡化字研究[C].北京:商務印書館,2004:118-150.
[2]張書巖.簡化與同形字[A].史定國主編.簡化字研究[C].北京:商務印書館,2004:212-223.
[3]中國社會科學院語言研究所詞典編輯室,編.現代漢語詞典(第7版)[M].北京:商務印書館,2018.
[4]漢語大字典編輯委員會,編纂.漢語大字典(第2版)[M].武漢:崇文書局,成都:四川辭書出版社,2010.
(作者簡介:王明月,女,本科在讀,西南民族大學中國語言文學學院,研究方向:漢語國際教育;馬依蘭,女,本科在讀,西南民族大學中國語言文學學院,研究方向:漢語言文學)
(責任編輯 王瑞鋒)