異體字是指在某一歷史時(shí)期,同一字在不同地區(qū)、民族或方言中因音變、形變等原因而形成的不同書(shū)寫(xiě)形式。在現(xiàn)今的漢字體系中,許多異體字已經(jīng)不再使用,這使人們?cè)陂喿x古籍時(shí),很難準(zhǔn)確判斷作者原本想要表達(dá)的意思。因此,在古籍整理出版過(guò)程中,編輯人員或者古籍專(zhuān)家等需要根據(jù)相關(guān)標(biāo)準(zhǔn)或規(guī)范字表對(duì)古籍中的異體字進(jìn)行編輯處理。鑒于此,現(xiàn)圍繞古籍整理出版中異體字的處理展開(kāi)探討。首先,對(duì)古籍、異體字進(jìn)行了簡(jiǎn)要論述。其次,提出了編輯處理古籍異體字的具體策略,分別是尊重原文與標(biāo)準(zhǔn),合理統(tǒng)一古籍異體字;結(jié)合古籍上下文,正確辨識(shí)古籍異體字;科技與人工結(jié)合,提高異體字處理質(zhì)效。
古籍作為中華民族寶貴的文化遺產(chǎn),承載著豐富的歷史底蘊(yùn)及深厚的文化內(nèi)涵,在現(xiàn)今仍然表現(xiàn)出較高的學(xué)術(shù)研究?jī)r(jià)值。然而,古籍中常常存在大量的異體字,這些異體字不僅為現(xiàn)代讀者閱讀和研究古籍帶來(lái)困擾,也影響了古籍的傳承與發(fā)展。因此,編輯人員在對(duì)古籍進(jìn)行整理出版時(shí),需要靈活、合理地處理異體字,一方面,要注重保持異體字的原貌和涵義;另一方面,要使古籍便于閱讀,促進(jìn)讀者準(zhǔn)確理解古籍的內(nèi)容,實(shí)現(xiàn)對(duì)古籍主題及其內(nèi)涵的全面把握。
關(guān)于古籍異體字的概述
古籍
古籍,顧名思義,是指古代的文獻(xiàn)或書(shū)籍,是反映古代社會(huì)、文化、歷史等方面內(nèi)容的重要載體。古籍包括經(jīng)部、史部、子部、集部等各種形式的文字記錄,涵蓋了古代哲學(xué)、史學(xué)、文學(xué)、科技、醫(yī)學(xué)、藝術(shù)等諸多領(lǐng)域的知識(shí)。古籍承載著中華民族五千多年文明的精髓以及古人卓絕的智慧,是歷史的見(jiàn)證者、文化的載體、知識(shí)的寶庫(kù)。每一部古籍,無(wú)論是竹簡(jiǎn)、木刻、線裝書(shū),還是石刻,都是古人思想智慧的結(jié)晶,是現(xiàn)代人理解過(guò)去、把握現(xiàn)在、展望未來(lái)的重要窗口。
首先,古籍是先賢智慧的載體。從甲骨文到竹簡(jiǎn),再到紙質(zhì)書(shū)籍,它們都記錄了先賢們的哲學(xué)思考、歷史事件、科技發(fā)明、文學(xué)藝術(shù)等方方面面的內(nèi)容。其中,儒家經(jīng)典(如《詩(shī)經(jīng)》《論語(yǔ)》《孟子》),道家著作(如《道德經(jīng)》),法家、兵家、醫(yī)家等各家思想,都以古籍的形式得以流傳,對(duì)后世產(chǎn)生了深遠(yuǎn)影響。古代眾多的詩(shī)詞歌賦、筆記小說(shuō),更是以其獨(dú)特的藝術(shù)魅力,成為中華民族精神生活的重要反映。
其次,古籍是民族精神的象征。古籍蘊(yùn)含著中華民族的傳統(tǒng)價(jià)值觀、道德觀念和社會(huì)習(xí)俗,是中華文明的重要標(biāo)志。無(wú)論是《論語(yǔ)》中的儒家思想,還是《史記》中的歷史敘事,抑或是《紅樓夢(mèng)》中對(duì)人性的剖析,都影響了中國(guó)人的思維方式和行為準(zhǔn)則,塑造了獨(dú)特的民族文化氣質(zhì)。
整體來(lái)看,古籍不僅是學(xué)術(shù)研究的重要資料,也是現(xiàn)代人了解古代社會(huì)風(fēng)貌、風(fēng)俗習(xí)慣、科技水平和思想觀念的重要窗口。加強(qiáng)對(duì)古籍的整理與研究,可以更深入、更全面地窺見(jiàn)古人如何思考問(wèn)題,理解他們的價(jià)值觀,了解中華民族的根基和淵源,弘揚(yáng)中華優(yōu)秀傳統(tǒng)文化。另外,古籍中蘊(yùn)含的哲理和智慧也能夠?qū)Ξ?dāng)代人們的生活與研究產(chǎn)生啟迪。
異體字
中國(guó)文字源遠(yuǎn)流長(zhǎng),如同一條連綿不斷的文明之河,歷經(jīng)數(shù)千年的變遷與發(fā)展。早在上古時(shí)期,智慧卓絕的先祖就創(chuàng)造了甲骨文和金文,它們承載著先民們的智慧與歷史記憶,奠定了漢字的基礎(chǔ)。甲骨文刻在龜甲獸骨之上,見(jiàn)證了商朝的繁榮;金文鐫刻于青銅器皿之上,映照出周朝的輝煌。它們猶如歷史的印記,為漢字的發(fā)展鋪就了基石。進(jìn)入春秋晚期,社會(huì)變革劇烈,宗法貴族的政治體系逐漸瓦解,士階層嶄露頭角,文字的應(yīng)用范圍隨之?dāng)U大。這一時(shí)期,隨著各地文化交融的深入,不僅方言各異,文字形態(tài)也呈現(xiàn)出顯著的地域性差異,形成了“言語(yǔ)異聲,文字異形”的局面。此處的“文字異形”即為異體字,主要是指在漢字中存在多種寫(xiě)法、形體不同但發(fā)音相同或意思相近的字。
嚴(yán)格來(lái)講,異體字具有寬義和嚴(yán)義之分。其中,嚴(yán)義的異體字,其音義要求高度一致,如“崖”(正體)與“崕”(異體)。寬義的異體字則更為靈活,它們之間的關(guān)系并非一對(duì)一的對(duì)應(yīng),而是存在一定的互通性和包容性。古籍中的異體字通常源自歷史上不同地區(qū)、不同文化圈的書(shū)寫(xiě)習(xí)慣與時(shí)代演變,反映了漢字演變的復(fù)雜性與多樣性。異體字在豐富漢字表現(xiàn)形式的同時(shí),也帶來(lái)一定的閱讀和理解障礙。在實(shí)際應(yīng)用中,有時(shí)會(huì)因?yàn)槭褂昧瞬怀R?jiàn)的異體字,導(dǎo)致讀者無(wú)法辨認(rèn)或產(chǎn)生誤解。因此,正確理解和使用異體字對(duì)于提高文字表達(dá)的準(zhǔn)確性和美感至關(guān)重要。
古籍整理出版中異體字的編輯處理策略
從異體字的特性來(lái)看,狹義的異體字主要是書(shū)寫(xiě)符號(hào)的簡(jiǎn)單復(fù)制,對(duì)于整個(gè)漢字系統(tǒng)而言,是冗余的存在,無(wú)實(shí)質(zhì)作用;廣義的異體字則更多地表現(xiàn)為書(shū)寫(xiě)符號(hào)的多重角色,這種“兼職”現(xiàn)象在一定程度上造成了漢字體系的混亂,阻礙了漢字的規(guī)范使用,影響了語(yǔ)言的清晰表達(dá)。因此,處理古籍中的異體字,本質(zhì)上是對(duì)古人書(shū)寫(xiě)習(xí)慣多樣性的規(guī)范與優(yōu)化,通過(guò)剔除單純的重復(fù)符號(hào)以及調(diào)整兼有多種含義的符號(hào),確保漢字系統(tǒng)的穩(wěn)定性和語(yǔ)言連續(xù)性,使現(xiàn)代人能更流暢地閱讀古籍。在古籍整理出版中,編輯人員可以通過(guò)以下策略編輯處理異體字。
尊重原文與標(biāo)準(zhǔn),合理統(tǒng)一古籍異體字
作為特定歷史時(shí)期的產(chǎn)物,古籍是研究古代社會(huì)、思想、文字演變的重要資料,其文字使用和風(fēng)格通常受到當(dāng)時(shí)社會(huì)、地域等多方面因素的影響,這也直接導(dǎo)致古籍中的文字由于時(shí)代變遷和地域差異出現(xiàn)異體字現(xiàn)象,為現(xiàn)代讀者帶來(lái)了閱讀和理解的挑戰(zhàn)。因此,編輯和處理古籍異體字時(shí),編輯人員必須遵循一定的原則與標(biāo)準(zhǔn),既要尊重原貌,又要兼顧現(xiàn)代讀者的閱讀需求,在此基礎(chǔ)上對(duì)異體字進(jìn)行規(guī)范合理地統(tǒng)一。
第一,尊重原文是編輯和處理古籍異體字的基本原則。古籍中的異體字是古代社會(huì)的歷史產(chǎn)物,反映了當(dāng)時(shí)的文化背景、書(shū)寫(xiě)習(xí)慣以及語(yǔ)用特點(diǎn)。它們?cè)诋?dāng)時(shí)社會(huì)的語(yǔ)境中具有明確意義,是古代文化的重要組成部分。如果編輯人員在編輯和處理古籍時(shí),隨意替換或刪減異體字,可能會(huì)導(dǎo)致原文意義的誤解或丟失,從而曲解了古人的原意,此類(lèi)現(xiàn)象在一對(duì)多的異體字中較為明顯,如“征伐”的“征”,不能統(tǒng)一為“徵召”的“徵”。因此,在編輯和處理古籍異體字時(shí),編輯人員必須尊重原文,保持其原始形態(tài),使現(xiàn)代讀者能夠準(zhǔn)確理解古人的思想和觀點(diǎn),真正體驗(yàn)古籍的獨(dú)特魅力,感受古人的情感與智慧。
第二,遵循標(biāo)準(zhǔn)是編輯和處理古籍異體字的必要手段。雖然古籍中的異體字較為多樣,但編輯人員可以通過(guò)查閱權(quán)威的字典或工具書(shū),如《說(shuō)文解字》《康熙字典》《辭源》《辭海》《漢語(yǔ)大字典》等,確定其正確讀音和意義,保證文字的準(zhǔn)確性,并且消除現(xiàn)代讀者在閱讀時(shí)因?yàn)樽中蔚哪吧a(chǎn)生的困擾。與此同時(shí),編輯人員也要參考國(guó)家發(fā)布的一系列標(biāo)準(zhǔn)或指導(dǎo)文件對(duì)古籍異體字進(jìn)行規(guī)范和統(tǒng)一。例如,1955年,我國(guó)發(fā)布《第一批異體字整理表》,收異體字810組,根據(jù)從簡(jiǎn)從俗的原則,從中選出810個(gè)作為正體,淘汰了1055個(gè)異體字,不僅精簡(jiǎn)了漢字的字?jǐn)?shù),使?jié)h字系統(tǒng)向規(guī)范化方向邁出前進(jìn)的一步,而且有效遏制了漢字使用中的字體混亂現(xiàn)象。1986年6月,國(guó)務(wù)院批轉(zhuǎn)國(guó)家語(yǔ)言文字工作委員會(huì)《關(guān)于廢止〈第二批漢字簡(jiǎn)化方案(草案)〉和糾正社會(huì)用字混亂現(xiàn)象的請(qǐng)示》。1998年12月,商務(wù)印書(shū)館辭書(shū)研究中心編纂并出版《古代漢語(yǔ)詞典》。2013年6月,國(guó)務(wù)院公布《通用規(guī)范漢字表》。2021年10月,國(guó)家市場(chǎng)監(jiān)督管理總局、國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)聯(lián)合發(fā)布了《古籍印刷通用字規(guī)范字形表》,此標(biāo)準(zhǔn)雖不盡善盡美,如“音韻”的“韻”字只收異體的“韻”而不收正體的“韻”,但仍可作為最權(quán)威的規(guī)范字表參考。
上述文件的發(fā)布為編輯人員處理古籍異體字提供了重要指導(dǎo)。在實(shí)踐中,編輯人員應(yīng)當(dāng)嚴(yán)格遵循文字規(guī)范,使用規(guī)范漢字,不能隨意使用被簡(jiǎn)化了的繁體字和被淘汰了的異體字,也不能使用不規(guī)范的簡(jiǎn)化字,保證古籍編輯的準(zhǔn)確性與合理性。首先,編輯人員在編輯和處理古籍異體字時(shí),可以參考古人的訓(xùn)詁作品,如集注、集解等。古代學(xué)者在解讀古籍時(shí),通常會(huì)對(duì)其中的字詞進(jìn)行注解和訓(xùn)詁。其中,注解主要指對(duì)詞語(yǔ)的注釋?zhuān)ㄆ湓狻⒁炅x以及在特定語(yǔ)境中的含義;而訓(xùn)詁則更深入,是對(duì)字義、字音、字形的考證和解析,力求揭示出字詞的原始意義和演變過(guò)程。注解和訓(xùn)詁都是寶貴的學(xué)術(shù)遺產(chǎn),為后人理解和研究古籍提供了重要的線索和依據(jù)。編輯人員在面對(duì)異體字時(shí),可以參考這些注解和訓(xùn)詁,通過(guò)比較、分析,確定其準(zhǔn)確的讀音和意義,從而保證古籍內(nèi)容的準(zhǔn)確性,使古籍能更好地被現(xiàn)代讀者理解和接納。其次,編輯人員可以借鑒現(xiàn)代學(xué)術(shù)研究成果處理古籍中的異體字。同時(shí),還要考慮到現(xiàn)代讀者的接受度,對(duì)于過(guò)于復(fù)雜或難以辨識(shí)的異體字,可以適當(dāng)提供注釋或者轉(zhuǎn)換為通行的簡(jiǎn)化字,但必須在不影響原文整體結(jié)構(gòu)和意義的前提下進(jìn)行。這樣的處理方式既能滿足學(xué)術(shù)研究的需求,也能讓更多讀者能夠理解和欣賞古籍。
結(jié)合古籍上下文,正確辨識(shí)古籍異體字
在古籍編輯過(guò)程中,正確理解和處理異體字對(duì)于保持原文風(fēng)貌和傳達(dá)準(zhǔn)確的信息至關(guān)重要。由于不同的異體字在不同的語(yǔ)境中擁有不同的涵義,因此,編輯人員在處理古籍異體字時(shí),應(yīng)結(jié)合古籍上下文,合理規(guī)范地辨識(shí)異體字,保證異體字辨識(shí)的精準(zhǔn)性。
第一,編輯人員需要具備一定的歷史和語(yǔ)言文字知識(shí),了解異體字產(chǎn)生的背景和演變規(guī)律。首先,編輯人員必須了解異體字產(chǎn)生的背景和演變規(guī)律。在古代,由于書(shū)寫(xiě)材料(甲骨文、金文、石刻等)的限制,同一個(gè)字可能會(huì)依據(jù)書(shū)寫(xiě)材質(zhì)的不同有不同的形態(tài)。與此同時(shí),地區(qū)方言的影響也導(dǎo)致了異體字的產(chǎn)生,同一個(gè)字在不同方言中可能有不同的讀音和書(shū)寫(xiě)形式,如“于”和“於”,雖然在意義上沒(méi)有任何區(qū)別,但不同的先秦著作中使用偏好不同,極有可能是受到方言的影響。編輯人員只有了解這些差異,才能夠更好地理解和處理異體字。其次,編輯人員需要熟悉古籍中的異體字。在古籍中,異體字的使用十分普遍。編輯人員需要通過(guò)學(xué)習(xí)和研究,掌握這些異體字的含義和使用場(chǎng)合。這樣,在編輯過(guò)程中,才能準(zhǔn)確地判斷和處理異體字,確保古籍的準(zhǔn)確性和可讀性。最后,編輯人員還需要注重異體字的規(guī)范使用。雖然異體字在一定程度上體現(xiàn)了語(yǔ)言文字的多樣性,但在現(xiàn)代漢語(yǔ)中,為了統(tǒng)一和規(guī)范語(yǔ)言文字,國(guó)家對(duì)一些異體字進(jìn)行了規(guī)范和淘汰。編輯人員在處理古籍時(shí),需要在尊重歷史和文化的前提下,根據(jù)現(xiàn)代漢語(yǔ)規(guī)范,做出適當(dāng)?shù)卣{(diào)整與優(yōu)化。
第二,編輯人員需要結(jié)合古籍上下文,準(zhǔn)確辨識(shí)異體字。古籍中的異體字通常與其所處的時(shí)代背景、作者習(xí)慣、地域特色等因素密切相關(guān)。有些字在某個(gè)朝代或地區(qū)較為常見(jiàn),而在其他地方則較少出現(xiàn)。因此,編輯人員在處理古籍異體字時(shí),要認(rèn)真細(xì)致地研讀古籍資料,真正理解前后文的涵義,基于此推測(cè)出作者可能使用的字形及異體字的涵義。同時(shí),編輯人員還需注意詞組搭配和句子結(jié)構(gòu)。古人寫(xiě)作時(shí)遵循的語(yǔ)法規(guī)則與現(xiàn)代漢語(yǔ)有所不同,他們遣詞造句的方式體現(xiàn)了當(dāng)時(shí)社會(huì)的語(yǔ)言習(xí)慣。因此,編輯人員需要學(xué)會(huì)根據(jù)字義、詞義、語(yǔ)法結(jié)構(gòu)等線索確定異體字的正確形式與字形涵義,實(shí)現(xiàn)對(duì)異體字的有效規(guī)范和調(diào)整。以“明”字為例,根據(jù)文言版《説文解字》,“朙,照也。從月,從囧。凡朙之屬皆從朙”,按照白話版《說(shuō)文解字》,“朙,月光透過(guò)窗戶照亮房間”,字形由“月、囧”會(huì)義,所有與“朙”有關(guān)的字,都采用“朙”作偏旁。“朙”即為“明”的異體字,編輯人員在辨識(shí)異體字“朙”時(shí),需要聯(lián)系上下文判斷“朙”的涵義是指“光明”還是“光亮”,基于此需對(duì)異體字“朙”進(jìn)行規(guī)范和注釋。
科技與人工結(jié)合,提高異體字編輯質(zhì)效
隨著信息技術(shù)的快速發(fā)展,人工智能在古籍異體字處理方面得到了大力應(yīng)用,并且取得了顯著成果。然而,由于古籍的特殊性,單純依靠人工智能是不可靠的,還需要加強(qiáng)人工審核。因此,在異體字的編輯與處理中,編輯人員應(yīng)堅(jiān)持“科技與人工相結(jié)合”的理念,構(gòu)建由信息技術(shù)自動(dòng)識(shí)別與人工嚴(yán)謹(jǐn)審核共同構(gòu)成的異體字編輯和處理體系,促進(jìn)古籍異體字的編輯效率與質(zhì)量的全面提升。
第一,合理應(yīng)用前沿技術(shù)識(shí)別和分析異體字。在數(shù)字化時(shí)代,編輯人員應(yīng)打破傳統(tǒng)編輯與處理異體字的思維定式,嘗試?yán)孟冗M(jìn)技術(shù)識(shí)別古籍異體字。首先,利用數(shù)字掃描、文字識(shí)別、圖像處理、OCR等技術(shù)將古籍文獻(xiàn)轉(zhuǎn)化為數(shù)字化格式,并構(gòu)建專(zhuān)門(mén)的古籍文獻(xiàn)數(shù)字庫(kù),便于存儲(chǔ)、檢索和分析。其次,利用自然語(yǔ)言處理技術(shù)對(duì)古籍文本進(jìn)行預(yù)處理,去除無(wú)關(guān)信息,提取出異體字并進(jìn)行分類(lèi)。同時(shí),通過(guò)規(guī)則匹配或統(tǒng)計(jì)方法自動(dòng)替換或校對(duì)古籍中的異體字,提高文本的準(zhǔn)確性和可讀性。再次,通過(guò)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)模型自動(dòng)識(shí)別和替換異體字,即通過(guò)大量的標(biāo)注數(shù)據(jù),訓(xùn)練出具有較高準(zhǔn)確性的異體字識(shí)別模型。同時(shí),通過(guò)深度學(xué)習(xí)技術(shù)提取古籍的復(fù)雜特征,理解古籍中復(fù)雜的語(yǔ)境,提高異體字的正確解析率。最后,引入大數(shù)據(jù)技術(shù),這是一種利用計(jì)算機(jī)對(duì)大規(guī)模數(shù)據(jù)進(jìn)行處理和分析的技術(shù)。在古籍異體字處理中,可以利用大數(shù)據(jù)技術(shù)對(duì)大量的古籍文獻(xiàn)進(jìn)行統(tǒng)計(jì)分析,挖掘異體字的使用規(guī)律和特點(diǎn),為編輯人員理解古代文字演變、文化變遷提供重要依據(jù)。同時(shí),可以利用大數(shù)據(jù)技術(shù)構(gòu)建異體字知識(shí)圖譜,直觀清晰地組織和呈現(xiàn)異體字統(tǒng)計(jì)信息,為編輯人員整理古籍提供便利。
第二,加強(qiáng)人工審核。雖然現(xiàn)代技術(shù)手段在異體字處理方面具有顯著優(yōu)勢(shì),但人工審核仍不可替代。因?yàn)楫愺w字的識(shí)別和處理涉及到語(yǔ)言學(xué)、文學(xué)、歷史等多個(gè)領(lǐng)域,現(xiàn)代技術(shù)手段可能無(wú)法全面準(zhǔn)確地判斷異體字的適用場(chǎng)景。此外,一些技術(shù)手段還存在誤判或遺漏的可能性。因此,需要人工審核進(jìn)行核實(shí)和糾正。首先,編輯人員需要對(duì)機(jī)器處理后的文本進(jìn)行雙重檢查。OCR等相關(guān)技術(shù)可能會(huì)因字體、清晰度等因素產(chǎn)生誤識(shí)。例如,將“之”誤讀為“矢”,或者將難以辨認(rèn)的異體字、繁體字“擅作主張”地轉(zhuǎn)化為簡(jiǎn)體字。因此,編輯人員需仔細(xì)核對(duì),確保詞句的正確性,必要時(shí)還需查閱相關(guān)字典或參考古籍原版。其次,加強(qiáng)對(duì)語(yǔ)法和語(yǔ)義內(nèi)容的審校,科技雖能識(shí)別文字,但理解文意的能力還主要依靠人類(lèi)。編輯人員需關(guān)注句子結(jié)構(gòu)是否通順、意思是否準(zhǔn)確,避免因字形變化導(dǎo)致語(yǔ)義混淆。在審核和修正過(guò)程中,編輯人員應(yīng)注意保持古籍的原貌。古籍中的生僻字、異體字通常承載著時(shí)代特色,刻意將其規(guī)范化可能會(huì)喪失其獨(dú)特魅力。因此,編輯人員應(yīng)在尊重歷史原貌的前提下,進(jìn)行適度修正。
解讀古籍并非單純的文字翻譯,而是需要對(duì)歷史文化有深入的理解。在編輯與處理古籍異體字的過(guò)程中,編輯人員應(yīng)結(jié)合上下文和語(yǔ)言環(huán)境,對(duì)生僻字、異體字進(jìn)行精準(zhǔn)合理地解讀,以真正把握并表達(dá)其精髓,促進(jìn)現(xiàn)代讀者更好地閱讀和理解古籍的涵義。因此,古籍整理出版不僅是文字的再現(xiàn),更是對(duì)文化的傳承。編輯人員在處理古籍異體字時(shí),需在尊重古籍原貌的基礎(chǔ)上充分考慮現(xiàn)代讀者的閱讀習(xí)慣,采取合適的方法處理異體字,以便現(xiàn)代讀者能夠更深入地理解和欣賞古籍的魅力以及古人的智慧與才情。