辭書出現(xiàn)在文字產(chǎn)生之后、書面知識有一定積累的時期,如中國最早的辭書《爾雅》《方言》《說文解字》產(chǎn)生在戰(zhàn)國末年與兩漢時期,那時已經(jīng)有了《周易》《尚書》《詩經(jīng)》《周禮》《儀禮》《禮記》《春秋左傳》《春秋公羊傳》《春秋穀梁傳》《孝經(jīng)》《論語》《孟子》等重要經(jīng)書。再如印度的《阿摩羅辭典》,成書約在公元550—750年之間;阿拉伯最早的詞典《埃因書》,編纂于公元760年;據(jù)傳歐洲在2世紀已有字書學(xué)者,中世紀已有拉丁文詞典,但今日可見的最早辭書是意大利佛羅倫薩學(xué)士院的《詞集》(1612)法蘭西學(xué)士院的《法語詞典》(1694)等。辭書的基本功能就是知識的整合與供給,并在整合與供給中進行知識再生產(chǎn),這需要社會有一定的書面知識積累。辭書是書籍的一個類別,在印刷術(shù)出現(xiàn)后得到快速發(fā)展,形成了辭書的平面媒體形態(tài)。
從莫爾斯1837年發(fā)明電報機,到1928年美國廣播組織播出第一套電視片《Felix theCat》,在90多年的時間里,人類發(fā)明了電報、傳真、電話、留聲機、電影、錄音機、廣播、電視等,開啟了利用電波傳遞信息的電信時代,標志著人類語言擁有了聲、光、電三種物質(zhì)媒介。面向機器的“電子詞典”的概念,在自然語言處理、機器翻譯興起的20世紀40年代末就已經(jīng)提出,但是面向人的辭書,直到20世紀80年代才出現(xiàn)電子形態(tài),如文曲星、諾亞舟、好易通等產(chǎn)品。伴隨著信息技術(shù)、網(wǎng)絡(luò)媒體的發(fā)展,電子形態(tài)的辭書由芯片辭書、光盤辭書發(fā)展到網(wǎng)絡(luò)辭書、辭書App等,形成了一個電子辭書家族。現(xiàn)在,電子辭書逐漸呈現(xiàn)融媒體特點,向融媒辭書的方向發(fā)展。
何謂“融媒辭書”?章宜華教授的新著《融媒詞典學(xué):理論與實踐》便是回答這一問題的專著。這部得風(fēng)氣之先的著作,何以能出自他手?因為他是融媒辭書學(xué)的積極研究者,又是融媒辭書事業(yè)的積極推進者。宜華教授發(fā)起建立了廣東外語外貿(mào)大學(xué)詞典學(xué)研究中心,撰寫了《計算詞典學(xué)與新型詞典》(上海辭書出版社,2004)和《計算詞典學(xué)》(上海辭書出版社,2013),發(fā)表了一系列的融媒辭書研究論文,是我國融媒辭書學(xué)研究的頂流學(xué)者。他連任三屆中國辭書學(xué)會副會長(2007一2023年),長期兼任中國辭書學(xué)會學(xué)術(shù)委員會主任、雙語詞典專業(yè)委員會主任和《中國辭書學(xué)報》主編。在這些重要的學(xué)術(shù)領(lǐng)導(dǎo)崗位上,他積極引導(dǎo)學(xué)界研究融媒辭書,積極支持業(yè)界開發(fā)融媒辭書,一直站在融媒辭書發(fā)展的第一線。
我十分有幸能夠成為這部著作出版前的讀者。宜華教授的不少文章我讀過,不少報告我聽過,對他的學(xué)術(shù)觀點有所了解。這次有緣進行“整本書閱讀”,而且是紙本閱讀,理解更全面,體會更深刻。體會最深者有如下幾個方面。
一、 融媒辭書的理論奠基
辭書電子化的進程,一直是由技術(shù)和產(chǎn)業(yè)帶動,理論研究相對滯后。沒有理論指導(dǎo)的電子辭書的發(fā)展,必然會出現(xiàn)許多不如人意之處。例如,許多電子辭書,只是不同形式的詞匯重組和紙質(zhì)辭書的電子化復(fù)刻;許多人只把技術(shù)看作電子辭書發(fā)展的一種工具或手段,甚至只把融媒辭書看作多媒體元素的簡單疊加,未能觸及多模態(tài)認知的協(xié)同融合機制。
宜華教授長期關(guān)注電子辭書的發(fā)展,在對國內(nèi)外各種類型的電子辭書深人研究的基礎(chǔ)上,在尋求電子辭書發(fā)展問題的解決對策時,一直在進行理論的思考與構(gòu)建。在本書中,他提出了“模態(tài)層級理論”和“模態(tài)融合理論”,構(gòu)擬了“動態(tài)語義網(wǎng)絡(luò)框架”,進行了“靜態(tài)融合與動態(tài)融合”的區(qū)分等。這些理論學(xué)說,系統(tǒng)闡釋了多模態(tài)符號協(xié)同釋義的重要性,提出了依照模態(tài)認知權(quán)重進行多模態(tài)的協(xié)調(diào)和融合,破解了跨模態(tài)表征失序的難題;本書對大語言模型多模態(tài)對齊算法的深度解析,則揭示了語義網(wǎng)絡(luò)立體化重構(gòu)的技術(shù)邏輯。這種“認知機制建模-技術(shù)路徑驗證”的雙向閉環(huán)及相關(guān)理論,為融媒辭書的發(fā)展奠定了堅實的元理論基石。
理論之于實踐是相互適應(yīng)、相互推動的關(guān)系,具體來說有兩種表現(xiàn)方式:其一是實踐先行,之后構(gòu)建理論,對實踐做出解釋;對實踐具有解釋力的理論,反過來又對實踐發(fā)揮指導(dǎo)作用。其二是理論先行,預(yù)見性的理論指導(dǎo)著實踐的發(fā)展;在指導(dǎo)實踐的過程中,理論也會做出適當(dāng)調(diào)整,以適應(yīng)豐富多彩、充滿活力的實踐。宜華教授提出的這些理論,是在電子辭書的實踐基礎(chǔ)上產(chǎn)生的,至于其是否很好地解釋了實踐,還需要接受實踐的檢驗。而且電子辭書的實踐也會如電一般地活躍和迅捷發(fā)展,理論在接受實踐的檢驗和指導(dǎo)實踐的過程中,也需要敏捷地適應(yīng)、調(diào)整和發(fā)展。
二、辭書編纂的技術(shù)助力
宜華教授用較大氣力繪制了融媒辭書學(xué)的“技術(shù)-認知基因圖譜”。第四章系統(tǒng)論述融媒辭書的多模態(tài)符號學(xué);第五章揭示大語言模型的“多模態(tài)微調(diào)策略”;第七章提出“五層融合機制”;第八章詳細描述融媒辭書的“多模態(tài)表征元素”,相關(guān)內(nèi)容可以直接應(yīng)用于大語言模型的“優(yōu)化學(xué)習(xí)訓(xùn)練”;第九章系統(tǒng)闡釋“融媒模態(tài)詞典綜合數(shù)字處理平臺”的各種功能模塊;第十、十一兩章,提出了“融媒-多模態(tài)”辭書的具體設(shè)計原則、釋義的理想模式、范疇化釋義模版,以及基于大語言模型的多模態(tài)信息提取、自動對齊和交互融合的實踐方法等。
關(guān)于融媒辭書這種“跨界融合”的理論與技術(shù),涉及多個學(xué)科,但并非學(xué)科的簡單拼貼,而是以辭書學(xué)為樞紐,貫通語言學(xué)、人工智能、認知科學(xué)的知識再生產(chǎn)。其中最為重要的,我認為是重構(gòu)了辭書編纂的方法論。書中提出的“多模態(tài)知識蒸餾技術(shù)”,依托大語言模型的跨模態(tài)映射能力,使辭書編纂效率大為躍升;特別是通過“語義網(wǎng)絡(luò)—文化語境—語用規(guī)則”的融合,解決了傳統(tǒng)線性釋義的局限性。當(dāng)大語言模型的數(shù)據(jù)積累和智能水平達到一定程度時,就可以利用大語言模型即時生成辭書。而辭書工作者的主要任務(wù),就會放在研制辭書釋義模版、制定編纂的規(guī)則和范式、制作相關(guān)輔助軟件等方面,有望把辭書工作者從繁重的具體文字處理中解脫出來。這種情況改變了辭書編纂的方法和流程,也將影響到辭書的表現(xiàn)形態(tài)。
三、辭書功能的認知升維
本書在辭書功能的認知上,也有重大的學(xué)術(shù)突破。
第一,重新定義辭書的功能。傳統(tǒng)上,辭書被看作以條目呈現(xiàn)的“靜態(tài)知識庫”,而本書提出了“媒體融合一模態(tài)協(xié)同一用戶中心”的三維模型,將辭書功能重新建構(gòu)為動態(tài)的認知交互,將“學(xué)習(xí)詞典編纂”視為“課堂教學(xué)設(shè)計過程”,實現(xiàn)了辭書由信息容器到交互生態(tài)的范式轉(zhuǎn)換。
第二,重塑教學(xué)價值鏈。第四章對視覺理論的闡述和第十二章對“認知閾值效應(yīng)”的展示,說明當(dāng)多模態(tài)表征協(xié)同刺激讀者的感官通道時,知識遷移效率會呈現(xiàn)指數(shù)級增長,這為智能教育提供了可以復(fù)用的認知增強模型。
第三,強調(diào)用戶中心觀。辭書編纂者和出版者是知識的供給方,辭書用戶是知識的需求方。供給方應(yīng)當(dāng)滿足需求方的需求,提供需求方所需要的內(nèi)容,充分照顧需求方獲取知識的習(xí)慣及途徑。供給方在較好滿足需求方的需求中,體現(xiàn)自己的價值,實現(xiàn)自己的利益。
在數(shù)字時代,辭書不僅由紙質(zhì)形態(tài)發(fā)展為電子形態(tài)(特別是發(fā)展為多模態(tài)、多數(shù)據(jù)庫融合而成的融媒辭書),其功能、價值也在發(fā)生變化。如由靜態(tài)知識庫發(fā)展為辭書編纂者與用戶認知的動態(tài)交互,由文字單模態(tài)發(fā)展為多模態(tài)而大大提升了知識遷移效率,由辭書編纂者自己的知識生產(chǎn)活動發(fā)展為以用戶為中心的知識服務(wù)等。
最后特別需要提出的是,人類已經(jīng)進人了以大語言模型為代表的數(shù)智時代。2022年11月30日ChatGPT上線,之后Sora、GPT-4o 接踵問世。最近,中國也掀起了“百模大戰(zhàn)”,DeepSeek大語言模型幫人和詩、寫詩、賞詩、集句或發(fā)表銳評文章,水平遠超凡人。2024 年諾貝爾物理學(xué)獎授予約翰·霍普菲爾德(JohnJ.Hopfield)和杰弗里·辛頓(Geoffrey E.Hinton),諾貝爾化學(xué)獎授予大衛(wèi)·貝克(David Baker)戴密斯·哈薩比斯(Demis Hassabis)和約翰·江珀(John M.Jumper)。這兩項諾貝爾獎都與人工智能有關(guān),這不僅是對這兩項成果的認定,更是對人工智能發(fā)展前景的認可。順著宜華教授這部著作的展望,還應(yīng)該再思考這樣一個問題:大語言模型已經(jīng)閱讀了網(wǎng)絡(luò)上人類的絕大部分數(shù)據(jù),占有了人類的大部分知識,可謂“無所不知”,數(shù)智時代還需要辭書嗎?
就目前的大語言模型來看,它雖然“無所不知”,但也常“信口雌黃”,甚至出現(xiàn)“幻覺”。辭書是人類知識的基本集合,可以幫助人們對大語言模型的說法進行校驗,特別是甄別其“幻覺”言論。辭書也是最為優(yōu)質(zhì)的數(shù)據(jù),機用電子辭書已走過了半個多世紀的歷程。雖說大語言模型目前主要還是“數(shù)據(jù)驅(qū)動”,但如果算法進階,可以更多地利用人類發(fā)現(xiàn)的科學(xué)規(guī)則,可以“讀懂”辭書,那么也可以大大減弱其“幻覺”,減少其“信口雌黃”的語言行為。如此,辭書就會在原有的知識整理、知識供給和知識生產(chǎn)的基礎(chǔ)上,再發(fā)展出“知識校驗”的功能。大語言模型當(dāng)前的最大問題,是其提供知識的“不確定性”,而辭書則是克服其不確定性的重要知識產(chǎn)品,是數(shù)智時代人類的“知識底盤”。
數(shù)智時代仍需要辭書,但辭書的編纂、應(yīng)用和形態(tài)會不斷發(fā)展變化。最為可能的發(fā)展方向是不斷的“智能化”,亦即編纂的智能化、應(yīng)用的智能化。辭書很可能常以“隱身跟隨”的方式來滿足用戶需求,當(dāng)用戶需要查檢辭書時,它就會隨時出現(xiàn)在用戶的眼前耳畔,以用戶需要的方式提供知識服務(wù)。現(xiàn)在,我們在網(wǎng)上閱讀時,點擊所要檢索的詞語,馬上就會出現(xiàn)相關(guān)的解釋或翻譯。這可能就是未來辭書的雛形,可以稱為辭書的“智能形態(tài)”。當(dāng)然,辭書是迭代發(fā)展的,各種形態(tài)的紙質(zhì)辭書和電子辭書也會共時而存,在不同場景中發(fā)揮各自的作用。
這些感受是我個人的、初步的,不一定合適、全面且有代表性。但一部著作能讓讀者愿意讀、有所獲,就是成功。我以為,章宜華教授的《融媒詞典學(xué):理論與實踐》便是這樣一部讓人愿意讀、讀后有所獲的著作!當(dāng)然,我也希望在辭書智能化的發(fā)展中,讀到宜華教授的更多佳作。
(北京語言大學(xué)語言科學(xué)院 北京 100083)(責(zé)任編輯 郎晶晶)
《融媒詞典學(xué)》即將出版
《融媒詞典學(xué)》,章宜華著,即將于2026年出版。該書系統(tǒng)構(gòu)建了融媒詞典多模態(tài)釋義的理想認知模式和編纂實踐的路徑及方法,涉及理論框架、技術(shù)支撐與教學(xué)應(yīng)用三個層面。理論層面,基于符號學(xué)、認知科學(xué)與教育學(xué)構(gòu)建融媒詞典學(xué)理論框架,提出“媒體融合一模態(tài)協(xié)同一用戶中心”的核心范式,搭建“認知模式一釋義模板一語義網(wǎng)絡(luò)”三層結(jié)構(gòu)的釋義模型:以認知意象為基礎(chǔ),通過多模態(tài)符號語法和知識可視化等實現(xiàn)詞匯意義的立體呈現(xiàn);并針對不同詞匯范疇,根據(jù)“五層融合機制”進行多模態(tài)交互融合,確保釋義模態(tài)的協(xié)同互補和釋義的科學(xué)性。技術(shù)層面,基于“感官整合一大腦融合一技術(shù)賦能”多模態(tài)認知路徑,引人大語言模型為信息獲取引擎,運用多模態(tài)處理、知識蒸餾與跨模態(tài)映射動態(tài)校準權(quán)重,為生成情境化釋義提供算法支撐;在此基礎(chǔ)上,構(gòu)建集智能采集、自動編纂、定制輸出于一體的融媒數(shù)據(jù)平臺與多模態(tài)詞典數(shù)據(jù)庫,形成“數(shù)字平臺一多模態(tài)數(shù)據(jù)一人機互動”三位一體的智能詞典生態(tài)系統(tǒng)。教學(xué)層面,通過詞典平臺與數(shù)字教材的無縫鏈接,踐行“詞典即課堂”的理念,創(chuàng)設(shè)介入式場景,通過詞典釋義的多模態(tài)協(xié)同,深度激活并優(yōu)化用戶的認知加工過程,從而提升用戶的知識遷移效率,培養(yǎng)學(xué)習(xí)者的批判性思維與跨文化理解能力,推動辭書由“靜態(tài)知識庫”轉(zhuǎn)型為“動態(tài)認知伙伴”。