詞典編纂正在經(jīng)歷“身份危機(jī)”。挑戰(zhàn)來(lái)自3個(gè)方面:其一,新技術(shù)的不斷涌現(xiàn)及應(yīng)用正對(duì)詞典編纂的幾乎每個(gè)方面都產(chǎn)生重要影響。其二,詞典出版的商業(yè)模式逐漸落伍。得益于印刷技術(shù)而發(fā)展起來(lái)的傳統(tǒng)詞典資助出版模式,已不能適應(yīng)數(shù)字時(shí)代的新發(fā)展,作為文化實(shí)踐的詞典編纂正在面臨嚴(yán)峻挑戰(zhàn)。其三,來(lái)自其他類型信息源(如搜索引擎、機(jī)器翻譯程序及應(yīng)用)的競(jìng)爭(zhēng)不斷增加。我們或許可以把這些競(jìng)爭(zhēng)解讀為數(shù)字時(shí)代背景下用戶對(duì)紙質(zhì)詞典質(zhì)量、關(guān)聯(lián)性與可及性的無(wú)聲批評(píng)。詞典編纂亟須“革新”,以避免陷入更深的危機(jī)。“革新”一詞,不僅僅意味著方法與技術(shù)的提升,更是指對(duì)整個(gè)領(lǐng)域的全新變革。從技術(shù)賦能詞典編纂的角度而言,“技術(shù)革新”之于詞典編纂,不僅意味著采用新方法和新技術(shù)改進(jìn)編纂過(guò)程,也意味著以更新穎、更友好的方式向目標(biāo)用戶呈現(xiàn)詞典,還意味著研發(fā)全新的詞典產(chǎn)品。基于我所參與的數(shù)字詞典項(xiàng)目,下面從“理念”“實(shí)踐”與“反思”3 個(gè)方面與中國(guó)同行分享我的認(rèn)識(shí)。
首先,就理念而言,何為“詞典編纂現(xiàn)代化”?我認(rèn)為,它意味著編者的精力應(yīng)從專注編纂詞典轉(zhuǎn)向致力于建設(shè)和應(yīng)用詞典數(shù)據(jù)庫(kù)。換言之,詞典編者生產(chǎn)的首要產(chǎn)品不應(yīng)再是詞典文本,而是存儲(chǔ)在數(shù)據(jù)庫(kù)里的詞典數(shù)據(jù)。這些數(shù)據(jù)既可以紙質(zhì)辭書的形式呈現(xiàn)給用戶,也可嵌入到數(shù)字化學(xué)習(xí)工具中(如“電子閱讀器”“寫作助手”和“翻譯軟件”等)。這就要求用于詞典編纂的語(yǔ)言數(shù)據(jù)的儲(chǔ)存、組織與呈現(xiàn)方式要擺脫傳統(tǒng)的框架窠臼,利用應(yīng)用程序編程接口(API),實(shí)現(xiàn)“一個(gè)數(shù)據(jù)庫(kù),多款數(shù)字工具”(one database,various tools)的編纂意圖。以寫作(包括母語(yǔ)寫作和二語(yǔ)習(xí)作)為例,一方面,越來(lái)越多的人在電子設(shè)備上寫作;另一方面,語(yǔ)言濫用與污染隨處可見。紙質(zhì)詞典已不受青睞,被動(dòng)查檢型的寫作工具也無(wú)法提供切實(shí)幫助。面對(duì)這種現(xiàn)實(shí),詞典編纂能夠提供什么幫助?我認(rèn)為,可嵌入式“寫作助手”的研發(fā)值得關(guān)注,它能讓寫作工具變成主動(dòng)提供語(yǔ)言服務(wù)的產(chǎn)品,能在與用戶的互動(dòng)中提供即時(shí)的語(yǔ)言使用指導(dǎo)。
接下來(lái),以我參與的一個(gè)數(shù)字詞典實(shí)踐項(xiàng)目(西班牙語(yǔ)版“寫作助手”)為例,分享一下我的實(shí)踐經(jīng)驗(yàn)。去年,我有幸到丹麥著名的數(shù)字詞典公司Ordbogen 工作兩個(gè)月,該公司專注于語(yǔ)言服務(wù)、數(shù)字化教學(xué)材料、在線詞典和寫作助手的研發(fā),做了很多有益的探索。我受邀參加“寫作助手”研發(fā)團(tuán)隊(duì),該團(tuán)隊(duì)匯集了來(lái)自信息科學(xué)、詞典學(xué)等多個(gè)學(xué)科的專家,共同探索如何應(yīng)用人工智能驅(qū)動(dòng)的語(yǔ)言模型GECToR(Grammatical Error Correction: Tag, Not Rewrite)來(lái)研發(fā)服務(wù)于寫作需求的數(shù)字新產(chǎn)品,該項(xiàng)目仍在進(jìn)行中。這一模型利用神經(jīng)網(wǎng)絡(luò)開發(fā)而成,已實(shí)現(xiàn)對(duì)英語(yǔ)語(yǔ)料的訓(xùn)練,而且在網(wǎng)絡(luò)上可免費(fèi)獲取。作為詞典學(xué)家,我主要參與了語(yǔ)料訓(xùn)練、功能設(shè)計(jì)和用戶互動(dòng)3 個(gè)方面的工作。
其一,GECToR 的語(yǔ)料訓(xùn)練工作分為4 個(gè)階段,包括:(1)西班牙語(yǔ)語(yǔ)料訓(xùn)練(已完成);(2)添加源自詞典數(shù)據(jù)庫(kù)的合成數(shù)據(jù)(已完成);(3)添加半合成數(shù)據(jù)(進(jìn)行中);(4)添加自然語(yǔ)言數(shù)據(jù)(尚未開始)。我的主要任務(wù)是幫助提升產(chǎn)品的用戶友好度,具體工作包括:(1)用西班牙語(yǔ)撰寫“文本片段”闡釋問(wèn)題、給出建議;(2)撰寫“附加文本”,提示詞匯、語(yǔ)法、文體等知識(shí);(3)將西班牙語(yǔ)對(duì)譯為英語(yǔ)、丹麥語(yǔ)、意大利語(yǔ)和漢語(yǔ)。
其二,基于對(duì)歐美國(guó)家已上市的“寫作助手”(如Grammarly、LanguageTool、ProWritingAid 等)的調(diào)研和思考,我將“寫作助手”的功能設(shè)計(jì)歸納為6 個(gè)方面:(1)識(shí)別功能,即發(fā)現(xiàn)寫作中可能遇到的問(wèn)題;(2)糾錯(cuò)功能,即為用戶提供替代選項(xiàng);(3)預(yù)測(cè)功能,包括補(bǔ)全詞語(yǔ)拼寫形式、預(yù)測(cè)寫作中接下來(lái)可能出現(xiàn)的詞語(yǔ);(4)轉(zhuǎn)化功能,即優(yōu)化句法、調(diào)整文體等;(5)翻譯功能,即提供譯語(yǔ)對(duì)應(yīng)詞;(6)查檢功能,即提供詞典數(shù)據(jù)庫(kù)檢索接口。我們正在研發(fā)的“寫作助手”(西班牙語(yǔ)版)已經(jīng)實(shí)現(xiàn)了上述“預(yù)測(cè)”“翻譯”與“查檢”等功能,其他3 個(gè)功能的開發(fā)也在推進(jìn)中。為了實(shí)現(xiàn)上述功能,詞典學(xué)思維很重要:一方面,詞典數(shù)據(jù)庫(kù)內(nèi)元數(shù)據(jù)的結(jié)構(gòu)與形式必須要適應(yīng)“寫作助手”對(duì)數(shù)據(jù)提取與融合的需求;另一方面,詞典釋義要實(shí)現(xiàn)充分的結(jié)構(gòu)化處理。
其三,通過(guò)現(xiàn)有“寫作助手”的使用體驗(yàn)與對(duì)比分析,我把它們體現(xiàn)出的交際性歸納為5 個(gè)層級(jí):(1)自動(dòng)糾錯(cuò),不顧及用戶接受與否;(2)無(wú)解釋的建議;(3)附簡(jiǎn)單解釋的建議;(4)附增補(bǔ)解釋的建議;(5)擴(kuò)充解釋。我把前兩個(gè)層級(jí)的互動(dòng)稱為“非友好交際”,中間兩個(gè)層級(jí)的互動(dòng)稱為“友好交際”,最后一個(gè)層級(jí)的交際則屬于面向用戶深度學(xué)習(xí)的層級(jí)。此外,對(duì)于正在研發(fā)的“寫作助手”(西班牙語(yǔ)版),我們計(jì)劃通過(guò)更多測(cè)試來(lái)驗(yàn)證、優(yōu)化文本數(shù)據(jù)呈現(xiàn)方式的用戶交際友好性。
最后,我想談一下對(duì)數(shù)字辭書發(fā)展前景的看法。一方面,我們需要重新思考“詞典編纂”的角色轉(zhuǎn)變:(1)提供合成的詞典數(shù)據(jù);(2)訓(xùn)練語(yǔ)言模型;(3)提供后臺(tái)詞典數(shù)據(jù)查檢;(4)與用戶互動(dòng)。另一方面,我們也要重新思考“詞典編者”的角色轉(zhuǎn)變:(1)參與語(yǔ)言模型訓(xùn)練;(2)建設(shè)“詞典數(shù)據(jù)庫(kù)”;(3)開發(fā)“交際數(shù)據(jù)庫(kù)”,提供短文本,為用戶提供更多語(yǔ)言使用建議。這里,我想特別說(shuō)明一下“詞典數(shù)據(jù)庫(kù)”與“交際數(shù)據(jù)庫(kù)”的區(qū)別:前者是基于詞條的數(shù)據(jù)庫(kù),可用于提供詞典元數(shù)據(jù)資源;后者是基于問(wèn)題的數(shù)據(jù)庫(kù),可用于提供場(chǎng)景化語(yǔ)言服務(wù)。此外,人工智能技術(shù)為詞典編纂理念與技術(shù)革新所產(chǎn)生的影響已然顯現(xiàn),但是,目前人工智能用于開發(fā)“類詞典”語(yǔ)言工具也非無(wú)所不能。比如,它需要沒有歧義的數(shù)據(jù),才能提升語(yǔ)言服務(wù)效能。詞典編者需要與時(shí)俱進(jìn),付出跨學(xué)科合作實(shí)際行動(dòng),這是詞典學(xué)創(chuàng)新發(fā)展的必然路徑。