摘 要 本文簡單回顧了我國數(shù)字化辭書的發(fā)展歷程,簡要介紹了數(shù)字化辭書的特點,著重對國內(nèi)數(shù)字化辭書目前存在的問題進(jìn)行了評述,對辭書出版所面臨的數(shù)字化沖擊進(jìn)行了分析。
關(guān)鍵詞 辭書 數(shù)字化 問題 沖擊
當(dāng)下,全球化、信息化浪潮勢不可當(dāng)。從內(nèi)容產(chǎn)業(yè)來看,以互聯(lián)網(wǎng)為代表的數(shù)字技術(shù)正在改變我們生產(chǎn)、生活、消費(包括信息消費)的傳統(tǒng)做法。在辭書領(lǐng)域,這一變化也很明顯。雖然數(shù)字化辭書的基礎(chǔ)依然是辭書(或內(nèi)容)而不是數(shù)字化技術(shù),即“內(nèi)容為體,數(shù)字化為用”,但如果我們在辭書內(nèi)容的提供、加工、更新、傳播等一系列的過程中不研究、不運用數(shù)字化技術(shù),那么,辭書內(nèi)容的生產(chǎn)、傳播必然就會游離于時代潮流之外,處于一種被動的狀態(tài),傳統(tǒng)辭書在教育領(lǐng)域、大眾市場的作用和份額就會降低、弱化,甚至可能會被替代。在無情的市場經(jīng)濟(jì)面前,固守即意味著退縮。因此,在傳統(tǒng)出版與數(shù)字出版的融合已成為現(xiàn)代出版趨勢的背景下,如何避免數(shù)字出版的沖擊,分享數(shù)字出版的成果,應(yīng)該成為我們關(guān)注的焦點之一。
一、我國數(shù)字化辭書的發(fā)展歷程及代表性作品
在我國,數(shù)字化辭書大約出現(xiàn)在20世紀(jì)90年代中期,起初多以軟件的形式出現(xiàn),同時,也出現(xiàn)在手持設(shè)備(如掌上電子詞典、PDA、手機(jī)等)上,并且迄今不衰;90年代中后期光盤版的數(shù)字辭書也盛行一時,但由于遭受盜版等原因,現(xiàn)已式微;2000年以來,隨著互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)版工具書逐漸興起,成為大型數(shù)字化辭書的主要類型。
國內(nèi)數(shù)字化辭書的類型主要有:
網(wǎng)絡(luò)版辭書,這是使用時通過互聯(lián)網(wǎng)來控制數(shù)據(jù)傳送的數(shù)字化辭書。如《漢語大詞典》(網(wǎng)絡(luò)版2.0)、《中國大百科全書》(網(wǎng)絡(luò)版)、《辭海》(網(wǎng)絡(luò)版1.0)等。
軟件版辭書,這是以軟件形式發(fā)行,使用過程中不通過互聯(lián)網(wǎng)傳送數(shù)據(jù)的數(shù)字化辭書,如《漢語大詞典》(光盤版1.0)、《中國大百科全書》(光盤版)、《兒童辭海》(光盤版)、“金山詞霸”等。
手持設(shè)備版辭書,這是各種類型的掌上電子詞典,也包括儲存在手機(jī)等手持設(shè)備中的數(shù)字化辭書。
在上述類型的數(shù)字化辭書中,目前最值得關(guān)注的是一些大型的網(wǎng)絡(luò)版工具書。這主要是因為這些數(shù)字化辭書均出自名門,來自我國著名的工具書出版社,系二次出版,在內(nèi)容的權(quán)威性、釋文的經(jīng)典性、條目的完備性等方面都具一流的水準(zhǔn)。較具代表性的有:《中國大百科全書》(網(wǎng)絡(luò)版);上海世紀(jì)出版集團(tuán)易文網(wǎng)的“工具書在線”,包括《中華文化通志》(網(wǎng)絡(luò)版)、《漢語大詞典》(網(wǎng)絡(luò)版)、《辭海》(網(wǎng)絡(luò)版)、《<中央日報>標(biāo)題索引》等;商務(wù)印書館的“工具書在線”(測試版),包括《新華寫字字典》、《新華正音詞典》、《新華拼寫詞典》和《中華人民共和國地名大詞典》等。
二、數(shù)字化辭書的特點
與傳統(tǒng)的印刷本辭書相比,數(shù)字化辭書主要具有下列特點。
1.更多的檢索、查詢手段
除了與傳統(tǒng)紙質(zhì)工具書一樣的常規(guī)檢索手段(如分類檢索,按拼音、筆畫檢索)外,數(shù)字化工具書還具備其他一些極為有效的檢索、查詢功能,如通配符檢索,邏輯表達(dá)式檢索,全文檢索,還可根據(jù)內(nèi)容制作特殊的檢索方法,如《漢語大詞典》中對漢字作“通假”等關(guān)聯(lián)的檢索,就是一個很典型的例子。
2.支持多媒體
數(shù)字化工具書具備多媒體處理能力,這也是其頗具吸引力的一個方面。在數(shù)字化工具書中,人們除了能夠像使用傳統(tǒng)的紙質(zhì)工具書那樣,得到以文字、圖像為表現(xiàn)形式的信息外,還能得到通過聲音、動畫、視頻等多種媒體元素來表現(xiàn)的信息,而工具書中的許多條目正是需要通過這些媒體元素才能獨特地、完整地、更好地為讀者提供相關(guān)的信息。如重大歷史事件條目,音樂作品條目,物理、化學(xué)、生物條目中的原理演示等內(nèi)容,都不是僅靠文字、圖片就能夠完美表現(xiàn)的。從技術(shù)上講,數(shù)字化辭書對音頻、視頻、動畫等均可支持,但目前我們還很難看到像微軟公司所出《Encarta百科全書》那樣比較理想地支持多媒體表現(xiàn)的大型數(shù)字化辭書。究其原因,筆者認(rèn)為,主要與投入大而產(chǎn)出小有關(guān)。目前國內(nèi)的數(shù)字化辭書大都屬“二次出版”,只對內(nèi)容作技術(shù)上的加工,而很少再花人力、物力去重新制作或采集多媒體資源,因為這項工作投入巨大,但回報并不理想。
3.支持互動,更新快捷方便
大多數(shù)人認(rèn)為,互聯(lián)網(wǎng)是一個大眾媒體,面向的是大眾,但也有少數(shù)專家認(rèn)為互聯(lián)網(wǎng)是一個個性化的媒體,是小眾媒體,更是唯一的互動媒體。筆者認(rèn)為,后者抓住了事物的本質(zhì)特征。與圖書、報紙、廣播、電視相比,互動性是網(wǎng)絡(luò)媒體的鮮明特征。如何利用網(wǎng)絡(luò)媒體的這一特性,讓關(guān)心辭書的大眾貢獻(xiàn)出自己的意見,參與內(nèi)容的提供(實踐證明,在個別條目上,讀者掌握的信息會比專家更多、更正確),以利辭書的更新、修訂,這一問題值得探討。筆者認(rèn)為,利用網(wǎng)絡(luò)媒體的互動性,數(shù)字化辭書至少能為將來的在線工具書編纂平臺打下基礎(chǔ),如《辭海》網(wǎng)絡(luò)版增加“評論”功能就是一種嘗試。眾所周知,印刷本《辭海》的修訂周期較長,投入很大,更新的時間跨度大(10年)。如能在《辭海》(網(wǎng)絡(luò)版)中注意吸收新的資料,會對《辭海》的修訂大有裨益;同時,讀者查閱《辭海》也能了解到更多、更新的信息。如有關(guān)冥王星失去行星地位的資料,吸收到網(wǎng)絡(luò)版中十分方便,但在紙質(zhì)書中必須等到出下一個版本才能作修訂。因此,通過論壇、博客等形式吸引讀者提供素材,最后由專家審定(在未審定前則作為資料供讀者查閱、參考),對保證工具書的常用常新,實現(xiàn)修訂的持續(xù)性有很強(qiáng)的實用價值:讀者看到的都是最新的修訂版,此時,網(wǎng)絡(luò)版就不再是紙質(zhì)版的附庸,而成了紙質(zhì)版的基礎(chǔ)。網(wǎng)絡(luò)版和紙質(zhì)版各有各的讀者市場,兩者能共同為形成良好的辭書出版產(chǎn)業(yè)結(jié)構(gòu)和產(chǎn)業(yè)鏈作出貢獻(xiàn)。
另外,即使讀者互動的信息不是提供內(nèi)容,而是提出問題或質(zhì)疑,也對辭書出版者有很大幫助,因為通過網(wǎng)絡(luò)這一渠道,把產(chǎn)品和用戶(讀者)聯(lián)結(jié)了起來。從產(chǎn)品營銷的角度看,這對提高產(chǎn)品的質(zhì)量、擴(kuò)大產(chǎn)品的影響等會有重要作用。
三、數(shù)字化辭書目前存在的問題
數(shù)字化辭書在發(fā)展的同時,也存在著一些明顯的不足,如:產(chǎn)業(yè)鏈的培育與整合(包括產(chǎn)業(yè)鏈之間的利益分配)還未合理形成;與紙質(zhì)辭書相比,數(shù)字化辭書還未形成成功的商業(yè)模式,產(chǎn)業(yè)的規(guī)模依然較小;市場的接受度(讀者的閱讀習(xí)慣)還不高;版權(quán)保護(hù)還有待于進(jìn)一步加強(qiáng);研制、開發(fā)過程中缺乏相對統(tǒng)一的標(biāo)準(zhǔn),在界面、外字字庫等方面往往大家各搞一套,等等。這些問題的外在表現(xiàn)之一,就是數(shù)字化辭書魚龍混雜。具體表現(xiàn)為:
1.有些作品制作時研發(fā)重心更多地偏向軟件功能而不是辭書內(nèi)容
表現(xiàn)為注重新技術(shù)的運用和收詞數(shù)量的堆積,忽視內(nèi)容的正確性、實用性和科學(xué)性。請看一個實例。在一本橋牌書中有如下一段文字:
Obviously the bidders and doublers believed a pass was not forcing. The two passers were Eric Rodwell and the late Teddy Lightner. Peter Nagy wasn’t sure,nor was moderator,Bobby Wolff.
上述文字中的“moderator”一詞,在“金山詞霸”中僅一個義項:
moderator (音標(biāo)略) n. 緩和劑
這一解釋顯然與原文不符。如果我們到《新英漢詞典》(世紀(jì)版)中查這個單詞,就會發(fā)現(xiàn)該單詞有4個義項:
moderator n. 1仲裁人;調(diào)解人 2(集會、會議或討論會等的)主席;議長;[宗](基督教長老宗)教政組織的首腦 3(英)(劍橋大學(xué)教學(xué)榮譽(yù)學(xué)位考試的)主考人 4[核]減速劑,慢化劑‖moderatorship n. 仲裁人的職權(quán),主席的職權(quán)
其中第一個義項符合原文的語境。毫無疑問,“金山詞霸”在這個條目上存在著“義項缺失”這一重大缺陷。
2.有的數(shù)字化辭書提供的知識十分蕪雜
隨著“維基(Wiki)百科全書”編寫模式在網(wǎng)絡(luò)的流行,由網(wǎng)民參與編寫百科全書的做法得到了很多互聯(lián)網(wǎng)經(jīng)營者的青睞,但在這一模式下編寫出的“百科全書”,其所提供知識的正確性很難把握。如在號稱“全球最大開放式中文百科全書”的“百度百科”中,“足球”條介紹的知識有足球的起源、漢代蹴鞠石刻、第一個因踢球名垂史冊的人、史上第一份首發(fā)名單、最早的著名球星、現(xiàn)代足球的誕生,林林總總近萬字,但從頭至尾,卻沒有一段文字集中、概要地介紹足球是一項怎樣的運動(如“比賽分兩隊,每隊十一人,球員主要用足踢球或用頭頂球。比賽90分鐘,分上下兩半時。以將球射入對方球門多者為勝”等信息)。
3.版權(quán)曖昧不明
有些數(shù)字化辭書版權(quán)曖昧不明,內(nèi)容甚至有抄襲之嫌。
目前,網(wǎng)上流傳著一個叫“漢語大辭典”的軟件(注意,不是《漢語大詞典》),據(jù)開發(fā)者介紹,該軟件包含成語詞典一本(可查成語48700條)、字典一本(可查漢字20973個)、百科詞典一本(可查詞語377590條),另有中華詩詞大全、歇后語大全、燈謎大全、同義反義別名詞典、名言詞典、古文詞典等內(nèi)容。
顯然,這些內(nèi)容的編寫依靠個人的力量是無法實現(xiàn)的。那么,這些內(nèi)容在匯集過程中,版權(quán)是否會有問題,不免令人生疑。例如,在該軟件中,“中國式摔跤”條目前面一大部分文字與《辭海》同名條目內(nèi)容就十分接近。
中國式摔跤 摔跤運動之一。古稱角力、抵角、相撲、爭跤等。常用方法有背、別、挑、纏、揣(原文如此,當(dāng)作“踹”——筆者按)、踢、擰、摟、彈、搿、插閃、抱腿、勾腳等,以將對手摔倒為勝,比賽分三局,每局三分鐘。此外還有中國民族形式的摔跤,如蒙古族摔跤、朝鮮族摔跤、藏族摔跤、維吾爾族摔跤等。——“漢語大辭典”
中國式摔跤 中國民族形式的摔跤運動。比賽按體重分十個級別,在10米見方的場地上進(jìn)行。常用方法有背、別、挑、纏、踹、踢、擰、摟、彈、搿、插閃、抱腿、勾腳等,以把對手摔倒為勝跤,按勝跤質(zhì)量評定3、2、1分。每場賽兩局,每局3分鐘,以得分多者為勝。若比賽終止時間未到而一方得分已超過對手10分,該方為勝。中國各地區(qū)各民族也有不同的摔跤,如蒙古族摔跤、藏族摔跤、維吾爾族摔跤等。——《辭海》
盡管如此,“漢語大辭典”對《辭海》的摘錄也有不全面的地方,如沒有介紹“按勝跤質(zhì)量評分,以得分多者為勝”的情況,而且最后一句話“此外還有中國民族形式的摔跤”則將“中國民族形式的摔跤”排除在“中國式摔跤”之外(正確的表達(dá)應(yīng)該是將蒙古族摔跤、藏族摔跤、維吾爾族摔跤等包含在“中國式摔跤”這一概念里)。
再看一個“百度百科”中的例子:
道員 職官名。明初布政司、按察司因轄區(qū)大而事繁,布政司的左右參政、參議分理各道錢谷,稱為分守道;按察司的副使、僉事分理各道刑名,稱為分巡道。此為道員稱謂之始。至清乾隆間裁去世參政、參議、副使、僉事等職,專設(shè)分守道與分巡道,多兼兵備銜,管轄府、州,乃成為省以下府、州以上的高級行政長官。別稱“道臺”、“觀察”。《官場現(xiàn)形記》第三四回:“八點鐘一位客到,乃是這里有名的一位道臺叫做‘磕頭道臺’。”又第九回:“王觀察信上言明,是奉了東撫之命,前往東洋考察學(xué)務(wù)。”東撫,指山東巡撫。——“百度百科”
道員 明初布政、按察二司以轄區(qū)廣大,由布政司的佐官左右參政、參議分理各道錢谷,稱為分守道;按察司的佐官副使、僉事分理各道刑名,稱為分巡道。此為道員稱謂之始。清乾隆時裁參政、參議、副使、僉事等名稱,專設(shè)分守、分巡道,多兼兵備銜,管轄府、州,成為省以下府、州以上的高級行政長官。清代簡稱“道臺”,又設(shè)督糧、鹽法等道,清末更在各省設(shè)置巡警、勸業(yè)二道,各司其專職。北洋政府時曾分一省為數(shù)道,設(shè)置道尹。——《辭海》
兩者前半部分的文字幾乎完全一樣(百度百科中“至清乾隆間裁去世參政”衍一“世”字),而“又第九回”以下的文字,已與“道員”無涉,也犯了內(nèi)容“蕪雜”之病。
4.內(nèi)容輾轉(zhuǎn)抄襲
由于一些數(shù)字化辭書(軟件)的開發(fā)者(尤其是個人)版權(quán)意識比較淡漠,往往將別人的東西隨便拿來使用,因此,數(shù)字化工具書(軟件)內(nèi)容被輾轉(zhuǎn)抄襲的現(xiàn)象屢見不鮮。
下面是網(wǎng)絡(luò)版成語詞典中的一個條目:

我們在不同的網(wǎng)站可以看到與其相同的內(nèi)容。現(xiàn)略舉數(shù)例:
金石網(wǎng) www.kingsnet.biz
東方法眼 www.dffy.com
成語詞典 www.chengyu.org
網(wǎng)絡(luò)中國 life.httpcn.com
四、要重視辭書出版所面臨的數(shù)字化沖擊
盡管互聯(lián)網(wǎng)上數(shù)字化辭書(軟件)的問題不少,但不容否認(rèn)的是,互聯(lián)網(wǎng)對辭書(包括紙質(zhì)辭書和由正規(guī)出版機(jī)構(gòu)出版的數(shù)字化辭書)的沖擊很大,應(yīng)當(dāng)引起辭書界足夠的重視。目前,這種沖擊主要表現(xiàn)在兩個方面。
1.以互聯(lián)網(wǎng)為典型代表,信息提供的渠道更多
借助于搜索平臺,目前互聯(lián)網(wǎng)上的各種網(wǎng)站、網(wǎng)頁已經(jīng)成為很多人(包括不少專業(yè)工作者)了解信息、釋疑解難的平臺。“內(nèi)事不決問老婆,外事不決問Google”(仿《三國演義》孫策臨死前對其弟孫權(quán)所言:“內(nèi)事不決問張昭,外事不決問周瑜”)被選為2005年十大網(wǎng)絡(luò)名言之一,就是這種沖擊的形象概括。辭書,特別是百科類辭書、專科類辭書是否有被互聯(lián)網(wǎng)替代的可能,值得我們關(guān)注。
2.互聯(lián)網(wǎng)上的百科全書興起,對辭書出版(知識供應(yīng))形成了沖擊
作為一種互動媒體,互聯(lián)網(wǎng)很容易成為一個聚集信息和知識的平臺,因此,完全由網(wǎng)民編寫、更新并供網(wǎng)民免費瀏覽的百科全書也逐漸出現(xiàn),目前在全球范圍內(nèi)最具影響的是維基(Wiki)百科(http:∥www.wikipedia.org)。
維基百科發(fā)軔于20世紀(jì)90年代中期,經(jīng)過十年的發(fā)展,維基百科已被認(rèn)為是目前世界上最大的百科全書,到2005年底,共有82種語言版本,詞條總數(shù)已經(jīng)接近200萬個,并且正以每月7%的幅度增加,每月的頁面點擊量達(dá)到25億次。對此,不少人歡欣鼓舞,正如互聯(lián)網(wǎng)剛興盛時有人高呼“全民出版”或“個人出版”的時代到來了那樣,目前,也有一部分人認(rèn)為全民編寫詞典時代已經(jīng)到來。
但是,用專業(yè)的眼光來看,那種全民編寫辭書的舉動實際上是十分危險的。前《不列顛百科全書》副總裁和主編羅伯特·麥克亨利(Robert McHenry)在2004年對“維基百科”有一個尖刻甚至貌似惡毒的評論,他認(rèn)為,使用維基百科這樣全民編寫的百科全書如同在上公共廁所:“如果它可能臟得顯而易見,你就會處處小心;但或許它看上去相當(dāng)干凈,因此你會被一種錯誤的安全感所麻痹。顯然你無法明確知道,誰在你之前用過了廁所。”
有人認(rèn)為,羅伯特·麥克亨利的這番言辭,是因為維基百科全書與《不列顛百科全書》構(gòu)成競爭使然,但實情卻是:如果沒有相當(dāng)程度的判斷力,用戶就根本無法判斷在類似“維基百科”這樣的全民百科全書中獲得的知識是真還是假;而如果用戶能夠作出準(zhǔn)確的判斷,那還需要去查工具書嗎?這真是一個類似于“第二十二條軍規(guī)”的黑色幽默。
知識作為人類文化的精髓,顯然不應(yīng)該被壟斷。同時,我們也應(yīng)該看到,知識的提供歷來是一種專業(yè)化的技能,從來都是由專業(yè)化的隊伍來提供(否則,就不應(yīng)該有教師、醫(yī)生、律師等職業(yè)),才能保證科學(xué)性、準(zhǔn)確性。因此,如果普通大眾獲得的知識是真?zhèn)坞y辨的,互聯(lián)網(wǎng)上良莠不齊的信息讓人難以辨別其優(yōu)劣,而人們還對這種情況一味稱贊、夸耀,那么在知識供應(yīng)上的“劣幣驅(qū)逐良幣”現(xiàn)象,便會發(fā)生、擴(kuò)大。這才是最令人擔(dān)憂的。
目前,經(jīng)濟(jì)全球化、全球信息化的浪潮席卷而來,每個人都面臨著“全球信息化”或“信息全球化”的挑戰(zhàn)。作為辭書工作者,“全球信息化”需要我們考慮用信息化技術(shù)來發(fā)展我們的辭書事業(yè),而“信息全球化”則使我們面臨的競爭更為殘酷(因為有更多的內(nèi)容提供商出現(xiàn))。面對新的環(huán)境、新的對手,應(yīng)該如何應(yīng)對,這個大問題值得每一個關(guān)心辭書事業(yè)的人去探索、解決。
(上海數(shù)字世紀(jì)網(wǎng)絡(luò)有限公司 上海 200001)
(責(zé)任編輯 王慧敏)