999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

古籍?dāng)?shù)字化過(guò)程中漢字處理對(duì)策研究

2015-03-30 11:41:27李玖蔚
關(guān)鍵詞:對(duì)策研究圖書館

李玖蔚

摘要:古籍?dāng)?shù)字化是解決古籍保護(hù)與利用之間矛盾的有效手段。本文概述了國(guó)內(nèi)外古籍?dāng)?shù)字化過(guò)程中漢字字庫(kù)的研究情況,并以廬陵文化古籍文獻(xiàn)數(shù)字化實(shí)踐為基礎(chǔ),從輸入法的選擇、偏僻字的錄入技巧、自造古字等方面,探討圖書館在古籍?dāng)?shù)字化過(guò)程中面臨的漢字字庫(kù)不足問(wèn)題所采取的應(yīng)對(duì)策略,并提出漢字處理過(guò)程中需注意的若干問(wèn)題,以期對(duì)從事古籍?dāng)?shù)字化的同仁有所啟發(fā)和幫助。

關(guān)鍵詞:圖書館;古籍?dāng)?shù)字化;漢字處理;對(duì)策研究

古籍?dāng)?shù)字化是加快古籍流通,有效保護(hù)古籍的重要手段。中文古籍?dāng)?shù)字化肇始于1978年,美國(guó)人P·J·Ivanhoe使用電子計(jì)算機(jī)編制了《戴震孟子字義疏證索引》《王陽(yáng)明大學(xué)問(wèn)索引》《王陽(yáng)明傳習(xí)錄索引》《朱熹中庸章句索引》《朱熹大學(xué)章句索引》機(jī)讀目錄。目前在美國(guó),由北美36家圖書館組成的美國(guó)圖書館研究學(xué)會(huì),擁有25000條數(shù)據(jù)的數(shù)據(jù)庫(kù)做到了館際資源共享,并還在不斷地?cái)U(kuò)充完善中。哈佛燕京圖書館擁有的“線裝古籍計(jì)算機(jī)檢索系統(tǒng)”中的1000余種家譜的資料,目前已經(jīng)編目完成。在英國(guó),大量中國(guó)珍貴文獻(xiàn)和古籍收藏在大英圖書館,大英圖書館開(kāi)發(fā)的“古版書簡(jiǎn)明標(biāo)題目錄”是當(dāng)前全球古籍文獻(xiàn)數(shù)據(jù)庫(kù)最大的聯(lián)機(jī)數(shù)據(jù)庫(kù)。以上這些成果為我國(guó)古籍?dāng)?shù)字化建設(shè)提供了寶貴的經(jīng)驗(yàn)。

據(jù)2010年不完全統(tǒng)計(jì),我國(guó)大陸地區(qū)有179家單位從事古籍?dāng)?shù)字化,形成各類數(shù)據(jù)庫(kù)(包括各種古籍書目數(shù)據(jù)庫(kù)、古籍全文數(shù)據(jù)庫(kù)等)415個(gè),許多數(shù)據(jù)庫(kù)的字?jǐn)?shù)都在l億以上。較權(quán)威的統(tǒng)計(jì)表明,2012年我國(guó)公藏機(jī)構(gòu)已經(jīng)擁有超過(guò)20億字的數(shù)字化文本格式的古籍。一些己成規(guī)模的大型古籍?dāng)?shù)據(jù)庫(kù)還在原有基礎(chǔ)上不斷拓展和完善。

中國(guó)大陸地區(qū)開(kāi)始中文古籍?dāng)?shù)字化工作以來(lái),制約古籍?dāng)?shù)字化進(jìn)程的主要問(wèn)題是漢字字庫(kù)問(wèn)題。業(yè)界就這一問(wèn)題進(jìn)行了深入的研究和探討。

1、國(guó)內(nèi)外古籍?dāng)?shù)字化過(guò)程中對(duì)漢字字庫(kù)問(wèn)題的研究概況

1.1 漢字字庫(kù)的研究情況

我國(guó)從20世紀(jì)50年代就開(kāi)始了計(jì)算機(jī)中文信息處理的理論和技術(shù)的研究,自20世紀(jì)70年代中期開(kāi)始,我國(guó)逐漸加快在計(jì)算機(jī)中文信息處理方面的發(fā)展步伐,在漢字鍵盤輸入技術(shù)、漢字輸出技術(shù)、漢字編碼技術(shù)、漢字儲(chǔ)存、檢索和識(shí)別、電子照排、中文平臺(tái)等多方面取得了一系列重大成就。陸續(xù)開(kāi)發(fā)的漢字鍵盤輸入方法,解決了漢字進(jìn)入計(jì)算機(jī)的難題;漢字輸出實(shí)現(xiàn)了多字體、多字號(hào);漢字字庫(kù)的制作也由點(diǎn)陣字庫(kù)、矢量字庫(kù)逐步過(guò)渡到曲線輪廓字庫(kù);漢字自動(dòng)識(shí)別技術(shù)達(dá)到國(guó)際先進(jìn)水平,并有商品投入市場(chǎng);ISO/IEc 10646的CJK字符集,由早期的20 902個(gè)CJK統(tǒng)一漢字逐步擴(kuò)充,擴(kuò)充集A和擴(kuò)充集B已經(jīng)完成,現(xiàn)在正討論擴(kuò)充集c1。待擴(kuò)充集c1完成后,中日韓編碼漢字已經(jīng)7萬(wàn)多。這些成就,促進(jìn)了中國(guó)計(jì)算機(jī)的普及,為發(fā)展計(jì)算機(jī)應(yīng)用技術(shù)和信息化創(chuàng)造了基本條件。

1.2 漢字字庫(kù)的不足

中國(guó)古籍?dāng)?shù)字化經(jīng)過(guò)近30年的努力,漢字字庫(kù)得到了飛速發(fā)展,并開(kāi)發(fā)出了超大字符集字庫(kù)。在漢字信息化標(biāo)準(zhǔn)制定方面,國(guó)內(nèi)外相繼制定了多個(gè)漢字編碼標(biāo)準(zhǔn)。最新的GB 18030-2005標(biāo)準(zhǔn)可以涵蓋70 244個(gè)漢字。然而,古籍中的漢字大約有10萬(wàn)多個(gè),GB 18030-2005的字庫(kù)還是遠(yuǎn)沒(méi)有覆蓋所有漢字。因此,在古籍?dāng)?shù)字化時(shí)依然會(huì)碰到不少缺字現(xiàn)象,補(bǔ)字工作不可避免。漢字字庫(kù)的不足是影響古籍?dāng)?shù)字化質(zhì)量及進(jìn)程的主要問(wèn)題之一。

2、我館古籍?dāng)?shù)字化過(guò)程中應(yīng)對(duì)漢字字庫(kù)問(wèn)題的策略

井岡山大學(xué)地處素稱“江南望郡”、“金廬陵”、“文章節(jié)義之邦”的吉安,一直以來(lái)注重廬陵文化相關(guān)文獻(xiàn)資料的購(gòu)買和收藏,為充分挖掘廬陵文化的精髓和內(nèi)涵,又組織力量對(duì)相關(guān)的館藏資源進(jìn)行數(shù)字化加工,建成了特色數(shù)據(jù)庫(kù),為研究者提供了更快捷、更豐富、更深層次的服務(wù)。

所謂廬陵文化,主要是指讀書人多,建功立德者多,文教設(shè)施多,發(fā)表著述多等等。在數(shù)字化廬陵文化名人的古籍作品時(shí),比如在《歐陽(yáng)修文萃》的數(shù)字化過(guò)程中,盡管安裝了超大字符集字庫(kù),對(duì)計(jì)算機(jī)也作了相應(yīng)的設(shè)置,但還是碰到不少問(wèn)題。故筆者將三年來(lái)數(shù)字化廬陵古籍文獻(xiàn)中的實(shí)踐經(jīng)驗(yàn)進(jìn)行總結(jié),希望對(duì)從事古籍?dāng)?shù)字化的同仁有所啟發(fā)和幫助,以期更多的古籍文化得以展示和傳承。

2.1 選擇合適的輸入法

在古籍?dāng)?shù)字化過(guò)程中,安裝大的漢字字體庫(kù),能解決大部分漢字的輸入與顯示問(wèn)題。目前比較成熟的輸入法有很多,但任何一種輸入法都難以囊括字體庫(kù)中的所有漢字。因此,對(duì)輸入法的選擇至關(guān)重要。合適的輸入法,不但決定了漢字的輸出能力,更影響著古籍?dāng)?shù)字化的效率。

筆者建議選擇“極點(diǎn)五筆”輸入法,其一,此輸入法既可單獨(dú)進(jìn)行“五筆字形、拼音輸入法”的選擇,也可選擇“五筆拼音輸入法”,在這種輸入狀態(tài)下,對(duì)于那些目前還不能通過(guò)五筆輸出的漢字,可直接輸入該字的拼音進(jìn)行輸出,省去了在五筆和拼音之間來(lái)回切換的操作;其二,該輸入法的繁簡(jiǎn)切換非常直觀、明了、方便,對(duì)于那些不是很熟悉的繁體字,通過(guò)輸入其簡(jiǎn)體字就能顯示對(duì)應(yīng)的繁體字,這樣建庫(kù)人員能很快地確定其正誤。比如“蕭”和“齏”,不仔細(xì)區(qū)別感覺(jué)像是同一個(gè)字,但實(shí)際上它們分別是“齋”和“齊”的繁體字。

2.2 偏僻字的錄入技巧

目前漢字字庫(kù)中有大量的生僻字,無(wú)法通過(guò)五筆輸入法輸出,需通過(guò)拼音輸入法才能輸出,此時(shí)可在Word中輸入與生僻字偏旁和筆畫相近的字,并選定該字,點(diǎn)擊右鍵,在彈出菜單中選擇“符號(hào)”,便很快能找到所需文字,雙擊該字,即可直接輸入到Word中,這樣建庫(kù)人員在不知道其讀音的情況下,也能很快地輸入該字,從而提高古籍?dāng)?shù)字化的進(jìn)程。

2.3 自造古字

目前在古籍文獻(xiàn)數(shù)字化處理的過(guò)程中,通用于業(yè)界的Uni code字符集具有近7萬(wàn)字的容量,但在古籍?dāng)?shù)據(jù)庫(kù)建設(shè)中還是不夠用。因此,我們使用微軟操作系統(tǒng)自帶的“TrueType”造字程序進(jìn)行造字,避免數(shù)據(jù)庫(kù)中使用符號(hào)或說(shuō)明性文字代替目前輸入法無(wú)法正常輸出的文字現(xiàn)象。

3、古籍?dāng)?shù)字化漢字處理過(guò)程中需注意的問(wèn)題及對(duì)策

古籍?dāng)?shù)字化漢字處理過(guò)程中遇到的最大障礙是漢字字庫(kù)問(wèn)題,它不但影響著古籍?dāng)?shù)字化的進(jìn)程,還制約著古籍?dāng)?shù)字化的發(fā)展。漢字字庫(kù)問(wèn)題多年來(lái)經(jīng)過(guò)專家學(xué)者的研究,正在不斷的完善中,但仍未囊括古籍中的所有漢字,在進(jìn)行古籍?dāng)?shù)字化時(shí)仍有不少字需要利用相關(guān)程序進(jìn)行造字。目前有一些具備造字功能的程序,筆者主要介紹使用微軟操作系統(tǒng)自帶的“TrueType”造字程序進(jìn)行造字時(shí)需要注意的問(wèn)題及解決方法。

3.1 造字時(shí)截取字庫(kù)中已有字的有關(guān)部位

在造字時(shí),最好截取現(xiàn)成字中需要的部分進(jìn)行造字,這樣比分別輸入所造字的各個(gè)部分而造出的字要美觀。比如:我們通過(guò)截取“映”的左半部和“換”的右半部造出的字比直接輸入“日”和“奐”字而造出的字,看上去要自然美觀。

3.2 自造字大小的調(diào)節(jié)

自造的字如果不通過(guò)區(qū)位碼輸入法進(jìn)行輸出,而是直接將其復(fù)制粘貼到Word或Excel文檔中的話,字號(hào)大小的調(diào)節(jié)不要在造字程序中進(jìn)行,而應(yīng)在Word或Excel文檔中進(jìn)行,否則字的筆劃線條太粗,放入相應(yīng)文檔中也會(huì)顯得很不協(xié)調(diào)。

3.3 自造字的輸出

將自造字直接放入Excel單元格中時(shí),單元格的狀態(tài)應(yīng)處于編輯狀態(tài)(即單擊該單元格)而不是可修改狀態(tài)(即雙擊單元格),否則無(wú)法將自造字粘貼到指定位置。但這種直接將自造字復(fù)制粘貼到Excel或Word文檔中的操作,當(dāng)需對(duì)其進(jìn)行排版時(shí),它不會(huì)隨之移動(dòng),要人工調(diào)整它所在的位置,故生僻字造好后,應(yīng)利用區(qū)位碼輸入法輸出到相應(yīng)文檔中,這樣排版時(shí)就不會(huì)出現(xiàn)自造字不隨文移動(dòng)的現(xiàn)象了。

3.4 自造罕的顯示

自造的字缺乏通用性,因此若要在不同的計(jì)算機(jī)上都可以正常顯示Excel或數(shù)據(jù)庫(kù)中的自造字,就必須將eudc.euf和eudc.tff這兩個(gè)自造字庫(kù)文件拷貝到字體目錄下。需要指出的是,將這二個(gè)文件拷貝到指定目錄時(shí),根據(jù)計(jì)算機(jī)設(shè)置的不同,其拷貝方法也不同。即:操作系統(tǒng)中沒(méi)有攜帶TrueType造字程序,只需直接將自造字的二個(gè)文件粘貼到指定目錄,重啟計(jì)算機(jī)就行了;其他情況就只有通過(guò)command命令進(jìn)行拷貝操作,當(dāng)然如果造字程序或自造字文件處于運(yùn)行狀態(tài),則拷貝操作無(wú)法進(jìn)行。

4、結(jié)語(yǔ)

古籍?dāng)?shù)字化建設(shè)是一項(xiàng)艱巨而復(fù)雜的系統(tǒng)工程,盡管目前古籍?dāng)?shù)字化建設(shè)中還存在一些問(wèn)題,但隨著國(guó)家“中國(guó)古籍?dāng)?shù)字化工程”的啟動(dòng)及數(shù)字化技術(shù)的發(fā)展與完善,相信在不久的將來(lái),古籍?dāng)?shù)字化過(guò)程中所遇到的問(wèn)題都將逐步得到解決。

猜你喜歡
對(duì)策研究圖書館
圖書館
文苑(2019年20期)2019-11-16 08:52:12
時(shí)間重疊的圖書館
文苑(2018年17期)2018-11-09 01:29:40
圖書館
飛躍圖書館
山西省臨猗縣角杯鄉(xiāng)農(nóng)村居家養(yǎng)老服務(wù)存在的問(wèn)題及對(duì)策研究
淺析中小企業(yè)融資問(wèn)題及對(duì)策
輸變電工程質(zhì)量管理現(xiàn)狀及對(duì)策研究
職業(yè)健康現(xiàn)狀分析及對(duì)策研究
鉆孔樁施工的常見(jiàn)問(wèn)題分析及對(duì)策研究
切入學(xué)生生活構(gòu)筑地理生活化課堂研究
成才之路(2016年26期)2016-10-08 11:46:05
主站蜘蛛池模板: 欧美综合区自拍亚洲综合天堂| 国产成人一区| 女人天堂av免费| 国产美女久久久久不卡| 五月婷婷精品| 亚洲视频二| 91偷拍一区| 亚洲福利片无码最新在线播放| 亚洲人成影院午夜网站| 欧美激情一区二区三区成人| 人妻夜夜爽天天爽| 国产又大又粗又猛又爽的视频| 首页亚洲国产丝袜长腿综合| 伊人成人在线视频| 国产人在线成免费视频| 蜜桃视频一区二区三区| a毛片在线免费观看| 美女啪啪无遮挡| 国产成人一区在线播放| 国产精品极品美女自在线看免费一区二区 | 欧美国产视频| 91亚洲精选| 免费不卡视频| 午夜国产精品视频| 手机成人午夜在线视频| 成人字幕网视频在线观看| 国产91透明丝袜美腿在线| 小蝌蚪亚洲精品国产| 五月婷婷欧美| 午夜啪啪网| 青青青伊人色综合久久| 无码中文字幕精品推荐| 区国产精品搜索视频| 国产丝袜无码精品| 久久中文字幕av不卡一区二区| 亚洲天堂免费在线视频| 亚洲swag精品自拍一区| 国产va在线观看免费| 亚洲狠狠婷婷综合久久久久| 91探花国产综合在线精品| 她的性爱视频| 国产一区二区三区夜色| 日韩av无码DVD| 国产精品自在在线午夜区app| 全午夜免费一级毛片| 国产一区二区精品福利| 999国内精品视频免费| 五月婷婷精品| 亚卅精品无码久久毛片乌克兰| 91人妻在线视频| 成人在线亚洲| 中文字幕天无码久久精品视频免费 | 91久久偷偷做嫩草影院| 欧美成人综合视频| 国产噜噜在线视频观看| 色综合五月婷婷| Jizz国产色系免费| 女人18毛片一级毛片在线| 亚洲国产成人麻豆精品| 伊在人亞洲香蕉精品區| 欧美精品高清| 亚洲国产AV无码综合原创| 色妞www精品视频一级下载| 国产95在线 | 欧美午夜在线播放| 久草视频中文| 1024国产在线| www亚洲精品| 欧美97色| 高清无码一本到东京热| 欧美 国产 人人视频| 国模在线视频一区二区三区| 伊人久久精品无码麻豆精品| 国产午夜福利在线小视频| 久久久久亚洲AV成人人电影软件| 91视频99| 免费国产黄线在线观看| 国产超碰在线观看| 91伊人国产| 国产成人精品一区二区三区| 国产成年女人特黄特色大片免费| 亚洲人成亚洲精品|