
摘 要:檔案數(shù)字化是當(dāng)前乃至今后各級(jí)各類檔案館面臨的一項(xiàng)長(zhǎng)期工作內(nèi)容和工作方向,是數(shù)字檔案館建設(shè)的基礎(chǔ)。本文以武漢大學(xué)為例,探討了檔案數(shù)字化服務(wù)外包的具體要求和標(biāo)準(zhǔn)。
關(guān)鍵詞:檔案 數(shù)字化 數(shù)字檔案館 服務(wù) 外包
中圖分類號(hào) G270.7 文獻(xiàn)標(biāo)識(shí)碼 A 收稿日期 2019-05-28
★作者簡(jiǎn)介:劉秋華,武漢大學(xué)檔案館技術(shù)室,碩士研究生,從事檔案信息化工作。
Abstract The digitization of archives is a long-term work content and work direction faced by archives at various levels at present and in the future, and it is the basis for the construction of digital archives. Taking Wuhan University as an example, this paper discusses the specific requirements and standards in the digital service outsourcing of archives.
Keyword archives; digitization; digital archives; service; outsourcing
館藏檔案數(shù)字化是一項(xiàng)長(zhǎng)期的勞動(dòng)密集型工作,除了需要大量經(jīng)費(fèi)支持外,還需要投入大量的人力、物力,因此很多檔案館都選擇采用檔案數(shù)字化服務(wù)外包,通過招標(biāo)方式,選擇合作的意向公司,將館藏檔案數(shù)字化整體打包給公司進(jìn)行全程的數(shù)字化處理。
檔案數(shù)字化主要包括檔案整理、數(shù)字化掃描及圖像處理、目錄錄入、原文掛接、數(shù)字化成果移交以及簽訂安全保密協(xié)議等相關(guān)環(huán)節(jié)。檔案館應(yīng)對(duì)所有工作環(huán)節(jié)提出明確的具體要求和量化標(biāo)準(zhǔn),確保檔案數(shù)字化服務(wù)外包項(xiàng)目的順利推進(jìn),保障數(shù)字化成果達(dá)到預(yù)設(shè)要求和標(biāo)準(zhǔn)。
一、檔案整理要求
1.調(diào)卷出庫,從庫房提取需要加工的檔案實(shí)體,逐卷清點(diǎn),并填寫調(diào)卷單,雙方責(zé)任人交接簽字。
2.對(duì)案卷進(jìn)行整理、分件、填寫及核對(duì)題名、編排頁碼,要求做到卷內(nèi)目錄、題名、頁碼清晰、準(zhǔn)確、完整,對(duì)卷內(nèi)目錄有更改或沒有卷內(nèi)目錄的檔案要求重新輸出卷內(nèi)目錄。
3.對(duì)裝訂物影響掃描工作進(jìn)行的檔案,先行拆除裝訂物,同時(shí)注意保護(hù)檔案不受損壞。
4.對(duì)于破損嚴(yán)重、無法直接進(jìn)行掃描的檔案,先行高清拍照及全手工修復(fù),再行數(shù)字化處理。
5.對(duì)于折皺不平影響掃描質(zhì)量的原件,先行壓平或熨平等后再行數(shù)字化處理。
6.掃描工作完成后,拆除過裝訂物的檔案要求重新裝訂,注意保持檔案實(shí)體的排列順序與卷內(nèi)目錄順序一致,做到完整、準(zhǔn)確、無遺漏。
7.歸還入庫,雙方責(zé)任人交接簽字。
8.在項(xiàng)目實(shí)施過程中,確保檔案實(shí)體的安全與完整,避免人為損害與遺失。
二、實(shí)體檔案錄入要求
1.遵循標(biāo)準(zhǔn)。國(guó)家檔案局《檔案著錄規(guī)則》(DA/T18-1999)、《民國(guó)檔案目錄中心數(shù)據(jù)采集標(biāo)準(zhǔn) 民國(guó)檔案著錄細(xì)則》(DA/T20.1-1999)、湖北省檔案局《湖北省文書檔案目錄數(shù)據(jù)庫結(jié)構(gòu)與著錄細(xì)則》(鄂檔〔2004〕46號(hào))等。
2.著錄項(xiàng)要求。
(1)一般錄入要求。案卷級(jí)要求錄入檔號(hào)、全宗號(hào)、歸檔年度、分類號(hào)、案卷號(hào)、案卷題名、保管期限、密級(jí)、總件數(shù)、總頁數(shù)、立卷單位、起止日期、歸檔時(shí)間、備注等,卷內(nèi)目錄要求錄入檔號(hào)、全宗號(hào)、歸檔年度、分類號(hào)、案卷號(hào)、卷內(nèi)順序號(hào)、題名、文號(hào)、責(zé)任者、形成時(shí)間、保管期限、密級(jí)、載體類型、頁數(shù)、頁號(hào)、立卷單位、內(nèi)容摘要、備注、主題詞等著錄項(xiàng),要求建立數(shù)據(jù)項(xiàng)完備、數(shù)據(jù)準(zhǔn)確的案卷級(jí)、文件級(jí)目錄數(shù)據(jù)庫。字段長(zhǎng)度、格式要求及題名信息等應(yīng)符合檔案館現(xiàn)行檔案管理信息系統(tǒng)要求。
(2)細(xì)化錄入要求。對(duì)于校報(bào)、周刊要求輸入到每一條新聞標(biāo)題,一份報(bào)紙對(duì)應(yīng)一條電子目錄;《國(guó)立武漢大學(xué)一覽》、《畢業(yè)紀(jì)念冊(cè)》要求錄入到每一個(gè)文件標(biāo)題和每一張照片標(biāo)題;部分學(xué)籍檔案,比如高考招生錄取名冊(cè)、派遣名冊(cè)、檔案轉(zhuǎn)遞單、發(fā)證冊(cè)等,頁面上含多個(gè)人名的,要求錄到每個(gè)人名,一頁對(duì)應(yīng)一條電子目錄。
3.對(duì)數(shù)字化之前已經(jīng)建立的目錄數(shù)據(jù)庫進(jìn)行核對(duì),發(fā)現(xiàn)錯(cuò)漏以及不合規(guī)范要求的目錄數(shù)據(jù)進(jìn)行修訂、完善。
4.實(shí)體檔案案卷目錄、文件目錄要求與機(jī)讀目錄一一對(duì)應(yīng),準(zhǔn)確率達(dá)100%。
三、檔案具體掃描參數(shù)及要求
1.掃描模式及分辨率要求:要求采用平板高精掃描儀以及全彩色掃描模式,分辨率不低于300dpi,對(duì)于字跡偏小、文字密集、清晰度較差、當(dāng)前頁含照片或圖片的檔案等,分辨率提高至600dpi。對(duì)于含正規(guī)印刷體、OCR識(shí)別率高的檔案實(shí)體應(yīng)采用OCR識(shí)別技術(shù)(主要指校報(bào)、周刊、公文等),要求準(zhǔn)確率達(dá)到90%,掃描后提供雙層PDF文件。
對(duì)于薄透與字跡褪變檔案的數(shù)字化,要求使用相同大小白紙襯底,再行掃描;字跡褪變檔案掃描時(shí),需要調(diào)整亮度、對(duì)比度等參數(shù),以掃描后形成的圖像中文字清晰為準(zhǔn)。遇有字跡完全褪色(只剩劃痕)或復(fù)寫紙字跡且發(fā)生浸染時(shí),可掃描該頁檔案反面,再做鏡像文件。
2.文件存儲(chǔ)格式要求:TIFF、JPG、PDF。
3.命名規(guī)則,遵循《湖北省紙質(zhì)檔案數(shù)字化操作規(guī)程》,以“檔號(hào)+卷內(nèi)順序號(hào)”的形式命名。
4.掃描件與原件一一對(duì)應(yīng),無錯(cuò)漏,圖片信息完整、無色差,數(shù)字化加工處理過程嚴(yán)格遵循國(guó)家檔案行業(yè)標(biāo)準(zhǔn)《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》、《湖北省紙質(zhì)檔案數(shù)字化操作規(guī)程》,對(duì)紙質(zhì)檔案掃描形成的圖像應(yīng)作質(zhì)量檢驗(yàn)、糾偏、去污、去邊、拼接等處理,同時(shí)最大化地完整保留檔案原始幅面的內(nèi)容和大小,確保形成的圖像清晰、完整、不失真,不影響圖像的利用效果。
5.采用網(wǎng)絡(luò)版的數(shù)字化加工系統(tǒng),具備“隨機(jī)掃描抽檢”功能,能將掃描抽檢相關(guān)信息記載到系統(tǒng)中。
四、電子檔案文件的處理與掛接要求
1.對(duì)于經(jīng)OCR識(shí)別的單份紙質(zhì)檔案文件要求提供雙層PDF文件,并以該文件進(jìn)行掛接;照片檔案以JPG文件進(jìn)行掛接;其他紙質(zhì)檔案文件要求以多頁P(yáng)DF文件進(jìn)行掛接。
2.掛接的每一份電子檔案文件要求與原實(shí)體幅面大小相同,經(jīng)數(shù)字化處理后所含的內(nèi)部頁面版面也應(yīng)相同,圖像居中。
3.所有掛接的民國(guó)檔案(除正規(guī)出版物外)的電子檔案文件均應(yīng)作“武漢大學(xué)檔案館”數(shù)字水印處理后再行掛接,照片檔案可適當(dāng)降低分辨率至300dpi(原件需保留作永久備份之用),所有數(shù)字化形成的目錄數(shù)據(jù)與圖像數(shù)據(jù),經(jīng)過質(zhì)檢環(huán)節(jié)確認(rèn)為“合格”后,方可以在線方式掛接到數(shù)據(jù)服務(wù)器。
4.掛接處理好后的電子檔案文件,要求達(dá)到不需再次處理即達(dá)到激光打印機(jī)能清晰打印的程度。
五、檢查與驗(yàn)收
檢查與驗(yàn)收應(yīng)包括檔案整理與著錄、目錄數(shù)據(jù)、圖像數(shù)據(jù)及掛接等內(nèi)容。檢查方式按數(shù)據(jù)加工批次隨機(jī)抽檢,抽檢率不低于20%,要求合格率達(dá)100%。抽檢合格率不符合要求的,該批次檔案全部退回返工,直到達(dá)到驗(yàn)收要求。
具體驗(yàn)收及評(píng)判標(biāo)準(zhǔn)見下表:
六、數(shù)字化后電子檔案的移交與校驗(yàn)
數(shù)字化服務(wù)外包項(xiàng)目完成后,要求公司以三種形式、三種規(guī)格提供三套完整的數(shù)字化電子檔案資源。
1.一套通過現(xiàn)行檔案管理信息系統(tǒng)實(shí)現(xiàn)全文掛接后的電子檔案,含“武漢大學(xué)檔案館”數(shù)字水印的在線文檔,要求準(zhǔn)確率達(dá)到100%,用于對(duì)外服務(wù)。
2.一套檔案級(jí)刻錄光盤,內(nèi)含兩套完整的電子檔案文件,一套以頁為單位形成的數(shù)字化加工處理好后的檔案原件掃描件(未作降低分辨率處理、未加數(shù)字水印);另一套是以件為單位形成的全部電子檔案文件(未加數(shù)字水印),作長(zhǎng)久保存之用。
3.一套移交硬盤,所含內(nèi)容與本項(xiàng)第2條同,作長(zhǎng)久保存之用。
七、現(xiàn)場(chǎng)管理及安全保密要求
1.公司資質(zhì)方面,要求數(shù)字化服務(wù)公司具有一定規(guī)模、管理制度健全、社會(huì)信譽(yù)好、經(jīng)驗(yàn)豐富、具備專業(yè)的檔案數(shù)字化加工資質(zhì)和檔案安全保密資質(zhì),最好有從事民國(guó)檔案及相關(guān)檔案數(shù)字化服務(wù)外包經(jīng)歷(需提供相關(guān)的佐證材料)。
2.與公司簽訂安全保密協(xié)議,注明保密工作內(nèi)容、注意事項(xiàng)及違約責(zé)任。
3.所有進(jìn)場(chǎng)人員要求相對(duì)固定,分工明確,且技術(shù)嫻熟,有多年從事檔案數(shù)字化工作經(jīng)驗(yàn),項(xiàng)目進(jìn)行過程中不得隨意更換人員。其中負(fù)責(zé)檔案整理的人員要具備一定的檔案專業(yè)知識(shí),熟悉檔案整理流程,有一定的民國(guó)檔案文字(繁體字和毛筆字)辨識(shí)功底。
4.要求制定科學(xué)規(guī)范的數(shù)字化加工流程,所有環(huán)節(jié)有專人負(fù)責(zé),責(zé)任到人。
5.加強(qiáng)現(xiàn)場(chǎng)管理,包括人員管理和場(chǎng)所管理,所有檔案數(shù)字化加工人員上崗前應(yīng)接受保密安全培訓(xùn),簽訂保密承諾書;加工現(xiàn)場(chǎng)安裝監(jiān)控設(shè)備,場(chǎng)外配備專門的儲(chǔ)物柜,用于工作人員存放私人物品。所有入場(chǎng)設(shè)備,必須進(jìn)行嚴(yán)格登記,項(xiàng)目進(jìn)行期間不得擅自帶入或帶離工作場(chǎng)所,項(xiàng)目完工驗(yàn)收后在檔案館技術(shù)人員的監(jiān)督下對(duì)其存儲(chǔ)內(nèi)容進(jìn)行檢查并作相應(yīng)的銷毀處理。項(xiàng)目現(xiàn)場(chǎng)計(jì)算機(jī)除必要的網(wǎng)絡(luò)接口外,其他所有數(shù)據(jù)接口全部封閉,服務(wù)器設(shè)置密碼,由專人管理。項(xiàng)目現(xiàn)場(chǎng)只能搭建有線工作網(wǎng)絡(luò),不得搭建無線網(wǎng),工作網(wǎng)絡(luò)、所有使用設(shè)備均必須與互聯(lián)網(wǎng)物理隔離。
6.檔案館安排專人進(jìn)行不定期現(xiàn)場(chǎng)巡查,發(fā)現(xiàn)問題及時(shí)告知公司項(xiàng)目負(fù)責(zé)人,督促公司糾正解決。
7.嚴(yán)禁公司將數(shù)字化的檔案電子目錄信息及電子檔案文件提供給第三方。
參考文獻(xiàn)
[1]檔案著錄規(guī)則(DA/T18-1999)[R].
[2]紙質(zhì)檔案數(shù)字化規(guī)范(DA/T31-2017)[R].
[3]企業(yè)數(shù)字檔案館(室)建設(shè)指南.