999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

庫藏檔案數(shù)字化質(zhì)量檢測(cè)初探

2016-03-16 01:05:04沈繼紅
環(huán)球市場(chǎng) 2016年18期
關(guān)鍵詞:頁面檢測(cè)

1.徐 媚 2.沈繼紅

1.國網(wǎng)新疆電力公司昌吉供電公司 2.國網(wǎng)新疆電力公司新湖供電公司

庫藏檔案數(shù)字化質(zhì)量檢測(cè)初探

1.徐 媚 2.沈繼紅

1.國網(wǎng)新疆電力公司昌吉供電公司 2.國網(wǎng)新疆電力公司新湖供電公司

針對(duì)國網(wǎng)昌吉供電公司庫藏檔案數(shù)字化過程中存在的數(shù)字化檔案掃描件檢測(cè)數(shù)量大、掃描件達(dá)標(biāo)率不高、工作效率低等問題,通過研發(fā)檢測(cè)工具,實(shí)際應(yīng)用,統(tǒng)一了數(shù)字化檔案掃描件的檢測(cè)標(biāo)準(zhǔn),降低了檔案工作人員檢測(cè)強(qiáng)度。

檔案;數(shù)字化;質(zhì)量檢測(cè)

前言:

隨著紙質(zhì)檔案數(shù)字化工作至上而下逐步的展開與完善,紙質(zhì)檔案如何通過現(xiàn)代計(jì)算機(jī)技術(shù)快速得到利用,是整個(gè)檔案行業(yè)所面臨的重大課題。國網(wǎng)公司自2010年開始在全系統(tǒng)實(shí)施檔案數(shù)字化,同步開展存量檔案數(shù)字化、增量檔案電子化工作。據(jù)統(tǒng)計(jì),截止到2014年年底,僅國網(wǎng)昌吉供電公司開展存量檔案數(shù)字化量就達(dá)383萬頁,2014年當(dāng)年增量數(shù)字化檔案達(dá)205萬頁。如此大量的數(shù)字化檔案是否符合《國家電網(wǎng)公司紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》是當(dāng)前檔案工作人員面臨的一個(gè)難題。

一、數(shù)字化檔案現(xiàn)狀

在人員、時(shí)間各方面條件有限的情況下,面對(duì)大量的數(shù)字化檔案,檔案工作人員在抽檢過程中發(fā)現(xiàn)很多數(shù)字化檔案的質(zhì)量不過關(guān),如:數(shù)字化檔案掃描件中存在大量黑點(diǎn)、掃描件傾斜角度過大、分辨率過高或過低、用真彩色或灰度的黑白掃描件代替黑白二值等現(xiàn)象。數(shù)字化的各項(xiàng)指標(biāo)只能憑借檔案工作人員肉眼識(shí)別,導(dǎo)致評(píng)判標(biāo)準(zhǔn)不統(tǒng)一,檢查方和移交方矛盾激化。

原因一是沒有統(tǒng)一的掃描軟件來滿足標(biāo)準(zhǔn)的需要;二是檢測(cè)的檔案人員沒有合適的檢測(cè)工具。尋找一種有效的方法(技術(shù)手段)快速檢測(cè)并挑出不符合標(biāo)準(zhǔn)的檔案掃描件,是當(dāng)前檔案數(shù)字化工作中的一大難題。

二、數(shù)字化檔案檢測(cè)方法

(一)數(shù)字化檔案掃描件主要存儲(chǔ)形式

1.以原始掃描圖像格式存儲(chǔ)。國家檔案局頒布的標(biāo)準(zhǔn),以單頁的TIFF格式文件和JPG格式文件進(jìn)行存儲(chǔ)和應(yīng)用。

2.以多頁TIFF文件格式存儲(chǔ)。是將原始掃描數(shù)據(jù)進(jìn)行二次加工,通過TIFF文件格式以多頁鏈表的特點(diǎn),將原始掃描圖像數(shù)據(jù)文件,添加轉(zhuǎn)換成TIFF文件的頁面中。

3.以多頁P(yáng)DF文件格式存儲(chǔ)。包括單圖像層和雙層兩種。將原始掃描圖像“腳本化”包裝處理后,合成到一個(gè)文件的頁面中。

目前國網(wǎng)公司文字材料類檔案統(tǒng)一采用的是多頁P(yáng)DF文件圖像頁面的檢查,在數(shù)字化檔案掃描件的檢測(cè)時(shí),需要在加載文件的同時(shí)獲取每一頁的圖像信息。

(二)數(shù)字化檔案掃描件檢測(cè)原理

針對(duì)上述的電子檔案掃描圖像的檢測(cè)指標(biāo),利用計(jì)算機(jī)軟件程序批量的來完成檢測(cè)任務(wù),是一種切實(shí)可行的辦法,其具體的方法和原理如下:

1.圖像顏色數(shù)的檢測(cè)。“黑白二值”圖像是指用于存放黑與白色像素?cái)?shù)量為“1bit”的圖像,一個(gè)字節(jié)可以存放8個(gè)像素點(diǎn)。彩色256色黑白圖和真彩色黑白圖的每像素所占的bit位數(shù),為8bit和24bit。可以直接從圖像的DIB數(shù)據(jù)結(jié)構(gòu)頭中,直接獲取出當(dāng)前讀取圖像的單位像素所占的bit數(shù)量,從而獲得圖像的顏色信息是否符合標(biāo)準(zhǔn)。檢測(cè)中發(fā)現(xiàn),很多用戶錯(cuò)將16/256色或真彩色黑白圖像當(dāng)作黑白二值圖像進(jìn)行存儲(chǔ),這是人工檢測(cè)時(shí)很難發(fā)現(xiàn)的問題。

2.圖像分辨率的檢測(cè)。對(duì)于原始數(shù)據(jù)(單頁的TIFF和JPG文件)和多頁TIFF文件而言,文件結(jié)構(gòu)本身內(nèi)置了分辨率字段,用來保存了掃描時(shí)填寫的圖像水平分辨率和垂直分辨率數(shù)值。要準(zhǔn)確的檢測(cè)出圖像分辨率,需要根據(jù)圖像尺寸來重新計(jì)算,A4頁面的尺寸為827x1169像素,水平方向分辨率=W/827*100,垂直方向分辨率=H/1169*100。由于掃描圖像在優(yōu)化處理過程中,圖像糾偏操作可造成圖像尺寸變大,圖像切變操作可造成圖像尺寸變小,因此,W/827和H/1169結(jié)果并非整數(shù),而是一個(gè)取值區(qū)間。在這個(gè)區(qū)間范圍內(nèi)的數(shù)值,所計(jì)算出來的分辨率是一個(gè)近似值,根據(jù)這個(gè)近似值所在頻帶來判斷圖像分辨率是否達(dá)標(biāo)。

3.圖像傾斜角度的檢測(cè)。檢測(cè)指標(biāo)主要針對(duì)黑白二值圖像的檢測(cè)操作。對(duì)于彩色圖像數(shù)據(jù),可以先進(jìn)行“高清化”處理,并將圖像底色替換為白色,將其轉(zhuǎn)換為文字內(nèi)容與底色有很高對(duì)比程度的圖像,然后再對(duì)其進(jìn)行黑白二值化轉(zhuǎn)換。先統(tǒng)計(jì)出水平和垂直方向上的“權(quán)值”數(shù)組,作為圖像內(nèi)容版面分析的原始依據(jù)。然后,在得到圖像內(nèi)容區(qū)間范圍內(nèi)順序采樣,并對(duì)每一份采樣矩陣中的數(shù)據(jù)進(jìn)行分析,最終計(jì)算得出整個(gè)頁面的平均斜率值,將該值轉(zhuǎn)換為圖像的傾斜角度,根據(jù)該角度值來是否符合標(biāo)準(zhǔn)。

4.圖像去污質(zhì)量檢測(cè)。指標(biāo)的檢測(cè),重點(diǎn)針對(duì)圖像黑邊框情況進(jìn)行檢測(cè),黑點(diǎn)的檢測(cè)目前還沒有足夠的理論依據(jù)。

5.圖像頁面是否加載的檢測(cè)。對(duì)于多頁的PDF格式文件,由于其使用的制作軟件不同,其頁面數(shù)據(jù)格式不完全相同。為了對(duì)掃描后圖像進(jìn)行優(yōu)化處理,很多制作軟件會(huì)在原有PDF頁面的基礎(chǔ)之上,插入修改過后的圖像數(shù)據(jù)節(jié)點(diǎn),用來保存修改痕跡;或者插入“Shape”繪圖節(jié)點(diǎn),來覆蓋掉圖像中的黑色邊框。加載PDF文件頁面的成功與否,直接影響到其它指標(biāo)項(xiàng)的檢測(cè)。

6.圖像圖層數(shù)量的檢測(cè)。對(duì)于多頁P(yáng)DF文件存儲(chǔ)的檔案圖像數(shù)據(jù),是通過加載PDF文件的交叉引用表(xref),來獲取每一頁圖像數(shù)據(jù)的Stream流對(duì)象,同時(shí)統(tǒng)計(jì)其數(shù)量。原始?xì)w檔的PDF文件應(yīng)該只有一個(gè)圖像層。可通過判斷圖像層數(shù)量的檢查,來確認(rèn)電子檔案是否被非法篡改過改,并進(jìn)一步確認(rèn)其真實(shí)性、可利用性。

7.文本層數(shù)據(jù)的檢測(cè)。雙層PDF文件,是指PDF文件中的每個(gè)頁面中會(huì)同時(shí)存在兩種類型數(shù)據(jù):一是光柵圖像數(shù)據(jù),二是矢量文本數(shù)據(jù)。通過將雙層PDF文件頁面中隱含的文字信息提取出來的方法,判斷其頁面中是否存在文字內(nèi)容。

結(jié)語:

國網(wǎng)昌吉供電公司通過檢測(cè)軟件的應(yīng)用,統(tǒng)一了數(shù)字化檔案掃描件的檢測(cè)標(biāo)準(zhǔn),降低了檔案工作人員檢測(cè)強(qiáng)度,提高了工作效率,同時(shí)也減少了檢測(cè)人與被檢測(cè)人直接矛盾關(guān)系。國家/行業(yè)標(biāo)準(zhǔn)的建立,需要有配套的檢測(cè)措施,才能更好為行業(yè)創(chuàng)造出更有價(jià)值的成果。數(shù)字化檔案掃描件是否符合標(biāo)準(zhǔn)、是否達(dá)標(biāo)的檢測(cè)方法和技術(shù)手段,是紙質(zhì)檔案數(shù)字化工作中必不可少的重要一環(huán)。

[1]《中央企業(yè)檔案信息化建設(shè)工作指引》(國資廳發(fā)[2014]2號(hào))

[2]《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》(GBDA/T31-2005)

[3]《PortableDocumentFormat-ReferenceManualVersion1.3》

[4]《國家電網(wǎng)公司紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》(Q/GDW135-2006)

猜你喜歡
頁面檢測(cè)
微信群聊總是找不到,打開這個(gè)開關(guān)就好了
大狗熊在睡覺
刷新生活的頁面
“不等式”檢測(cè)題
“一元一次不等式”檢測(cè)題
“一元一次不等式組”檢測(cè)題
“幾何圖形”檢測(cè)題
“角”檢測(cè)題
小波變換在PCB缺陷檢測(cè)中的應(yīng)用
同一Word文檔 縱橫頁面并存
主站蜘蛛池模板: 国产爽爽视频| 爆操波多野结衣| 天天摸天天操免费播放小视频| 五月天久久综合国产一区二区| 无码综合天天久久综合网| 国产精品久久精品| 久久久久青草大香线综合精品 | 99re精彩视频| 国产精品免费福利久久播放| 午夜精品福利影院| 国产裸舞福利在线视频合集| 亚洲中文精品人人永久免费| 无码网站免费观看| 国产va在线观看免费| 永久免费无码日韩视频| 久久无码av三级| 少妇被粗大的猛烈进出免费视频| 国产制服丝袜无码视频| 国产91精品久久| 亚洲综合二区| 一本大道视频精品人妻 | 男女精品视频| 男女性午夜福利网站| 制服丝袜 91视频| 日韩经典精品无码一区二区| 欧美成人一区午夜福利在线| 99激情网| 亚洲a级在线观看| 久久这里只有精品国产99| 婷婷成人综合| 国产第一页第二页| 免费国产小视频在线观看| 自慰高潮喷白浆在线观看| 精品国产成人a在线观看| 一级毛片视频免费| 日韩视频精品在线| 亚洲人精品亚洲人成在线| 国产成人免费高清AⅤ| 91探花在线观看国产最新| 中文字幕 91| 国产精品久久久久无码网站| 无遮挡一级毛片呦女视频| 国产黄色片在线看| 日本日韩欧美| 伊人成人在线视频| 欧美人人干| 婷婷亚洲天堂| 天天摸夜夜操| 一级全黄毛片| 国产AV毛片| 亚洲成A人V欧美综合| 久久久久久久久久国产精品| 国产精品极品美女自在线看免费一区二区| 亚洲国产综合精品一区| 国产三级精品三级在线观看| 日本午夜精品一本在线观看 | 免费在线成人网| 四虎永久免费地址| 鲁鲁鲁爽爽爽在线视频观看| 国产美女91视频| 亚洲美女视频一区| 欧美在线导航| 亚洲一区二区三区中文字幕5566| 欧美不卡视频一区发布| 成人福利在线观看| 色欲不卡无码一区二区| 国产一区成人| 亚洲成a人片| 无码专区在线观看| 久久精品国产91久久综合麻豆自制| 新SSS无码手机在线观看| 国产一区亚洲一区| 欧美一区福利| 51国产偷自视频区视频手机观看| 九色最新网址| 欧美成人h精品网站| 亚洲成a∧人片在线观看无码| 54pao国产成人免费视频 | 欧美亚洲综合免费精品高清在线观看 | 毛片一级在线| 国产噜噜在线视频观看| …亚洲 欧洲 另类 春色|