999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

電子檔案文件格式登記與管控系統(tǒng)構(gòu)建*

2023-03-13 01:30:56張照余
檔案與建設(shè) 2023年2期
關(guān)鍵詞:數(shù)據(jù)庫功能信息

周 祺 張照余

(蘇州大學(xué)社會學(xué)院,江蘇蘇州,215008)

一、文件格式登記與管控之緣起

電子文件具有對其初始技術(shù)環(huán)境的依賴性,合理選擇歸檔文件格式,加強(qiáng)對文件格式的管控,可以降低這種依賴性,延長歸檔文件的技術(shù)生命,并有助于在現(xiàn)有格式徹底淘汰前建立起可行的遷移途徑,通過格式轉(zhuǎn)換延展歸檔電子文件的壽命。文件格式登記與管控系統(tǒng),是電子文件的格式數(shù)據(jù)庫,通過共建共享方式集中收錄所有館藏電子檔案的文件格式信息,跟蹤記錄每種格式的升級迭代及其技術(shù)環(huán)境的更新變化,基于量化分析對各種文件格式的長期保管風(fēng)險進(jìn)行科學(xué)評估,并給出危險格式的轉(zhuǎn)換目標(biāo)格式及其遷移手段。文件格式登記與管控系統(tǒng)不僅是一個在線的文件格式信息庫,更是一個格式研究評價中心,擁有登記、管控、跟蹤、評估各類電子文件格式及其技術(shù)環(huán)境動態(tài)變化的一系列功能。

開發(fā)建設(shè)文件格式登記與管控系統(tǒng)是國際檔案界普遍認(rèn)同的電子檔案長久保管策略之一。英國國家檔案館(TNA)早在 2012年創(chuàng)建了格式登記系統(tǒng)PRONOM (Digital Format Database),并開發(fā)DROID(Digital Record Object Identification)工具用于識別歸檔文件的格式信息。[1]美國國家檔案與文件署(NARA)則在2018年設(shè)立了格式概覽(Format Profile)項目,該項目在系統(tǒng)分析格式風(fēng)險的基礎(chǔ)上列舉出10種最不宜歸檔的文件格式。[2]2021年,中辦國辦印發(fā)《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》,明確“深入推進(jìn)檔案安全體系建設(shè),加強(qiáng)電子檔案長期保存技術(shù)和管理研究”。格式管控關(guān)乎電子檔案長期保存問題已在我國檔案學(xué)界達(dá)成共識,并逐步形成了歸檔文件格式規(guī)范,但在實踐中我國尚未建立全國性的格式登記與管控體系。本文在借鑒國外實踐的基礎(chǔ)上,對我國電子檔案文件格式登記與管控系統(tǒng)(Format Register and Monitor System,簡稱FRMS)進(jìn)行了初步構(gòu)想和模型設(shè)計,以期為該系統(tǒng)的開發(fā)落地提供參照。

二、文件格式登記與管控系統(tǒng)之運行

建設(shè)開發(fā)電子檔案的文件格式登記與管控系統(tǒng),首先要明確其建設(shè)開發(fā)的實施主體和系統(tǒng)的適用范圍,并且建立起長期有效的運行機(jī)制來確保其可持續(xù)性。所謂實施主體就是由誰來建設(shè)和維護(hù)的問題,而適用范圍則是規(guī)定該系統(tǒng)的服務(wù)對象和服務(wù)領(lǐng)域。

筆者認(rèn)為,國家檔案主管機(jī)關(guān)是最理想的實施主體。由于我國尚未對歸檔格式的背景數(shù)據(jù)進(jìn)行全面登記和管控,因此,由國家檔案主管機(jī)關(guān)作為實施主體牽頭創(chuàng)建并運行該系統(tǒng),具有較強(qiáng)的組織號召力和資源把控優(yōu)勢。除此以外,非官方的社會組織、檔案研究機(jī)構(gòu)、檔案服務(wù)公司等也可實施或參與電子檔案格式登記與管控系統(tǒng)的開發(fā)與運行,利用自身技術(shù)、資源及經(jīng)驗優(yōu)勢,以公益或市場化的運作模式建立區(qū)域乃至全國性的電子檔案文件格式登記與管控系統(tǒng)及其運作體系。

電子檔案文件格式登記與管控系統(tǒng),可以也應(yīng)當(dāng)面向全國各級各類檔案管理機(jī)構(gòu),包括檔案館、檔案室以及圖書館、數(shù)據(jù)中心等相關(guān)領(lǐng)域,其基礎(chǔ)數(shù)據(jù)來源越廣,數(shù)據(jù)的共享面越大,數(shù)據(jù)分析的準(zhǔn)確度就越高,系統(tǒng)實施效果和社會效益也越發(fā)顯著。無論建設(shè)主體是誰,也無論采取何種運營模式,共建共享始終是電子檔案文件格式登記與管控系統(tǒng)的建設(shè)原則。

三、文件格式登記與管控系統(tǒng)之要件

對比國外已有格式登記與管控系統(tǒng),該系統(tǒng)集合了格式登記、格式識別/格式驗證、格式風(fēng)險評估等功能于一體,具有較強(qiáng)的綜合性、動態(tài)性與研究性。其中,準(zhǔn)確獲取文件格式信息是文件格式登記與管控系統(tǒng)有效運轉(zhuǎn)的基礎(chǔ),以下要素構(gòu)成文件格式登記與管控系統(tǒng)開發(fā)運行的前置要件。

1.文件格式的唯一標(biāo)識符

首先要建立或選擇涵蓋面廣并被普遍接受的文件格式標(biāo)識體系,據(jù)此為每種格式及其不同版本做標(biāo)識符,將該標(biāo)識符作為每種格式在系統(tǒng)中的唯一ID。這類似于數(shù)據(jù)庫中每組字段的唯一主鍵。特別說明的是,格式標(biāo)識符的編號方式應(yīng)體現(xiàn)該格式的類型、格式屬性、版本關(guān)系。

2.文件格式識別工具

格式識別工具(模塊)是文件格式登記與管控系統(tǒng)(FRMS)的重要組成部分,其識別結(jié)果將作為文件類別與格式風(fēng)險判斷的依據(jù)。據(jù)國外研究,一般有三種方式識別文件格式:第一種是通過文件自帶的擴(kuò)展名判斷;第二種是通過機(jī)器可識別的MIME型元數(shù)據(jù)判斷;第三種是通過文件二進(jìn)制代碼包含的有關(guān)格式數(shù)據(jù)或特征信息來判別。[3]系統(tǒng)也可以引用已有的開源格式識別軟件的源代碼來幫助實現(xiàn)格式識別功能。

3.文件格式清單

格式清單是以格式登記庫(Format Registry,簡稱FR)數(shù)據(jù)為對象,基于格式技術(shù)環(huán)境分析和安全風(fēng)險評估而生成的動態(tài)反映各種格式安全性的數(shù)據(jù)庫。它在系統(tǒng)的數(shù)據(jù)存儲中是以一張數(shù)據(jù)表的形式存在,因此在系統(tǒng)設(shè)計層面也稱其為“格式清單表”。按照格式風(fēng)險等級可劃分為 “推薦格式清單庫”“危險格式清單庫”等,它是評判某種文件格式是否適合歸檔的科學(xué)依據(jù),同時也是檔案庫定期檢測格式安全性的參照標(biāo)準(zhǔn)。格式管控中心必須在每次格式風(fēng)險評估后定期更新這些格式清單,以為檔案館(室)實施電子文件歸檔和電子檔案格式轉(zhuǎn)換提供指南,實現(xiàn)對歸檔文件格式的風(fēng)險管控和安全預(yù)警。

四、文件格式登記與管控系統(tǒng)之設(shè)計

1.FRMS的功能模塊

按照軟件開發(fā)結(jié)構(gòu)化模型——瀑布模型(SDLC)的設(shè)計方法,在FRMS的設(shè)計與開發(fā)之前首先需要明確該系統(tǒng)的功能要素。總體來說,F(xiàn)RMS系統(tǒng)需要幫助用戶實現(xiàn)格式信息的查詢/登記、文件格式識別、危險格式文件遷移等命令,此外它還可以自動監(jiān)測電子檔案數(shù)據(jù)庫中的格式信息,統(tǒng)計危險格式文件數(shù)量并通知用戶。吸收PRONOM等國外格式登記系統(tǒng)的功能設(shè)計理念,結(jié)合格式登記與管控的策略需要,將FRMS的功能總體上分為以下八個模塊。這些功能的運行以“格式登記庫(FR)”及系統(tǒng)中建立的“推薦/可接受/危險格式清單表”“格式轉(zhuǎn)換器清單表”等前期建立的基礎(chǔ)數(shù)據(jù)為支撐。

一是“文件導(dǎo)入”模塊。用戶將擬歸檔進(jìn)入文件存儲系統(tǒng)的電子文件或已歸檔的電子文件通過單獨或批量上傳的方式導(dǎo)入FRMS的功能。二是“格式登記”模塊。用戶提交與文件格式相關(guān)的信息來更新文件格式數(shù)據(jù)庫的功能,通過不斷增加新出現(xiàn)的文件格式及格式信息來提高系統(tǒng)格式信息的全面性與專業(yè)性。三是“格式識別”模塊。識別用戶導(dǎo)入FRMS的電子文件格式并匹配格式登記庫中格式信息的過程,它是判斷文件格式風(fēng)險的前提。四是“格式查詢”模塊。用戶檢索FRMS中的格式信息以及兼容格式的軟件信息,并以瀏覽界面與檢索框并存的形式展示于系統(tǒng)首頁。其中檢索項可設(shè)置為“格式類型”“格式名稱”“擴(kuò)展名”“軟件名”等。五是“格式風(fēng)險評估”模塊。依據(jù)風(fēng)險評估指標(biāo)體系分析每種格式的“格式風(fēng)險等級”,以此來判斷文件格式的安全性,它是決定是否進(jìn)行格式轉(zhuǎn)換的關(guān)鍵。六是“格式轉(zhuǎn)換/遷移”模塊。有將風(fēng)險評估為“危險”級別的文件轉(zhuǎn)換為相應(yīng)的“低危或無風(fēng)險”格式文件的功能。七是“危險格式預(yù)警”模塊。格式轉(zhuǎn)換后的文件如果無法轉(zhuǎn)換為“格式清單”中可接受格式或轉(zhuǎn)換后出現(xiàn)文件本身不可讀的現(xiàn)象,如出現(xiàn)亂碼等,系統(tǒng)將發(fā)出“危險格式預(yù)警”信號,提醒管理人員格式轉(zhuǎn)換失敗。八是“歸檔”模塊。將已具備“可接受格式”或“推薦格式”等級的電子文件及其元數(shù)據(jù)傳輸至電子檔案管理系統(tǒng)內(nèi)的過程。該模塊考慮到與檔案保存系統(tǒng)兼容,盡可能與其保持功能一致,以保護(hù)文件完整與安全。模塊擬具備電子文件“四性檢測”功能,可將原始文件、格式轉(zhuǎn)換后的文件以及各格式下的元數(shù)據(jù)完整歸檔。

2.FRMS的運行流程與權(quán)限設(shè)置

(1)活動流程分析。FRMS的活動流程符合OAIS參考模型中的電子檔案管理邏輯,以便在電子文件管理的同時對格式進(jìn)行管控。同時將格式管控流程納入電子文件管理,從而拓寬OAIS模型對于“長久保存計劃”的含義。流程中共有兩條路徑對文件格式進(jìn)行風(fēng)險管控:對于尚未歸檔的增量(零散)電子文件來說,用戶將電子文件導(dǎo)入FRMS后,系統(tǒng)將對其進(jìn)行格式識別,將可以識別得到的結(jié)果與各格式清單庫進(jìn)行比對,符合推薦格式的文件將直接歸檔;若屬于危險格式,尤其是高危格式則需進(jìn)行格式轉(zhuǎn)換(遷移)后進(jìn)行歸檔。對于已經(jīng)歸檔的存量電子文件來說,系統(tǒng)需要根據(jù)“危險格式清單”定期檢索電子檔案管理系統(tǒng)內(nèi)的電子檔案,通過檔案管理系統(tǒng)的格式索引批量識別危險格式文件,并對檢索出來的危險格式進(jìn)行格式遷移,以將檔案庫內(nèi)的文件格式控制在安全范圍。檢索周期可根據(jù)格式清單庫的更新頻率、政府或機(jī)構(gòu)公布的格式策略(或標(biāo)準(zhǔn))而定,也可以根據(jù)服務(wù)器的忙碌程度而定。

格式登記庫(FR)作為FRMS重要的后臺數(shù)據(jù)庫,其數(shù)據(jù)來源于兩個渠道。第一個是系統(tǒng)普通用戶或歸檔業(yè)務(wù)人員申請登記格式信息,由電子檔案管理員審核格式信息的準(zhǔn)確性與標(biāo)準(zhǔn)性,如果符合登記標(biāo)準(zhǔn)則格式信息直接進(jìn)入庫內(nèi),不符合則登記失敗;第二個是電子檔案管理員可以直接登記格式信息,更新格式數(shù)據(jù)庫的信息。其中在上傳電子文件時,無法進(jìn)行格式識別的用戶也可以進(jìn)行登記或申請登記格式數(shù)據(jù)。登記的格式應(yīng)符合“歸檔范圍適用性原則”“文件格式分類管控原則”及“格式轉(zhuǎn)換前后檔案內(nèi)容等價原則”并且應(yīng)擁有自身格式標(biāo)準(zhǔn),符合FR數(shù)據(jù)庫的屬性,做到真實、準(zhǔn)確、有跡可循。

(2)用例分析。根據(jù)角色的不同將系統(tǒng)功能劃分成不同使用權(quán)限。將使用FRMS的角色分為“角色1”“角色2”“角色3”三類。依據(jù)系統(tǒng)功能概要,F(xiàn)RMS的用例有“上傳電子文件” “更新FR” “查詢FR”“審核格式信息”等10個。角色1現(xiàn)實中的身份是電子檔案管理人員,他們負(fù)責(zé)歸檔電子文件的管理工作,其中包括文件的格式風(fēng)險控制,因此這類用戶的功能權(quán)限全面且貫穿格式登記與管控的全流程,權(quán)限級別最高。角色2現(xiàn)實中的身份是業(yè)務(wù)人員,他們的部分工作是負(fù)責(zé)一個部門或一個機(jī)構(gòu)的電子文件收集與歸檔,不具備檔案管理的職能。在歸檔階段需要了解歸檔格式要求,查看“推薦/危險”格式清單,必要時需將危險格式進(jìn)行轉(zhuǎn)換,以保證歸檔質(zhì)量。因此這類用戶權(quán)限級別低一級。角色3現(xiàn)實中相當(dāng)于檔案管理工作之外的普通用戶,在其日常工作中沒有文件歸檔職能,但使用FRMS可以幫助他們查詢現(xiàn)有格式信息,識別手頭文件的格式并進(jìn)行簡單的格式轉(zhuǎn)換。FRMS向大眾開放可以有效地起到“格式風(fēng)險”知識普及的作用。因此可以幫助普通用戶解決部分“格式問題”。

圖1 FRMS數(shù)據(jù)流圖(DFD)

3.邏輯功能架構(gòu)

系統(tǒng)的邏輯功能是根據(jù)需求概要分析系統(tǒng)內(nèi)部功能之間以及與外部實體的交互關(guān)系。根據(jù)設(shè)計規(guī)劃,F(xiàn)RMS的邏輯功能以繪制三層數(shù)據(jù)流圖來描述。(見圖1)

4.系統(tǒng)數(shù)據(jù)建模

從邏輯功能架構(gòu)分析可知,F(xiàn)RMS大概需要五個數(shù)據(jù)存儲。它們由數(shù)據(jù)庫或數(shù)據(jù)表組成。數(shù)據(jù)庫是表的集合,表用來描述與存儲數(shù)據(jù)及其元數(shù)據(jù)。本節(jié)針對FRMS數(shù)據(jù)存儲中“格式登記庫(FR)”以及“格式清單表”“格式轉(zhuǎn)換器表”進(jìn)行設(shè)計建模。由于這三個數(shù)據(jù)存儲設(shè)計關(guān)乎電子檔案文件格式的登記策略與風(fēng)險控制,因此良好的設(shè)計方案尤為重要。

(1)格式登記庫設(shè)計格式。登記庫(Format Registry,F(xiàn)R)是一個可以存儲、發(fā)現(xiàn)和提供有關(guān)電子檔案文件格式信息服務(wù)的關(guān)系型數(shù)據(jù)庫模型。它是由多個數(shù)據(jù)表組成的,該登記庫亦可通過網(wǎng)絡(luò)界面實現(xiàn)格式數(shù)據(jù)的檢索與更新。一是概念設(shè)計。數(shù)據(jù)庫的概念設(shè)計一般通過E-R圖表達(dá)。據(jù)筆者研究,F(xiàn)R需要建立四個實體和三種關(guān)系,分別是“格式”與“查看器”的相關(guān)關(guān)系、“格式”與“格式類型”的所屬關(guān)系以及“查看器”與“開發(fā)商”的開發(fā)關(guān)系。這樣設(shè)計的原因概括為兩點:第一,對電子文件來說僅記錄格式本身的信息是不充分的,記錄查看器及其開發(fā)商的信息可以更全面地判斷格式風(fēng)險;第二,文件格式需要分類、分專業(yè)管控,因此單獨設(shè)計一個“格式類型”實體與“格式”實體相關(guān)聯(lián)。此外,各實體(或關(guān)系)屬性的數(shù)量體現(xiàn)出格式元數(shù)據(jù)信息的粒度大小,映射到數(shù)據(jù)表中是各條數(shù)據(jù)的字段,因此需要全面地考慮屬性問題。FR的屬性數(shù)量與定義設(shè)計見圖2,其中“格式ID”字段是唯一識別符。二是邏輯設(shè)計。將FR的E-R模型轉(zhuǎn)化為關(guān)系模式,分別得到格式表、查看器表、格式類型表和開發(fā)商表。

(2)格式清單表和格式轉(zhuǎn)換器表設(shè)計。格式清單表是格式風(fēng)險評估結(jié)果的數(shù)據(jù)體現(xiàn)。根據(jù)文件格式屬性與評估結(jié)果所需數(shù)據(jù),將該數(shù)據(jù)表的邏輯結(jié)構(gòu)設(shè)計如下:格式風(fēng)險評估結(jié)果形成的格式清單按照危險程度區(qū)分,即“推薦格式清單”“可接受格式清單”和“危險格式清單”。因此數(shù)據(jù)表中“危險級別”字段下的條目設(shè)置將與以上三種危險程度相對應(yīng)。若想單獨生成各危險級別的清單時用庫內(nèi)的“查詢(select)”語句即可。不同危險程度的格式清單形成知識庫應(yīng)用于各個場景。

格式轉(zhuǎn)換器表的作用是存儲經(jīng)過測試后的格式轉(zhuǎn)換器信息,在格式轉(zhuǎn)換(遷移)之前方便用戶以最快的速度選擇符合適用范圍的轉(zhuǎn)換工具。根據(jù)“格式轉(zhuǎn)換前后內(nèi)容一致性”原則,轉(zhuǎn)換器表中需設(shè)置“轉(zhuǎn)換器描述”字段,以方便錄入各個轉(zhuǎn)換器使用后質(zhì)量損失與功能損失情況數(shù)據(jù)。

圖2 FR數(shù)據(jù)庫E-R圖

5.系統(tǒng)非功能需求

觀感(界面)需求方面,要求系統(tǒng)界面簡潔、顏色友好、功能清晰、操作簡單。為方便用戶使用,頁面中需要放置格式信息的檢索框和格式類目導(dǎo)航且首頁展示系統(tǒng)的主要功能模塊。系統(tǒng)性能方面,要求FRMS運行穩(wěn)定,有一定的容錯能力和可擴(kuò)展能力。同時要保證自身系統(tǒng)與電子檔案管理系統(tǒng)的數(shù)據(jù)安全。用戶交互模式選擇方面,為了更方便地維護(hù)與開發(fā)且不受操作系統(tǒng)的影響,F(xiàn)RMS采用B/S的架構(gòu),用戶通過瀏覽器即可完成數(shù)據(jù)交互。開發(fā)時采用體積小、速度快、成本低的MySQL數(shù)據(jù)庫,它搭配 PHP和Apache服務(wù)器即可組成良好的開發(fā)環(huán)境。

猜你喜歡
數(shù)據(jù)庫功能信息
也談詩的“功能”
中華詩詞(2022年6期)2022-12-31 06:41:24
關(guān)于非首都功能疏解的幾點思考
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(jīng)(2016年6期)2016-02-24 07:41:51
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
中西醫(yī)結(jié)合治療甲狀腺功能亢進(jìn)癥31例
辨證施護(hù)在輕度認(rèn)知功能損害中的應(yīng)用
主站蜘蛛池模板: 午夜国产理论| 91久久偷偷做嫩草影院精品| 香蕉在线视频网站| 亚洲成人免费看| 婷婷色一区二区三区| 伊人激情综合| 在线色国产| 无码高潮喷水专区久久| 性欧美久久| 一区二区三区四区精品视频 | 精品视频一区二区观看| 国产在线小视频| 欧洲日本亚洲中文字幕| 国产免费久久精品99re不卡| 国产视频a| 无码免费视频| 午夜无码一区二区三区| 精品少妇人妻av无码久久| 亚洲综合婷婷激情| 亚洲91在线精品| 制服丝袜 91视频| 国内丰满少妇猛烈精品播| 国产成人亚洲无吗淙合青草| 91视频区| 97国产在线视频| 亚洲九九视频| 国产网友愉拍精品视频| 精品色综合| 亚洲区一区| 亚洲天堂网在线视频| 亚洲精品va| 午夜啪啪网| av色爱 天堂网| 伊人精品视频免费在线| 国产一区二区免费播放| 欧美日韩中文字幕在线| 欧美黑人欧美精品刺激| 97久久人人超碰国产精品| 亚洲码在线中文在线观看| 97se亚洲综合不卡| 四虎永久免费在线| 波多野结衣一二三| 亚洲国产成人久久77| 国产91色在线| A级毛片无码久久精品免费| 中文字幕佐山爱一区二区免费| 最新无码专区超级碰碰碰| 三上悠亚精品二区在线观看| 制服丝袜无码每日更新| 亚洲91在线精品| 国产精品亚洲va在线观看| 欧美精品导航| 亚洲无码高清免费视频亚洲| 97国产在线视频| 2022国产91精品久久久久久| 老司机久久精品视频| 日本精品视频| 欧美97色| 久久99蜜桃精品久久久久小说| 国产91视频观看| 免费看黄片一区二区三区| 国产aⅴ无码专区亚洲av综合网| 999国产精品| 小蝌蚪亚洲精品国产| 丰满人妻久久中文字幕| 久久夜色精品国产嚕嚕亚洲av| 三级欧美在线| 呦女精品网站| 国产黄视频网站| 国产美女免费网站| 亚洲av片在线免费观看| 美女被操91视频| 99久久国产自偷自偷免费一区| 亚洲一级毛片在线观| 青青热久免费精品视频6| 91精品国产91久无码网站| 99精品国产高清一区二区| 国产精品妖精视频| 91网址在线播放| 亚洲色成人www在线观看| 日韩欧美中文| 日韩在线观看网站|