999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

檔案數(shù)據(jù)化管理的實(shí)現(xiàn)路徑研究

2021-11-26 07:48:54徐欽梅福建警察學(xué)院
浙江檔案 2021年12期
關(guān)鍵詞:管理

■ 徐欽梅/福建警察學(xué)院

■ 戴 敏/福建省檔案館

按傳統(tǒng)整理方式,檔案以“卷”或“件”的形式存在。從人們寫作閱讀的思維習(xí)慣來(lái)看,一份公文或一篇文章即是一“件”。案卷則是為了方便管理和利用,把內(nèi)容或邏輯相關(guān)的檔案進(jìn)行歸類形成的聚合體。隨著計(jì)算機(jī)技術(shù)引入檔案工作,人們開(kāi)始從數(shù)據(jù)維度審視檔案工作。早期計(jì)算機(jī)分析處理能力不夠強(qiáng),相關(guān)的技術(shù)和工具也尚未產(chǎn)生,當(dāng)時(shí)計(jì)算機(jī)對(duì)檔案工作的主要作用體現(xiàn)在按傳統(tǒng)整理方式建立相應(yīng)的目錄和原文數(shù)據(jù)庫(kù)以提供利用。進(jìn)入21世紀(jì),隨著大數(shù)據(jù)、人工智能等技術(shù)不斷迭代發(fā)展,檔案工作逐漸打破以“件”為最小處理單元的傳統(tǒng)思路。檔案尤其是其內(nèi)容文本,不應(yīng)僅僅滿足于數(shù)字化管理,更應(yīng)實(shí)現(xiàn)數(shù)據(jù)化管理,融入“大數(shù)據(jù)”集合,為各類服務(wù)提供數(shù)據(jù)支撐。為此,新時(shí)代檔案工作者必須要在新的數(shù)據(jù)視角下探索檔案數(shù)據(jù)化管理。

1 檔案數(shù)據(jù)化管理的現(xiàn)實(shí)意義

1.1 檔案與數(shù)據(jù)底層邏輯的關(guān)聯(lián)

傳統(tǒng)意義上的檔案不同于其他信息的特征,在于其“原始記錄性”,強(qiáng)調(diào)其記錄性和保存價(jià)值。隨著計(jì)算機(jī)技術(shù)的發(fā)展,大量自動(dòng)化或半自動(dòng)化的設(shè)備本身即具有記錄功能,逐漸擴(kuò)大了記錄的外延。廣義上,數(shù)據(jù)是指對(duì)客觀事物的邏輯歸納,是表示客觀事物的未經(jīng)加工的原始素材,經(jīng)過(guò)加工成為信息。由此可見(jiàn),數(shù)據(jù)也具有原始性(當(dāng)然,數(shù)據(jù)的原始性與檔案的原始性還有所不同,數(shù)據(jù)的原始性主要是指其未經(jīng)過(guò)分析處理,而檔案的原始性是指其在記錄上是第一手的,兩者的區(qū)別在于數(shù)據(jù)的原始性更加原始,因?yàn)橐话愣詸n案還經(jīng)過(guò)了人為或設(shè)備的分析處理),同時(shí)數(shù)據(jù)背后是對(duì)事物的理解,因此數(shù)據(jù)是有邏輯關(guān)系或規(guī)則的。在計(jì)算機(jī)科學(xué)中,數(shù)據(jù)又特指所有能輸入計(jì)算機(jī)并被計(jì)算機(jī)程序處理的符號(hào)的介質(zhì)的總稱。由于計(jì)算機(jī)存儲(chǔ)和處理的對(duì)象日益廣泛,因此客觀世界基本可以映射進(jìn)計(jì)算機(jī)的虛擬世界,同時(shí)以數(shù)據(jù)形式收集整理的各類信息資料可以借助計(jì)算機(jī)技術(shù)進(jìn)行分析處理。

因此檔案屬于廣義的數(shù)據(jù),而且是一類重要的數(shù)據(jù)。除了其原始記錄性以外,檔案不同于“離散”的數(shù)據(jù),它是經(jīng)過(guò)整理的、有專門機(jī)構(gòu)及人員管理的規(guī)范數(shù)據(jù),這無(wú)疑為檔案實(shí)現(xiàn)數(shù)據(jù)化管理提供了便利。檔案數(shù)據(jù)與電子檔案是同一事物不同顆粒度的概念,但檔案數(shù)據(jù)的范圍更廣泛和復(fù)雜,它還包含了檔案相關(guān)的數(shù)據(jù)以及非電子形態(tài)存在的數(shù)據(jù)。同時(shí),隨著檔案從“數(shù)字化”到“數(shù)據(jù)化”進(jìn)程的加快,檔案以計(jì)算機(jī)領(lǐng)域的數(shù)據(jù)為形式進(jìn)行處理也日益普遍。而數(shù)據(jù)形式的檔案與文檔形式的檔案雖然可能同樣是“數(shù)字態(tài)”(區(qū)別于“模擬態(tài)”,即模擬信息),其根本區(qū)別在于底層顆粒度的不同。與物理世界的開(kāi)發(fā)取決于可操作的最底層物質(zhì)結(jié)構(gòu)一樣,信息的顆粒度直接影響虛擬世界信息處理的效率和層級(jí)[1]。因此,檔案數(shù)據(jù)化管理意味著檔案數(shù)據(jù)工作由傳統(tǒng)到粗粒度的文檔管理逐步過(guò)渡到細(xì)粒度、智能化的數(shù)據(jù)管理服務(wù),更好地實(shí)現(xiàn)檔案管理內(nèi)部的現(xiàn)代化和外部的精準(zhǔn)高效化。

1.2 檔案來(lái)源數(shù)據(jù)化的倒逼

隨著大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)等數(shù)據(jù)技術(shù)應(yīng)用的日益普遍化,檔案的來(lái)源也呈現(xiàn)數(shù)據(jù)化趨勢(shì)。如福建省在全國(guó)率先推行電子證照應(yīng)用,電子證照數(shù)據(jù)源源不斷生成,其基本模式為“證照模板+數(shù)據(jù)庫(kù)”。證照模板相對(duì)固定,這樣就不用存放大量的非結(jié)構(gòu)化證照?qǐng)D文,而且在利用上數(shù)據(jù)化的證照信息更便于檢索、統(tǒng)計(jì)、分析[2]。類似的還有電子發(fā)票、工程檔案、醫(yī)療檔案等。數(shù)據(jù)化帶來(lái)的便利性使得前端文件管理和系統(tǒng)建設(shè)已經(jīng)數(shù)據(jù)化了,而檔案管理卻相對(duì)落后,無(wú)法滿足政府部門“放管服”改革和大數(shù)據(jù)發(fā)展等的戰(zhàn)略要求。因此需要推進(jìn)檔案數(shù)據(jù)化管理,實(shí)現(xiàn)數(shù)據(jù)時(shí)代文檔管理的“一體化”及檔案管理對(duì)象和檔案管理模式的匹配,推動(dòng)新時(shí)代檔案工作高質(zhì)量發(fā)展。

1.3 解決檔案服務(wù)供需失衡的迫切要求

隨著人民群眾對(duì)個(gè)人權(quán)益和文化生活的日益重視,以及檔案工作服務(wù)中心大局的作用日益凸顯,檔案服務(wù)也日趨多元化,精準(zhǔn)的定制化檔案服務(wù)成為人們對(duì)檔案服務(wù)提出的新的現(xiàn)實(shí)要求。目前傳統(tǒng)的檔案服務(wù)存在以下問(wèn)題:一是未能實(shí)現(xiàn)精準(zhǔn)服務(wù)。查詢利用的工具主要是檔案目錄,摘要和全文較少,因此很難在海量數(shù)據(jù)中準(zhǔn)確找到所需數(shù)據(jù),如利用者想要利用文件中的某個(gè)信息點(diǎn),而該信息也可能存放在多份文件中,傳統(tǒng)的服務(wù)方式是通過(guò)檢索文件目錄信息查找到這些文件,再讓利用者逐份查看確認(rèn),這種做法既低效又不準(zhǔn)確。此外,由于文件的開(kāi)放控制是基于整份文件進(jìn)行劃分的,這也限制了利用者對(duì)文件中某些開(kāi)放信息的使用。二是未能實(shí)現(xiàn)智能化知識(shí)服務(wù)。傳統(tǒng)服務(wù)方式只能把檔案原文調(diào)出來(lái),讓用戶自行分析整合信息,而不能基于數(shù)據(jù)和用戶需求智能生成定制化信息和進(jìn)行知識(shí)服務(wù),這在編史修志、文化研究或其他檔案信息深度開(kāi)發(fā)利用中弊端尤為明顯[3]。這類問(wèn)題導(dǎo)致的檔案服務(wù)中需求與供給不匹配現(xiàn)象,可稱為檔案服務(wù)供需失衡。

因此,要解決檔案服務(wù)供需失衡的現(xiàn)實(shí)問(wèn)題,提升檔案服務(wù)水平,需要實(shí)現(xiàn)檔案數(shù)據(jù)化管理,在此基礎(chǔ)上開(kāi)展以數(shù)據(jù)為顆粒度的檔案信息服務(wù),這樣不但可支持全文、全庫(kù)檢索,也支持關(guān)聯(lián)信息的推薦,還可生成滿足用戶需求的定制化信息,具有重要的現(xiàn)實(shí)意義[4]。

2 檔案數(shù)據(jù)化管理研究現(xiàn)狀和主要問(wèn)題

從大數(shù)據(jù)對(duì)檔案管理工作帶來(lái)沖擊開(kāi)始,檔案數(shù)據(jù)化管理就日益為檔案工作者重視。但現(xiàn)有研究主要是關(guān)于檔案數(shù)據(jù)資源的,部分涉及檔案服務(wù),關(guān)于檔案數(shù)據(jù)化管理的文獻(xiàn)較少。總體來(lái)看,這些文章主要是將檔案數(shù)據(jù)化管理作為檔案工作的前沿方向進(jìn)行研究,從思維、范式、轉(zhuǎn)型或某個(gè)視角進(jìn)行闡述,較少探討實(shí)現(xiàn)路徑,未提出較為系統(tǒng)完整的實(shí)現(xiàn)路徑[5][6][7]。

綜合文獻(xiàn)來(lái)看,目前檔案數(shù)據(jù)化管理在實(shí)踐層面不夠充分,主要在電子發(fā)票、電子證照、工程檔案、科研檔案等本身來(lái)源就已數(shù)據(jù)化的電子檔案中開(kāi)展。制約檔案數(shù)據(jù)化管理的主要問(wèn)題在于:一是未完全實(shí)現(xiàn)從數(shù)據(jù)思維的視角收集和管理檔案。如一般要求將電子文件轉(zhuǎn)化為圖片或者版式文檔的檔案數(shù)據(jù),這類檔案數(shù)據(jù)從人類閱讀的角度看可能較為直觀,但從計(jì)算機(jī)分析的角度則較為不便。二是以數(shù)據(jù)為顆粒度的電子檔案標(biāo)準(zhǔn)未能盡早確立,絕大部分相關(guān)標(biāo)準(zhǔn)依然是以“件”為主體而非以數(shù)據(jù)為主體考慮問(wèn)題,尚未脫離將文件作為整體的管理思維,這導(dǎo)致檔案數(shù)據(jù)雖然在利用方面更有優(yōu)勢(shì),但在憑證性上得不到相關(guān)方面的支持,因此其服務(wù)范圍受到限制。三是傳統(tǒng)手寫體檔案的OCR識(shí)別率較低,提取數(shù)據(jù)文本多需要人工配合,工作效率較低,往往只能針對(duì)某類特別重要的檔案開(kāi)展專項(xiàng)工作。

3 實(shí)現(xiàn)檔案數(shù)據(jù)化管理的路徑

檔案工作的最重要模型之一即“收管存用”,實(shí)現(xiàn)檔案數(shù)據(jù)化管理的關(guān)鍵在“收”,重點(diǎn)在“管和存”,目的在“用”。實(shí)現(xiàn)路徑的要點(diǎn)是通過(guò)制定策略,運(yùn)用計(jì)算機(jī)相關(guān)技術(shù)和工具自動(dòng)進(jìn)行數(shù)據(jù)治理,在治理過(guò)程中優(yōu)化升級(jí)檔案數(shù)據(jù),為利用提供各種便利。具體來(lái)說(shuō),檔案數(shù)據(jù)化管理的實(shí)現(xiàn)路徑包括以下幾個(gè)方面。

3.1 確認(rèn)檔案數(shù)據(jù)憑證

檔案是經(jīng)過(guò)整理的規(guī)范數(shù)據(jù),但問(wèn)題在于符合何種條件的數(shù)據(jù)才能稱為檔案。數(shù)據(jù)背后有一定的邏輯關(guān)系,單純一個(gè)數(shù)值序列,如2米、1米、0.8米,并不能讓人明白是什么意思,但若告知是一個(gè)桌子的長(zhǎng)寬高,這些數(shù)據(jù)就產(chǎn)生了意義。因此,面對(duì)數(shù)據(jù)的集合,要先理清其中的邏輯關(guān)系。傳統(tǒng)使用的文件或表單都有一定的制式,就代表著背后的邏輯關(guān)系。

新修訂《檔案法》第三十七條的“來(lái)源可靠、要素合規(guī)、程序規(guī)范”,明確了電子檔案的法定要求,但要具體落實(shí)檔案數(shù)據(jù)的憑證性,就必須事先定義符合什么樣邏輯描述的檔案數(shù)據(jù)可以稱為電子檔案。由于各種類型的檔案數(shù)據(jù)背后的邏輯關(guān)系是不同的,需根據(jù)業(yè)務(wù)實(shí)際進(jìn)行定義,因此在確認(rèn)檔案數(shù)據(jù)憑證性地位的同時(shí),必須同步明確各類型檔案數(shù)據(jù)邏輯關(guān)系的相關(guān)標(biāo)準(zhǔn)。其關(guān)鍵點(diǎn)在于找到一種通用語(yǔ)言來(lái)描述檔案數(shù)據(jù)的邏輯結(jié)構(gòu),且這種語(yǔ)言必須足夠簡(jiǎn)潔,具有足夠的擴(kuò)展性,可以定義任何類型的檔案。因此,推薦采用XML(可擴(kuò)展標(biāo)記語(yǔ)言),它本身就是為了“提供統(tǒng)一的方法來(lái)描述和交換獨(dú)立于應(yīng)用程序或供應(yīng)商的結(jié)構(gòu)化數(shù)據(jù)”而創(chuàng)設(shè)的,因此具有良好的通用性和可擴(kuò)展性,理論上可定義任何類型的數(shù)據(jù)結(jié)構(gòu)。

那么,是否可認(rèn)為一份XML即是電子檔案呢?筆者認(rèn)為是完全可以的,它可以滿足新修訂《檔案法》第三十七條“來(lái)源可靠、要素合規(guī)、程序規(guī)范”的十二字要求,只要是在相關(guān)機(jī)構(gòu)的規(guī)范系統(tǒng)中生成的,采用了一定的技術(shù)手段,并有著相對(duì)齊全完整的元數(shù)據(jù)和內(nèi)容數(shù)據(jù),在邏輯上就能自足。應(yīng)對(duì)數(shù)據(jù)篡改的風(fēng)險(xiǎn)可采用數(shù)據(jù)摘要、簽名、時(shí)間戳、區(qū)塊鏈等防篡改技術(shù),與原始文件是何種格式并無(wú)關(guān)系。盡管傳統(tǒng)上一般僅考慮用XML來(lái)傳輸數(shù)據(jù)或者標(biāo)記元數(shù)據(jù),檔案的內(nèi)容主體則認(rèn)為仍需要用版式文件固化,但這是從人為閱讀的角度思考檔案數(shù)據(jù)帶來(lái)的結(jié)果。XML如何展示取決于閱讀器,尤其是從一般文本數(shù)據(jù)應(yīng)用處理的場(chǎng)景來(lái)看,XML完全足夠且可支持全文檢索,如需展現(xiàn)為通常閱讀的版式,只要在閱讀程序中定制相關(guān)的模板,按閱讀習(xí)慣進(jìn)行展示即可。真正有保存價(jià)值的檔案信息可完整存放在XML中,這樣就能保證在收集和整理階段大部分檔案直接以“數(shù)據(jù)態(tài)”形式存在,也能減少后期通過(guò)OCR等識(shí)別工作提取檔案數(shù)據(jù)的工作量。

3.2 保持媒體檔案原貌

對(duì)于圖像、音頻、視頻等媒體檔案,由于其價(jià)值本身就在于其媒體性,如圖像承載的是一幅書(shū)法作品,那么,即使能識(shí)別該書(shū)法的文本數(shù)據(jù),使該書(shū)法便于查找利用,也必須保留其媒體數(shù)據(jù)的原始樣貌,否則便失去了作品本身的價(jià)值。因此一方面要運(yùn)用人工智能技術(shù)不斷提高OCR識(shí)別的準(zhǔn)確率,另一方面這類檔案無(wú)論提取的數(shù)據(jù)信息再怎么精確,原始的媒體仍需保留。可采用將媒體數(shù)據(jù)原封不動(dòng)地存放在XML的一對(duì)標(biāo)簽里的方式,對(duì)其他類似媒體檔案的特殊檔案也可采取這種做法。這類檔案在長(zhǎng)期保存時(shí)要關(guān)注原始數(shù)據(jù)格式定期轉(zhuǎn)換為當(dāng)前通用格式的問(wèn)題。同時(shí),媒體檔案確實(shí)存在內(nèi)容識(shí)別的難題,但隨著技術(shù)的不斷成熟,可不斷提高內(nèi)容識(shí)別的準(zhǔn)確度,如圖像識(shí)別等技術(shù)可以幫助我們?cè)陔娪暗哪骋粠袠?biāo)記相應(yīng)的人物信息等。因此作為檔案部門,可先按原貌進(jìn)行接收保存,待技術(shù)成熟時(shí)再進(jìn)行相應(yīng)的數(shù)據(jù)處理和開(kāi)發(fā)。

3.3 貫徹檔案數(shù)據(jù)治理

“治理”一詞原本多出現(xiàn)在公共管理領(lǐng)域。從管理學(xué)角度,治理是指規(guī)范多元主體參與管理,從而彌補(bǔ)單一力量的不足。在數(shù)據(jù)化條件下的檔案管理必然是多元主體協(xié)同參與的檔案數(shù)據(jù)治理。檔案數(shù)據(jù)治理是檔案全生命周期管理的各類檔案治理主體基于一定的行動(dòng)規(guī)則對(duì)檔案數(shù)據(jù)進(jìn)行科學(xué)、規(guī)范、高質(zhì)量管理的過(guò)程。在大數(shù)據(jù)時(shí)代,檔案數(shù)據(jù)治理的主體不僅僅是檔案部門,更延伸至社會(huì)各類組織,因此基于檔案全生命周期梳理治理主體,并適當(dāng)放權(quán)、多元中心化,由管理本位轉(zhuǎn)換至治理角色,強(qiáng)調(diào)協(xié)同治理,是檔案數(shù)據(jù)治理應(yīng)有之義。

收集是檔案數(shù)據(jù)治理的源頭,也是關(guān)鍵環(huán)節(jié)。在確認(rèn)檔案數(shù)據(jù)的憑證性地位和保持媒體檔案的原始性樣貌基礎(chǔ)上,收集和治理應(yīng)雙管齊下,貫穿整個(gè)檔案管理生命周期。在收集的同時(shí)就開(kāi)始治理,將治理發(fā)現(xiàn)的問(wèn)題主動(dòng)反饋給收集主體,盡可能在前端解決問(wèn)題。這里包含兩個(gè)問(wèn)題:一是傳統(tǒng)的數(shù)字檔案,主要是數(shù)字化副本,由于提出了“檔案即數(shù)據(jù)”,急需轉(zhuǎn)型;二是新興的檔案數(shù)據(jù)或稱數(shù)據(jù)檔案,一方面要擴(kuò)大傳統(tǒng)檔案數(shù)據(jù)的“歸檔”范圍,另一方面需要通過(guò)計(jì)算機(jī)技術(shù)和工具進(jìn)一步挖掘和提升其價(jià)值。

當(dāng)前檔案數(shù)據(jù)治理應(yīng)基于數(shù)據(jù)層面進(jìn)行分析處理。傳統(tǒng)數(shù)字檔案的治理還會(huì)是一個(gè)重要的工作,問(wèn)題不僅僅在于格式的轉(zhuǎn)換和統(tǒng)一,還在于傳統(tǒng)數(shù)字檔案由于未實(shí)現(xiàn)全流程監(jiān)管或無(wú)法監(jiān)管到位,必然存在錯(cuò)誤數(shù)據(jù)、誤差數(shù)據(jù)或數(shù)據(jù)丟失等問(wèn)題。這些問(wèn)題往往在利用時(shí)才會(huì)發(fā)現(xiàn),而這時(shí)從事前期工作如數(shù)字化工作的人員已經(jīng)離崗,追溯整改較為困難。

因此解決第一個(gè)問(wèn)題,必須強(qiáng)調(diào)檔案數(shù)據(jù)的全流程監(jiān)管和數(shù)據(jù)采集。但目前無(wú)論是在檔案部門內(nèi)部,還是在檔案室和檔案館之間,都存在工作或系統(tǒng)銜接的問(wèn)題,這樣反而無(wú)法全流程都按照一套標(biāo)準(zhǔn)貫徹執(zhí)行下去。除了開(kāi)發(fā)相應(yīng)的系統(tǒng)打通全流程之外,還需要行政手段落實(shí)多元主體參與責(zé)任,相應(yīng)工具(如檢測(cè)工具)輔助數(shù)據(jù)標(biāo)準(zhǔn)執(zhí)行等。特別是軟件工具,可以直接內(nèi)嵌數(shù)據(jù)標(biāo)準(zhǔn),部署在前端,倒逼前端治理,減少監(jiān)管成本。而對(duì)于已出現(xiàn)的數(shù)據(jù)問(wèn)題,要充分運(yùn)用技術(shù)和工具進(jìn)行檢測(cè),主動(dòng)發(fā)現(xiàn)數(shù)據(jù)當(dāng)中存在的問(wèn)題并整改。

關(guān)于第二個(gè)問(wèn)題,盡管目前已有不少相關(guān)技術(shù)工具,但人的理念是決定是否運(yùn)用這些工具的前提,因此必須要先有數(shù)據(jù)采集和開(kāi)發(fā)的理念,在治理主體中達(dá)成相應(yīng)的合約或共識(shí),才會(huì)在文檔生命周期中根據(jù)主體責(zé)任和義務(wù)適時(shí)對(duì)標(biāo)收集相關(guān)數(shù)據(jù),才能在治理中不斷優(yōu)化提升各類檔案數(shù)據(jù)。特別在大數(shù)據(jù)時(shí)代,強(qiáng)調(diào)“全數(shù)據(jù)”屬性,因此應(yīng)當(dāng)將與數(shù)據(jù)檔案相關(guān)的數(shù)據(jù)也納入收集范圍。檔案治理主體應(yīng)培養(yǎng)數(shù)據(jù)化管理思維,基于不同的項(xiàng)目合作共建,利用數(shù)據(jù)持續(xù)訓(xùn)練優(yōu)化檔案人工智能“大腦”,積累其“知識(shí)庫(kù)”,使其在應(yīng)用中不斷更新迭代,實(shí)現(xiàn)檔案數(shù)據(jù)治理。

3.4 落實(shí)檔案數(shù)據(jù)保存

任何數(shù)據(jù)管理都必須基于數(shù)據(jù)的有效保存,而確保檔案數(shù)據(jù)的長(zhǎng)期保存更是檔案部門的天職。當(dāng)前,由于新的數(shù)字檔案爆炸式增長(zhǎng)及其類型日益多樣化,其長(zhǎng)期保存管理模式也日益復(fù)雜化,而長(zhǎng)期保存管理模式,一則涉及保存的格式和數(shù)據(jù)組織形式,二則涉及保存的軟硬件環(huán)境和相關(guān)介質(zhì)。檔案部門急需找到一種通用的、脫離依賴關(guān)系的保存格式。這種擺脫依賴性的格式必然是簡(jiǎn)單的,如上文提到的XML,以及我們常見(jiàn)的TXT格式。至于其他展現(xiàn)時(shí)即相當(dāng)復(fù)雜的格式,如DWG、WRL、DXF等格式,必然隨著時(shí)代進(jìn)步和需求變化而不斷進(jìn)化。長(zhǎng)期保存對(duì)于檔案數(shù)據(jù)而言,還必須理清其邏輯關(guān)系,滿足“格式開(kāi)放、自包含、自描述、自解釋”等要求。綜合來(lái)看,XML更符合大部分檔案長(zhǎng)期保存通用格式的要求。如上文所述,XML展現(xiàn)形式可在應(yīng)用層面實(shí)現(xiàn),而底層數(shù)據(jù)依然采用最原始簡(jiǎn)單的格式,這就需要檔案界和計(jì)算機(jī)界對(duì)此有相應(yīng)的約定。

同時(shí),部分不得不定期遷移的數(shù)據(jù)(即無(wú)法或不宜用通用格式表達(dá)的數(shù)據(jù)),不但要進(jìn)行遷移,而且需要定期更新成當(dāng)前格式,否則隨著時(shí)間流逝,可讀性會(huì)逐漸衰減。一般來(lái)講,新舊更換都有一定的過(guò)渡期,在對(duì)所存放的文件格式及內(nèi)容認(rèn)識(shí)的基礎(chǔ)上可以定制轉(zhuǎn)換策略,進(jìn)行定期更新。過(guò)去認(rèn)為保存能讀取原文件格式的閱讀器是一種方法,但由于底層操作系統(tǒng)也在迭代,需要保存的內(nèi)容日益增多,難以落到實(shí)處,因此只有定期遷移和更新,才能保證數(shù)據(jù)是永“活”的。隨著理念的成熟,相應(yīng)的數(shù)據(jù)遷移轉(zhuǎn)換工具和基于人工智能對(duì)數(shù)據(jù)狀況進(jìn)行分析的工具也會(huì)逐漸開(kāi)發(fā)出來(lái),用于批量的格式轉(zhuǎn)換和預(yù)判數(shù)據(jù)是否需要進(jìn)行遷移。

數(shù)據(jù)要在使用中驗(yàn)證其可用性,因此對(duì)數(shù)據(jù)的適當(dāng)使用和整理有利于數(shù)據(jù)治理,但過(guò)度或者不當(dāng)?shù)氖褂茫瑫?huì)帶來(lái)數(shù)據(jù)保存的風(fēng)險(xiǎn)。傳統(tǒng)的觀念一般認(rèn)為,檔案數(shù)據(jù)相對(duì)生產(chǎn)數(shù)據(jù)為“冷”數(shù)據(jù),而在大數(shù)據(jù)時(shí)代,檔案數(shù)據(jù)不宜再視為“冷”數(shù)據(jù),但其長(zhǎng)期保存中的備份卻應(yīng)當(dāng)保持相當(dāng)?shù)姆€(wěn)定性。因此,在保證數(shù)據(jù)永“活”的前提下,配合采用多種介質(zhì)備份的方式,整合不同介質(zhì)的存儲(chǔ)特性,為檔案數(shù)據(jù)長(zhǎng)期保存提供保障支撐。由于“數(shù)據(jù)態(tài)”檔案數(shù)據(jù)來(lái)源廣泛,因此在長(zhǎng)期保存之前,可通過(guò)大數(shù)據(jù)相關(guān)技術(shù)進(jìn)行“數(shù)據(jù)清洗”,減少無(wú)效檔案數(shù)據(jù)的存儲(chǔ)占用。同時(shí)引入監(jiān)測(cè)和比對(duì)機(jī)制,可實(shí)時(shí)發(fā)現(xiàn)數(shù)據(jù)修改,確保數(shù)據(jù)與當(dāng)初進(jìn)入存儲(chǔ)池時(shí)完全一致。這種監(jiān)測(cè)目前主要基于數(shù)據(jù)摘要技術(shù),可進(jìn)一步基于數(shù)據(jù)內(nèi)容,運(yùn)用人工智能進(jìn)行更深度地監(jiān)測(cè)。由于數(shù)據(jù)本身在不斷更新,因此數(shù)據(jù)除了保證和入存儲(chǔ)池時(shí)一致以外,還要定期在管理庫(kù)和長(zhǎng)期保存庫(kù)之間做相應(yīng)的擺渡,但不宜過(guò)于頻繁,以免干擾數(shù)據(jù)保存本身的機(jī)制。

3.5 提升數(shù)據(jù)服務(wù)

以數(shù)據(jù)為顆粒度的檔案信息服務(wù)能有效解決當(dāng)前檔案服務(wù)面臨的現(xiàn)實(shí)問(wèn)題,實(shí)現(xiàn)這一服務(wù)也是檔案數(shù)據(jù)化管理的最終目的。因此在做好檔案數(shù)據(jù)“收、管、存”的基礎(chǔ)上,應(yīng)進(jìn)一步做好“用”:一是基于數(shù)據(jù)分析準(zhǔn)確按需按權(quán)服務(wù),即根據(jù)用戶的自身情況和實(shí)際需求,綜合分析該數(shù)據(jù)在此場(chǎng)景下是否可對(duì)該用戶進(jìn)行開(kāi)放,判斷該用戶是否有權(quán)限獲知該數(shù)據(jù),做到“應(yīng)知方知”,確保檔案數(shù)據(jù)利用的安全,同時(shí)做到“應(yīng)知可知”,不因整件或整卷檔案的開(kāi)放控制屬性影響其中可對(duì)用戶開(kāi)放的檔案信息的獲取。二是定制化生成和推送用戶所需信息,即根據(jù)不同的用戶需求,智能地組織整理好所需要的信息,包括內(nèi)容和對(duì)應(yīng)的多媒體,在語(yǔ)義理解的基礎(chǔ)上,轉(zhuǎn)化為當(dāng)前的語(yǔ)言進(jìn)行回應(yīng),同時(shí)可引入VR、AR和3D展示等技術(shù),豐富數(shù)據(jù)展現(xiàn)形式,實(shí)現(xiàn)人性化互動(dòng)。三是跨區(qū)域統(tǒng)一共享服務(wù)。目前雖然各地陸續(xù)建成了數(shù)字檔案館,但數(shù)據(jù)孤島的問(wèn)題依然突出,這嚴(yán)重制約著檔案數(shù)據(jù)服務(wù)的成效,特別在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的匯集關(guān)聯(lián)可能會(huì)產(chǎn)生新的有價(jià)值的數(shù)據(jù)。檔案如能按標(biāo)準(zhǔn)生成,基于統(tǒng)一的交換格式,則天然地具有可共享的特性。因此共享除了行政方面的干預(yù)之外,數(shù)據(jù)標(biāo)準(zhǔn)的統(tǒng)一尤為關(guān)鍵。以數(shù)據(jù)為顆粒度定義檔案數(shù)據(jù)標(biāo)準(zhǔn),在共享時(shí)會(huì)更具優(yōu)勢(shì)。由于數(shù)據(jù)在提供利用時(shí)更為準(zhǔn)確,安全性更有保障,也為其在互聯(lián)網(wǎng)等公共網(wǎng)絡(luò)上的利用提供了便利,如不用在網(wǎng)絡(luò)上傳輸整份檔案數(shù)據(jù)原文,只需要反饋用戶所需的數(shù)據(jù)或具有憑證性的碼即可。同時(shí),基于數(shù)據(jù)顆粒度開(kāi)展檔案數(shù)據(jù)協(xié)同共建工作,建立相應(yīng)共識(shí)和長(zhǎng)期貢獻(xiàn)機(jī)制并將其寫入系統(tǒng),有利于各類檔案數(shù)據(jù)主體厘清權(quán)利和義務(wù),安全共建共享,激發(fā)檔案數(shù)據(jù)資源共享的動(dòng)力,推動(dòng)檔案數(shù)據(jù)共享可持續(xù)深入發(fā)展。四是實(shí)時(shí)便捷提供檔案數(shù)據(jù)服務(wù)。在“馬上就辦”“一趟不用跑”“最多跑一次”等政策的指引下,檔案數(shù)據(jù)服務(wù)的效率也日益受到關(guān)注。基于人工智能技術(shù),解決傳統(tǒng)開(kāi)放審核工作滯后問(wèn)題,使大量有價(jià)值的檔案數(shù)據(jù)得以及時(shí)開(kāi)放,并通過(guò)文件和檔案數(shù)據(jù)的在線統(tǒng)一交換共享,加速文件歸檔,方便用戶異地查檔和遠(yuǎn)程在線查檔,在提升檔案服務(wù)質(zhì)量的同時(shí)提升檔案服務(wù)效能。

猜你喜歡
管理
棗前期管理再好,后期管不好,前功盡棄
《水利建設(shè)與管理》征訂啟事
聆聽(tīng)兩會(huì)
——關(guān)注自然資源管理
2020年《水利建設(shè)與管理》征稿函
運(yùn)行管理
管理就是溝通
加強(qiáng)土木工程造價(jià)的控制與管理
如何加強(qiáng)土木工程造價(jià)的控制與管理
解秘眼健康管理
“這下管理創(chuàng)新了!等7則
雜文月刊(2016年1期)2016-02-11 10:35:51
主站蜘蛛池模板: 老司机午夜精品视频你懂的| 九九久久99精品| 亚洲av无码人妻| 91久久精品日日躁夜夜躁欧美| 亚洲三级视频在线观看| 天天综合色网| 日韩精品高清自在线| 欧美成人a∨视频免费观看 | 无遮挡国产高潮视频免费观看| 真人高潮娇喘嗯啊在线观看| 午夜国产不卡在线观看视频| 色九九视频| 一本大道香蕉中文日本不卡高清二区| 高潮毛片免费观看| 蜜桃视频一区二区| 激情视频综合网| 欧美一级高清免费a| 一级香蕉人体视频| 成人国产精品2021| 国产啪在线91| 新SSS无码手机在线观看| 五月婷婷欧美| 91视频精品| 精品少妇三级亚洲| 高清大学生毛片一级| 国产欧美精品一区二区| 久久久久亚洲av成人网人人软件| 亚洲国产精品一区二区高清无码久久| 亚洲中文字幕手机在线第一页| 伊人色天堂| 免费国产黄线在线观看| 老司机午夜精品视频你懂的| 亚洲中文字幕在线精品一区| 国产成在线观看免费视频 | 亚亚洲乱码一二三四区| 五月婷婷导航| 中文字幕在线欧美| 欧美三级不卡在线观看视频| 免费看av在线网站网址| 欧美性天天| 欧美成在线视频| 国产精品任我爽爆在线播放6080| 国产屁屁影院| 四虎国产永久在线观看| 999精品色在线观看| 亚洲综合激情另类专区| 91国内在线观看| 午夜影院a级片| 亚洲欧美不卡视频| 日本欧美午夜| 久久久久亚洲Av片无码观看| 在线另类稀缺国产呦| 女人18毛片久久| 极品国产一区二区三区| 久久综合婷婷| 69视频国产| 久久精品免费看一| 香蕉99国内自产自拍视频| 第一区免费在线观看| 亚洲精品无码久久毛片波多野吉| 色综合狠狠操| 亚洲欧美精品一中文字幕| 91啦中文字幕| 尤物午夜福利视频| 999在线免费视频| 依依成人精品无v国产| 欧美日韩激情在线| 青青久久91| 毛片在线播放网址| 18黑白丝水手服自慰喷水网站| 91亚洲国产视频| 日本久久网站| 成人小视频网| 麻豆a级片| 成人综合在线观看| 欧美国产在线精品17p| 激情影院内射美女| 亚洲天堂在线免费| 国产鲁鲁视频在线观看| 国产成人高清亚洲一区久久| 欧美啪啪一区| 久久国产av麻豆|