王曉東 常海軍 王征
(河北省地質測繪院 河北省廊坊市 065000)
檔案分類是依據一定的標準,按照檔案來源、時間、內容和形式特征的異同點,對檔案進行有層次的區分,并組成一定的體系。檔案種類的劃分,一般采用以下幾種形式:
一是按照檔案形成者的性質,即檔案的來源標準可分為國家機關檔案、黨派團體檔案、企業單位檔案等;二是根據檔案的內容性質標準,有兩種劃分方法,一是分為普通檔案和專門檔案;另一種是直接分為文書檔案、公安檔案、訴訟檔案等多種門類;三是根據檔案的載體形式標準,可分為石刻檔案、甲骨檔案、膠片檔案、磁帶檔案等,載體形式的不同,檔案的整理、保管與利用的方式均有所不同;四是按照記錄信息方式標準,分為文字檔案、圖形檔案、聲像檔案、電子檔案。
本文的研究內容基于第四種分類方式,利用分布式數據庫中的集群、分片、復制等技術實現數字化文字檔案、圖形檔案、聲像檔案等多種類型的電子檔案統一存儲管理。電子檔案統一存儲管理涉及到的數據類型包括結構化數據(即行數據,存儲在數據庫里,可以用二維表結構來邏輯表達實現的數據)、半結構化數據(它是結構化的數據,但是結構變化很大)和非結構化數據(包括所有格式的辦公文檔、文本、圖片、XML、HTML、各類報表、圖像和音頻/視頻信息等)。研究內容主要包括關系型數據庫、NOSQL 數據庫及緩存數據庫的選型,ORM(Object Relational Mapping)框架選擇、DDD(領域驅動設計)應用等多種技術和方法。……