劉永 龐宇飛
摘 要:本文針對數據時代檔案管理面臨的數字化和數據化認知問題和服務問題,基于鏈式管理理論和方法,提出了檔案原生數據源全鏈式管理的數據化管理思路。在深入分析數字與數據、數字化與數據化、超鏈接與區塊鏈、鏈式管理與生態鏈管理等相關概念的基礎上,對鏈式管理理論引入的必要性進行了論證,給出原生數據源全鏈式網絡化管理模式,并對檔案原生數據源鏈式管理的本質、管理要素、管理網絡、管理機制和管理流程進行了具體分析。最后,作為原生數據源全鏈式網絡化管理的重要組成部分,提出檔案數據化鏈式服務體系構建的基本構思。
關鍵詞:檔案數字化;檔案數據化;原生數據;鏈式管理;檔案服務
分類號:G206
Abstract: As to the recognition and service problems of digitalization and datamation in Archives management during data age, based on the chain management theory and method, the paper proposed the data management idea of the native data sources full-chain management. On the basis of in-depth analysis of related concepts such as digital and data, digitalization and datamation, hyperlinks and block chain, chain management and ecological chain management, the necessity of the introduction of chain management theory was demonstrated, and the native data source full-chain network management mode was given, and then specific analysis of the management essence, management elements, management network, management mechanism and management process of the native data sources chain management. At last, as an important part of it, the basic idea of constructing the Archives data chain service framework was proposed.
Keywords: Digitalization of Archives; Archives Datamation; Native Data; Chain Management; Archives Services
1 引言
自上個世紀90年代社會開始進入信息時代以來,信息高速公路、移動互聯網和物聯網等網絡技術迅猛發展,逐漸開啟了今天的數據時代,由此也不斷催生了可能顛覆許多經典管理理論的現代技術,這些技術包括云計算(Cloud Computing)、大數據(Big Data)、區塊鏈(Block Chain, BC; Distributed Ledger Technology, DLT)、人工智能(Artificial Intelligence)等。新技術的不斷涌現和不斷滲透社會各領域的同時,日益突顯了“數據”的核心地位、核心價值和核心作用。
目前,各種類型的社會組織的工作活動和各種角色的社會成員的日常生活無一例外地被紛繁多樣的各類數據所影響。數據化生存已經逐漸成為人們工作和生活的主流方式。數據時代的適應能力和數據資源的掌控處理能力逐漸成為提升變革與轉型發展能力和增強新一輪競爭力的主導因素之一。
但是,面對這一時代浪潮,檔案學研究專注于數字化、大數據等相關研究較多,對數據化現象所帶來的數據植根性、記錄離散性、實體虛無性、集中困難性、引證認同性、管理跨界性等問題的研究偏少。也就是說,在數據時代來臨之際,現有的實體檔案管理和檔案數字化管理理論與方法,難以解決上述問題,顯露出了理論研究指導檔案工作實踐的局限性。
可喜的是,檔案學界部分學者已經意識到了檔案信息管理的基礎性問題,需要用數據化思維方式創新檔案管理和服務模式。例如,提出從檔案數字化向檔案數據化轉變的思路[1]和提出用數據化技術提升檔案管理與服務工作水平[2]等。
運用數據思維,研究檔案管理向數據層遷移的可行模式并開展數據化管理活動,具有適應數據時代的變革需求,提升檔案管理工作質量和水平的理論和實踐意義。因此,引入數據化思維方式,重新審視檔案數據化管理的概念并對其進行深入研究非常必要。本文擬以檔案原生數據源全鏈式管理角度,探討檔案數據化管理問題。
2 相關概念分析
為了比較清晰地說明檔案原生數據源全鏈式管理問題,有必要從數據化視角對相關概念進行分析和說明。這些概念包括數字與數據、數字化與數據化、超鏈接與區塊鏈、鏈式管理與生態鏈管理等。
2.1 數字與數據
2.1.1 數學領域。數字(number)在數學上主要指自然數,也就是一個自然數的數值字符。在數學上,如果數字帶上相應的屬性,則可以變成數據(data),而且是數值型數據,例如一個區域的人口數量、一個企業的產品產量等。這個意義上講,數字、數目、數值等均是對數值型數據的表示方法。
2.1.2 電子技術和計算機技術領域。電子技術和計算機技術領域,數字(digital)的概念比數學領域的數值概念外延要廣。數字在計算機領域主要與模擬相對應,數字相對應的是二進制表示的離散的邏輯量,模擬相對應的是電信號表示的連續的物理量,有數字信號(Digital Signal)和模擬信號(Analog Signal)之分。
在計算機領域,數字通過位(bits)、字節(bytes)和字(words)描述的不僅是自然數的數值,還包括描述圖形符號和字母等一切可表達的事物,即除表示一個區域的人口數量、一個企業的產品產量等,還可表示人口類別和產品質量等等。
數值型數字帶上相應的屬性仍然可以變成數值型或邏輯型數據,可以按照數學的方法進行運算。其他類型的數字,如字符型、指針型、備注型和大二進制對象等,賦予相應的屬性也能構成各種類型的數據,如一段文字、一幅圖片、一段音頻和視頻等,同樣可以用數學或其他方法進行運算和處理。
在計算機領域,數據是由對現實世界中各種事物,如人物、事件、事實、對象和概念等進行表示、表達或描述的二進制數字構成的。計算機用二進制數字所表達的所有數據符號均包含矢量和點陣兩種類型。這個意義上講,電子技術和計算機技術領域,數據的概念比數學領域的數值型數據概念要廣,可以說數據包羅萬象。
2.1.3 圖書情報與檔案學科領域。在圖書情報與檔案領域,相關數字和數據的討論均基于電子技術和計算機技術領域的概念進行的,也就是數字是數據的二進制表示方式。如根據專業特點,將數據分為書目型數據、實事型數據、文獻型數據、數值型數據、全文型數據、智能型數據、多媒體型數據等等類型,這些數據均由數字化形式進行表述。但是,許多理論和應用研究中也存在數字與數據、數據與大數據概念的使用不十分嚴格的情況。
2.2 數字化與數據化
2.2.1 檔案數字化概念分析
(1)檔案數字化一般認識
一些學者對檔案數字化概念的解讀基本上屬于實體檔案的二進制化加工理念,認為檔案數字化是運用計算機數字化技術,將實體檔案與數字檔案相互轉換,并運用信息技術實現系統化、平臺化和網絡化的輸入、存儲、保護、檢索、輸出、利用等管理過程。計算機數字化技術包括數據庫技術、數據壓縮技術、圖像掃描技術等;實體檔案包括所有傳統介質和非數字化形式的檔案材料,如紙質檔案、聲像檔案等[3][4][5][6][7]。
專家們對檔案數字化概念的表述,雖然表達方式上存在細微差異,其共性是強調運用信息技術手段將傳統載體檔案信息轉化為數字檔案信息和逆向轉化的過程。
(2)檔案數字化涵義分析
從電子技術和計算技術領域的數字概念角度來看,數字化的概念應囊括數據化的范疇。根據現有檔案學研究領域和實際檔案工作中的檔案數字化解讀觀點,存在概念偏頗的認識問題。
現有的檔案數字化認知一般基于實體檔案材料輸入存儲和輸出顯示范疇,對實體檔案材料輸入轉換的解讀也是基于檔案用戶的視聽覺需求和直觀顯示作為出發點進行的。
數字的顯示形態可分為實體顯示和虛擬顯示兩種類型。文檔圖表等打印成紙質材料,工程設計打印的三維實體模型等都是屬于實體輸出顯示的范疇;顯示器和投影儀輸出的光學影像,依賴設備輸出的音視頻等都屬于虛擬輸出范疇,也可理解為終端輸出范疇。
傳統的數字化認知在一定條件下有其合理性。過去很長一段時間,檔案的內容、形式與載體統一度較高,內容與憑據關聯性和一致性也高。實體檔案材料如書面材料、影照錄材料等,可以比較容易地按有機聯系進行實體化管理。
實際上,一份材料包含的信息遠非書面信息,其載體本身也包含各類特定的和更多的相關有效信息,其載體內容的數字化加工可能會造成部分信息的丟失或者增加無關的信息。傳統意義上講,各種載體的檔案材料經過數字加工處理后,能很大程度保留其原始面貌,不會對原始性、憑證性等屬性和功能的造成實質性影響。
值得注意的是,各類職能活動的信息化與智能化的快速演進,許多檔案數據難以實體化,也無法進一步進行數字化加工和管理,還有許多信息存在虛擬顯示不能全部或無法傳遞的情況,如場景、氣氛、各類支撐數據和程序等,存在諸如CAD、BIM、網頁、游戲等生成的有歸檔價值的關聯數據和鏈接數據難以使用傳統方法按有機聯系進行實體化管理的現象。另外,因數據廣泛鏈接而產生的數據離散化和無形化問題也導致了檔案的內容、形式與載體統一度愈來愈小,內容與憑據關聯性和一致性愈來愈低的現象。上述現象導致許多載體類型的檔案經過數字處理后,難以保留其原始面貌,對檔案原始性和憑證性屬性的實質性影響較大。
可以預見,未來大規模的難實體化檔案數據在檔案管理體系中將占據越來越大的比重。這種現象的出現所帶來的問題是多方面的,如檔案收集方面,是否能按實體化收藏檔案材料的全部,是否能確定原始記錄的位置,是否能確定記錄包含信息的位置,是否能保障檔案的完整形態等等;檔案保管方面,過去長期保存的替代方法,如翻錄、遷移等,現在是否還適用;類似的還有集中統一管理原則指導下的物理集中和邏輯集中問題、檔案信息安全管理問題、完整準確系統和精煉性保障問題、管理內容與管理憑證的矛盾問題、描述性保存和本體性保存的選擇問題等等。這些均是現代檔案管理工作所面臨的嚴重挑戰。
面對上述情況,傳統思維方式下對檔案數字化內涵進行表述,難免出現數字化概念內涵偏窄和外延失泛的問題。面對三維建模、虛擬現實、遠程協作、人工智能等應用所產生的數據管理問題,出現數字化和實體化檔案管理的困境在所難免。
重新認識檔案數字化概念,應跳出原有思維局限,深入原生數據層,將實體形態或虛擬形態的內容要素和具有歸檔價值的數據及其應用環境要素加入檔案數字化涵蓋范圍,保證內涵和外延表述的準確性。
據此,本文認為,檔案數字化是運用數字技術,對檔案原生數據進行數字處理和描述,以實現數據化和網絡化全生命周期檔案管理的過程。
以數據化鏈式思維和手段管理檔案資源,建立檔案全鏈式管理與服務系統,可以深化檔案管理服務主體、檔案形成主體和檔案利用主體的深度交互與協同[8]、增強檔案原始性、憑證性保障,以提升檔案管理質量與績效。
2.2.2 檔案數據化概念分析
(1)檔案數據化一般認識
一些學者對檔案數據化概念的解讀基本上屬于數字檔案的矢量化加工理念,認為檔案數據化是在檔案數字化的基礎上,用光學識別(OCR)、語音識別(ASR)等技術對圖像、音視頻中的數字內容進行全文識別、分類、著錄、標引等工作,形成結構化數據,并建立目錄數據庫、全文數據庫和媒體資源庫,使檔案資源內容為計算機所掛接、存取、調用、更新、分析和處理,使其能用檢索詞進行檢索的過程[9][10][11]。
也有學者認為檔案數據化屬于檔案的數據格式化的過程,如認為檔案數據化是以統一規范的數據格式進行錄入轉化、節點控制和全程跟蹤管理等[12]。
(2)檔案數據化涵義分析
本文認為,檔案數據化管理不僅僅是數字檔案的矢量化加工范疇,還包括數據的結構化解析、應用級封裝、媒體化組織和全鏈式管理過程。
檔案數據化既可以認為是檔案數字化的延伸,也可以認為是檔案數字化的重要構成。按“延伸”理解,在檔案數字化解決了包括二進制轉換和矢量化轉換在內的檔案原生數據的處理和描述問題后,檔案數據化就是檔案數據的結構化解析、應用級封裝、媒體化組織和全鏈式管理過程。按“構成”理解,檔案數據化就是檔案數字化的全生命周期貫穿始終的檔案原生數據管理過程。
檔案數據化管理理念對解決傳統意義上檔案難以數字化管理和實體化管理的問題提供新的思路,也可以解決檔案本體的技術植根性所帶來的檔案內容、形式和載體的離散化和虛擬化問題。檔案數據化使檔案原生數據管理由“實體化”管理向“媒體化”管理延伸,由“用戶級”數據管理向“應用級”數據管理延伸成為可能。
按上述認知對檔案進行數據化管理,可以突破檔案載體形態和載體類型、檔案數據輸出形式乃至“份”和“件”等存取理念和管理方式的制約,疏通各類活動主體檔案管理協作的渠道,減少甚至終結低層次的增量檔案數字化加工轉換工作,擺脫傳統檔案數字化和檔案實體化管理滯后于各類職能活動的信息化快速推進所帶來的不適應性困擾。
(3)媒體化概念分析
國際電信聯盟(ITU:international Telecommunication Union)下屬的國際電報電話咨詢委員會(CCITT-Consultative Committee International Telegraph and Telephone)和電信標準部(TSS: Telecommunication Standardization Sector)的ITU-T I.374對媒體給出了類別劃分的建議,包括感覺媒體(Perception Medium)、表示媒體(Representation Medium)、顯示媒體(Presentation Medium)、存儲媒體(Storage Medium)、傳輸媒體(Transmission Medium)、交換媒體(Exchange Medium)等六類。其中,感覺媒體是對感覺器官產生直接感覺的媒體,如語音、音樂、各種圖像、動畫、文本等,一般將文本、圖形、圖像、動畫、音頻、視頻六種感覺媒體稱為六種媒體元素。
檔案數據化管理不僅需要關注感覺媒體的管理,還需關注其他五類媒體并將其納入結構化解析、應用級封裝、媒體化組織和全鏈式管理過程之中。
(4)應用級概念分析
信息技術的系統結構一般包括系統硬件層、系統軟件層和應用軟件層三個層次。系統硬件層是各類設備的物理與邏輯關系和鏈接,系統軟件層是各類系統服務模塊操作關系和鏈接,應用軟件層是面向用戶的各類應用模塊操作關系和鏈接。
檔案數據化管理角度看,可以把信息技術的系統結構分為硬件系統層、驅動軟件層、操作系統層、應用軟件層、顯示輸出層、實體輸出層等六個層次。其中應用軟件層也就是應用級,是檔案數據化管理與服務應著重關注的方向。上文提到傳統的檔案數字化管理理念,主要是面向顯示輸出層、實體輸出層的操作理念,按照本文對數字化和數據化釋義和前端控制理念,檔案數據化管理需要在應用層面進行數據處理和管理。
2.3 超鏈接與區塊鏈
2.3.1 超鏈接概念分析。超鏈接是包括網頁在內的不同媒體和不同站點之間進行鏈接和跳轉的一種程序化的內容組織方式。超鏈接作為媒體內容的一部分,可以從一個媒體內容指向其他目標媒體或目標媒體內的某些內容。通過超鏈接將各個網絡媒體、站點以及圖片和視頻等數據鏈接起來,才能真正構成一個完整的媒體內容并通過媒體瀏覽工具進行瀏覽[13]。新媒體與自媒體大量涌現,超鏈接也在其中大量應用并逐漸成為網絡信息傳輸、獲取和服務的主要方式。
2.3.2 區塊鏈概念分析。區塊鏈技術是一種聯網數據庫技術,具有去中心化的特征。該項技術利用網絡中每個成員都可以成為其中的參與者和記錄者所產生的“相互證明、互相印證”功能,從而達到印證某數據塊的可靠性的目的。從這個角度上講,區塊鏈的本質是數據或信息模塊化并通過鏈接關系實現網絡上的相互印證,以此產生信用和憑證作用。如果一個“信用”信息塊,同時被多個“鏈接”鎖定,則可以構成無法反悔的網絡“憑據”。
區塊鏈起初是以比特幣為代表的數字加密貨幣體系的核心支撐技術[14]。2015年,區塊鏈技術獨立出來[15],以其特有的網絡憑證特性逐漸被用于需要數據和信息的真實性、可靠性保障的許多場合,如2018年5月29日,百度百科上線區塊鏈功能應用,利用區塊鏈技術的時間戳與共識機制優勢,確保百科詞條的準確性。
在檔案信息真實性和可靠性保障技術層面上講,繼數字簽名技術和數字水印技術等技術之后,區塊鏈技術的引入,為數字檔案的原始性和憑證性保障提供了新的技術手段。如果“認同”是“憑證價值實現”的根本的理念得到學術界的認可的話,那么,“網絡信用”將可能成為檔案原始性和憑證性保障又一重要利器。其基本原理是“網絡信用”基于這樣一種信賴,這種信賴是取得某數據塊在網絡上的“廣泛認同”,“廣泛認同”本身源自網絡上的“廣泛印證”,而“廣泛印證”則源于網絡的“廣泛鏈接”。
2.4 鏈式管理與生態鏈管理
2.4.1鏈式管理的源起和應用。美國管理學家杰伊·弗萊斯特(Jay Forrester,1918.7.14~2016.11.16)于1961年在美國通用電氣公司一個項目中提出了“供應鏈”概念。美國管理學家邁克爾·波特(Michael E. Porter,1947~)分別于1980年和1985年出版《競爭戰略》和《競爭優勢》專著,書中均提出了“價值鏈”概念。荷蘭籍管理學家彼得·德魯克(Peter F. Drucker,1909.11.19~2005.11.11)于1999年出版《21世紀的管理挑戰》一書,書中提出了“經濟鏈”概念。管理學界學者們也先后提出了商品鏈、技術鏈、空間鏈、信息鏈、知識鏈、創新鏈和服務鏈等相關概念,分別從不同的視角研究企業生產經營活動、科技創新活動等社會活動中各活動主體相互之間的鏈性關系,通過鏈性關系的挖掘和業務流程再造,即“鏈式管理”,可以進一步增強組織內部和組織之間的協同性,以達到管理上提質增效的目的[16]。
鏈式管理模式首先在企業的管理模式改進和業務流程重組上得以應用。鏈式管理主要是指在理順企業各部門相互之間的工作關系的基礎上,建立生產鏈、經營鏈、考評鏈等環環相扣的鏈接關系,并將這些關系按對等、主從、無關、考評等關系進行梳理和組織,形成新的管理體系,使企業生產經營各個環節的職能活動通過鏈接關系進行協同,共同完成企業的生產經營任務,以達到最大限度提高企業的管理經營效益的目標[17]。
實際上,任何社會組織內部圍繞其主要職能活動都存在各種要素相互之間相互依存和相互制約的鏈性關系,不管這些關系是隱性的還是顯性的,在客觀上都是存在的,而且自然界也是如此。如果能將這些鏈接關系深度挖掘,形成完整的理論和應用體系,并應用于職能活動的優化管理,對提高管理水平和管理質量,促進組織系統目標的達成,增強組織的活力、實力和競爭力,會起到重要的推動作用。
2.4.2檔案原生數據源與全鏈式管理
(1)檔案原生數據源
檔案原生數據源包括檔案原生數據和原生數據源兩個概念。就檔案的本質屬性講,檔案是職能活動直接形成并有存取價值的原始記錄。檔案原生數據就是這個原始記錄的組成部分,只不過記錄的粒度是數據,與作為電子文件的記錄粒度不同,稱為職能活動中直接形成的具有歸檔保存價值的原始數據[18];原生數據源是指生成原生數據的職能活動關鍵實體崗位主體或關鍵虛擬崗位主體。
這里需要說明的是,傳統的檔案學理論認為檔案作為職能活動的原始記錄,通常表現為原件。作為公文來講,原件就是包括定稿在內的以及定稿前后所形成的與定稿相關的一組有機聯系的系列材料所構成的記錄。這是看得見和摸得著的實體類型的原始記錄所表現的應有形態,具有相對的獨立性、直讀性和有形性。
但是,信息技術元素既深深植根于檔案的載體和內容之內,又牢牢關聯于檔案的載體和內容的呈現和管理之外。整體上講,檔案作為原始記錄已經無法完全脫離對信息技術的依賴,或無法完全獨立于信息技術工具而自成一體。
很多情況下,離開了信息技術支撐,檔案材料根本無法使用,其獨立性大打折扣。這樣,傳統意義上的原件這一形態就因技術元素的植根而變得虛擬化了,原始記錄性因檔案本體無法獨立呈現而逐漸失去自身的可信性與外部的認同性。
檔案本體既然無法脫離技術依附性,就需要擁有和融合技術。檔案本體要以原生數據和原生數據源管理為基礎,規劃和構建更細粒度的檔案管理模式,與信息技術無縫銜接和融為一體,共同搭建原始記錄的信任體系、憑證體系、認同體系和參考依據體系。本文認為,用全鏈式管理方法重構檔案管理模式和管理體系是解決上述問題的一種理想選擇。
(2)檔案原生數據源全鏈式管理
由于鏈式管理主要是對活動主體及其相互之間依存和制約關系的管理,較少考慮對活動客體和活動載體對象的管理,因此不具備全鏈式管理的屬性。
檔案原生數據源既涉及職能活動的各類主體,也涉及檔案信息用戶主體、系統平臺、活動客體和包括檔案原生數據在內的活動載體。檔案原生數據是檔案管理的主要對象,因此,需要對鏈式管理的理論和方法用全鏈式管理思維進行改進和應用。
檔案原生數據源全鏈式管理是指在挖掘檔案原生數據形成的平臺、主體、客體、載體和用戶之間關聯關系、依存關系和制約關系等各種關系的基礎上,構建檔案本體數據層面的鏈接管理、檔案形成單位協同化管理以及檔案形成的各類業務與信息平臺的接口化管理體系和運轉流程,促進原生數據源各職能活動主體和平臺的協同、檔案數據集合和模塊的鏈接以及管理渠道和流程的暢通的管理模式。
2.4.3鏈式管理與生態鏈管理區別與聯系。原生數據源全鏈式管理與數字檔案生態鏈管理既有區別也存在一定聯系。總體上講,原生數據源全鏈式管理與數字檔案生態鏈管理存在理論、原理、內容、對象、主體等方面的區別與聯系。
(1)基本理論上的借鑒性
自1998年以來,20年間關于檔案生態問題的研究超過100篇文章,其中檔案館生態問題研究有43篇。另外,研究內容還包括檔案業務環節生態學問題、檔案生態系統構成要素和構建模型以及運行機制等問題、檔案生態環境保護建設問題、檔案生態鏈信息管理機制問題、檔案服務生態問題、檔案生態鏈管理效率評價問題以及檔案生態綜合管理問題等方面。
部分文章在研究數字檔案生態鏈、信息生態理論在數字檔案系統中的應用以及數字檔案資源安全、檔案服務生態系統問題的過程中,借鑒和引用了鏈式管理的理論和方法。因此,檔案生態鏈管理不僅僅運用了生態學理論與方法,還借用了管理學中的鏈式管理理論與方法。
(2)研究原理上的異同性
數字檔案生態鏈管理往往依據生態學原理,將數字檔案生態特征與生物界的食物網絡特征進行匹配,試圖在探索數字檔案信息主體相互之間的交互作用關系的基礎上,建立數字檔案網絡生態模型,以此改進檔案管理的模式和方法。
原生數據源全鏈式管理不討論數字檔案生態特征與生物界的食物網絡特征以及相互之間的關系,直接從檔案信息載體、檔案信息內容、原生數據源產生主體與客體以及檔案管理主體與客體角度,分析相互之間的在技術和管理、工作流程等層面的關聯關系、依存關系、印證關系、業務關系、價值關系、供需關系和制約關系等各類關系。原生數據源全鏈式管理運用鏈式管理理論與方法,對檔案管理技術、機制、模式進行優化和調整,打通檔案信息載體和信息內容、檔案管理與原生數據源形成者、檔案信息鏈上下游相關組織機構和檔案信息服務對象之間的技術和管理的壁壘,增強技術和管理上的協同性,以實現數據環境下對檔案信息資源的有效管理與服務目的。
(3)研究內容上的關聯性
數字檔案生態鏈管理較少涉及檔案信息載體和內容的鏈式管理問題,原生數據源全鏈式管理則將該部分內容納入重要組成部分加以研究。
檔案原生數據源全鏈式管理以“價值鏈”為導向,研究檔案的形成、管理和服務環境,包括自然環境、社會環境、經濟環境、政策環境、技術環境、基礎設施環境、資源狀態環境、制度保障環境等。數字檔案生態鏈管理則以“生態鏈”為導向,研究這些環境問題以及環境中的影響因素、文化現象、法律法規現象、信息交流現象、社會網絡現象和檔案信息消費現象等。兩者在研究內容上有一定關聯,也存在一定差異。
(4)研究對象上的統一性
檔案原生數據源全鏈式管理以原生數據為對象,數字檔案生成環節既包括常規的數字化加工生成過程和電子文件生成過程,也包括數字檔案管理環境的生成過程。數字檔案生態鏈管理也以原生數據為對象,但數字檔案生成環節僅包括數字化加工生成過程和常規電子文件生成過程。
數字檔案生態鏈管理把現實系統的檔案鏈式管理作為研究的內容偏少且宏觀性較強,檔案原生數據源全鏈式管理則將虛擬和現實相互融合的系統全部納入研究內容體系之中并注重微觀層面的設計。
(5)研究主體上的一致性
檔案原生數據源全鏈式管理與數字檔案生態鏈管理也有一定的相似之處,兩種管理都是基于檔案原始信息形成主體、檔案信息管理主體和檔案利用主體三者之間相互作用的鏈式依存關系,研究檔案管理的共生模式、共享模式、合作模式、協同模式、聯盟模式和混合模式等問題。
3 鏈式管理理論引入的必要性
現有的檔案管理方式如檔案數字化管理方式和檔案實體化管理方式,在數據時代存在著一些與技術應用實際情況相脫節或相掣肘的客觀問題。這些問題很大程度上阻礙了檔案工作的進一步開展,也影響了檔案資源的深入挖掘與服務質量,要求檔案管理和服務進一步創新發展。本文認為,鏈式管理理論引入的必要性有以下幾個方面。
3.1 信息技術的植根性促使鏈式管理。信息技術的植根性體現在數字檔案的形成、積累全過程,其制約性不斷增強,產生檔案本體和檔案管理對技術的依賴性不斷強化現象。
首先,檔案信息的形成過程大都依托現代的各種信息技術所提供的工具而產生。離開了信息技術工具,許多類型的檔案信息就失去了形成的技術手段[19]。從目前的情形看,即使使用其他手段和工具產生的原生信息,其絕大部分也需通過信息技術和數字化手段進行加工和處理,成為數字檔案信息源。
其次,檔案信息的管理過程和信息服務過程也離不開各種信息技術應用平臺的有效支撐。傳統的檔案管理方法和手段如果不能適應信息技術環境所提出的各種新的需求和要求,就必須加以改進和優化,否則,檔案管理與服務就很有可能被邊緣化,從而進一步加劇檔案管理與服務的被動局面。
其三,檔案信息的安全與保密工作也與各種信息技術所提供的信息安全與保密策略緊密相連。檔案的安全性和保密性在很大程度上依賴信息技術所提供的安全與保密策略的成熟度。
其四,檔案的信息載體和內容多數情況下由信息技術的各類要素在時間和空間上按一定的規則組合、裝配、匹配、鏈接、關聯配置而成。物聯網、人工智能、大數據和區塊鏈等新一代信息技術的不斷涌現、不斷成熟和深入應用,檔案信息載體和內容的這種信息技術依賴性將會進一步增強。
總之,信息技術元素已經深深植根于檔案本體之中,但通過觀察可以發現,“鏈接”關系是信息技術在檔案資源中的重要體現形態。從數字鏈接形態、數據鏈接形態、存儲鏈接形態、超文本和超媒體鏈接形態到區塊鏈形態等均表明信息技術的鏈接性質。從管理方式上講,信息存儲鏈接管理、網絡地址鏈接管理、信息節點鏈接管理以及價值鏈管理、知識鏈管理、創新鏈管理等,均體現了鏈式管理的廣泛應用。將鏈式管理引入檔案管理理論與方法體系,建立全鏈式檔案管理新模式,在數據時代既具有可行性也具有必要性。
3.2 數據業務的一體性需要鏈式思維。目前,無紙化和數據化速度不斷加快。在建筑設計領域內,BIM技術(建筑信息模型)[20]的廣泛應用是一個典型的例子。在生產制造領域內,也逐漸實現了數據化的工作模式,例如復雜裝備的三維建模設計,各類實時試驗記錄等重要內容,幾乎全部以數據化的形式呈現和利用,并參與到整體的業務流程運轉中。
數據化的工作方式必然產生只能以數據和數據鏈接的形態進行管理的記錄,由此帶來難以進行“實體化”管理問題。因此,檔案管理思維方式的轉變,建立數據的鏈式管理思維,實現“實體化”管理向“媒體化”管理的延伸,完成數據及其支撐環境管理的轉型就成為必然趨勢。
3.3 檔案信息的系統性要求底層鏈接。傳統的檔案管理方式,存在深入應用級進行管理的不充分性問題。傳統的檔案管理模式更注重檔案實體和檔案信息資源的目標控制、終端控制、靜態管理和事后管理開展檔案的收集、整理、鑒定、編研與開發利用工作,更多強調存量檔案的掃描加工或在線獲取有歸檔價值的目標信息,本質上還屬于檔案形成的末端控制、頂層設計或輸出層設計,沒有完全實現前端控制,具有用戶層級管理的特點。
這種方式獲取的檔案信息資源只是全部檔案數據中極小的一部分,對檔案內容信息、關聯信息和背景信息等缺乏深入的挖掘和管理,從而導致檔案數據獲取不全的問題,是檔案數據資源的完整性、系統性管理的隱患。
現行的檔案管理工作,對新技術應用不斷深化,但因數據時代的鏈式管理思維方式還沒有建立起來,相關應用結合度尚顯松散,技術應用缺乏實質性效果。因此,檔案管理由用戶級向信息化低層推進一個層面,進行應用級鏈接管理,可以在系統較低層獲取檔案數據,接近數據源并實現交互式收集和管理數據。
綜上所述,在數據時代,檔案的信息化管理和專業化管理已經離不開原生數據各個形成單位信息化和平臺化的管理活動。檔案原生數據源形成部門與檔案管理部門的信息化協同已經變得的不可缺少。
為了提高檔案信息資源收集和征集以及檔案管理與服務的效率和質量,需要采取全鏈式管理的方法,優化檔案管理流程和檔案管理模式,進行一體化設計,以適應信息技術在各行業的平臺化應用對檔案工作帶來的新要求。
4 原生數據源全鏈式網絡化管理模式構建
4.1 全鏈式管理本質。檔案原生數據源全鏈式管理本質是在檔案原生數據形成的平臺、主體、客體、載體和用戶之間建立關聯關系,全面構建包括檔案本體數據層面的鏈式管理、檔案形成單位協同化管理以及檔案形成的各類業務與信息平臺的接口化管理等在內的體系化檔案管理模式。
檔案原生數據源全鏈式管理的核心是活動主體和平臺的協同、檔案數據集合和模塊的鏈接、管理渠道和流程的暢通。
通過檔案原生數據源全鏈式管理模式的建立,在縱向和橫向兩個維度,將檔案價值鏈、信息鏈上下游各縱向節點、各橫向節點涉及的相關主體的工作職能活動和各業務環節按照協同化要求,實現工作機構、工作崗位和信息平臺的有效關聯和原生數據源形成的相互印證,共同構成檔案數據原生性內容體系和原始性憑證體系。
檔案原生數據源全鏈式管理需要建立一套統一的規則,對檔案原生數據形成的質量進行流程再造。流程再造包括建立數據集合、數據鏈接、安全預警、價值評估、反饋優化等內容。
4.2 全鏈式管理要素。原生數據源全鏈式管理所包含的要素包括活動主體、活動對象、活動載體、價值取向、活動目標、人力資源、縱向鏈接關系、橫向鏈接關系、縱橫向約束關系、技術手段和活動內容等。
4.3 全鏈式管理網絡。在鏈式管理理論中,管理者將各類管理要素分為節點、鏈接和關系三個基本要素。節點是管理要素當中的最基本的職能活動計量單元,這一活動計量單元既是一個相對獨立的行為主體,又具有一定的職責范圍和工作目標;鏈接主要是節點與節點之間在職能活動中存在的關聯關系;關系主要是指存在工作聯系的節點之間的鏈接屬性,主要包括對等關系、主從關系、無關關系、考評關系或價值關系等。一個組織的內部各類節點、鏈接和關系可以組成一個鏈式網絡,這個網絡可以稱為鏈式活動關系網絡。
在鏈式管理的運行模式中,主從關系往往采取領導和指揮管理模式;對等關系往往采取競爭和合作管理模式;無關關系往往采取指導和協調管理模式;考評關系或價值關系往往采取自評和互評相結合的管理模式。
檔案原生數據參與主體和平臺相互之間的鏈式循環是客觀存在的。原生數據的形成主體、檔案管理部門和檔案利用主體相互之間的節點、鏈接、關系也可以通過依存和制約關系的深度分析,形成檔案鏈式管理網絡,建立鏈式管理工作模式和管理體系。
4.4 全鏈式管理機制。檔案原生數據源全鏈式管理的工作機制包括檔案形成主體協同機制、檔案管理主體協同機制和檔案形成平臺協同機制三個方面。
在檔案原生數據形成主體內部按崗位職責協同方面,設置兼職檔案員負責檔案原生數據源全鏈式管理工作,包括數據集合、數據鏈接、安全預警、價值評估、反饋優化等工作內容。在檔案管理主體協同方面,檔案管理部門負責對各形成主體進行檔案數據的形成、歸檔和管理進行協調、指導、監督、檢查和評估。在檔案形成平臺協同方面,建立檔案原生數據形成平臺內各層次和平臺之間的數據生成協同與管理協同。
4.5 全鏈式管理流程。建立檔案原生數據源全鏈式管理的工作流程,需要在對檔案原生數據形成主體、檔案原生數據源形成平臺、檔案管理部門和檔案利用主體進行分析,明確各自的功能定位的基礎上,進行程序化設計和運行,包括清單組織、指導檢查、質量分析、整改落實、評價備案、歸檔存儲等六個環節。
(1)清單組織環節
檔案原生數據源涉及的形成主體需要對各自產生的檔案原生數據的價值和可信性等質量負責,根據檔案的歸檔范圍和保管期限的要求,確定檔案原生數據收集和管理的范圍并確定其相應的價值,以此建立檔案原生數據管理清單,為后續流程的順利執行提供依據。
(2)指導檢查環節
檔案部門負責檔案原生數據形成質量控制的業務指導、監督和檢查。檔案原生數據源相關責任主體負責對需要歸檔存儲的檔案原生數據進行真實性、可靠性、系統性、完整性、安全性和系統性的印證并建立質量印證臺賬。
(3)質量分析環節
相關責任主體針對檔案原生數據可能出現的質量問題,根據數據質量要求和可能出現的偏差進行正確性校驗和印證,并給出校驗分析結果和形成印證分析臺賬。檔案業務指導部門對印證臺賬和印證分析臺賬進行處理,提出確保原生檔案數據質量的整改工作建議。
(4)整改落實環節
檔案原生數據形成主體根據檔案業務指導部門的整改工作建議,對職能活動和業務平臺中所形成的原生數據所存在的質量問題提出具體整改方案并進行實施,改進工作方法和優化業務系統平臺,確保檔案原生數據形成質量。
(5)評價備案環節
檔案業務指導部門根據整改工作的進程和結果,對檔案原生數據的質量進行評估,分析整改工作可能存在的相關問題,提出進一步整改意見和建議,并將評估結果形成書面材料備案。
(6)歸檔存儲環節
檔案原生數據形成主體按歸檔時間和歸檔范圍要求,將高質量的檔案數據進行處理并按鏈式管理要求歸檔存儲。
5 檔案數據化鏈式服務的基本構思
5.1 檔案數據服務鏈的概念。檔案數據服務鏈是檔案原生數據源全鏈式管理的組成部分,是以檔案管理部門為核心,依托檔案鏈式管理服務平臺形成的檔案形成者與檔案用戶之間以檔案數據資源為載體的鏈式供需關系[21]。
5.2 檔案數據服務鏈的構成要素。檔案的數據服務鏈按鏈式管理的思維方式,可分為服務節點、服務鏈接、服務關系、服務機制、服務環境五種要素。
服務節點主要包括檔案原生數據形成者、檔案利用者、檔案信息平臺、檔案信息載體等;服務鏈接是服務節點之間存在的依存關系;服務關系分為主從關系、對等關系、無關關系和價值關系。服務機制是檔案數據服務鏈要素體系的運行方式和運行流程;服務環境主要是指對檔案數據服務鏈起影響作用的自然與社會因素所構成的環境,包括內部因素和外部因素。內部因素包括與制度、機制和體制設計相關的因素;外部因素包括政策因素、人文因素、技術因素、資源因素和時空因素等。這些因素的集合共同構成了服務鏈運行和管理的動力或約束。
5.3 檔案數據服務鏈的節點功能與聯系
(1)數據服務鏈節點功能
檔案數據服務鏈的節點體系中,節點是關鍵因素。檔案原生數據形成者、檔案利用者、檔案信息平臺、檔案信息載體等在服務鏈節點體系中分別承擔不同的角色和功能。
檔案的形成者和檔案的形成平臺既是檔案數據形成和收集管理的對象也是檔案數據服務的對象和檔案數據處理和發布的對象,是檔案數據服務鏈節點最重要組成部分,其主要功能是數據供應。
檔案管理部門和檔案管理平臺是檔案數據服務鏈核心節點,在檔案數據服務鏈式管理體系當中起主導作用,主要功能是數據管理與數據服務。檔案管理部門在檔案數據服務體系建設中,重點依托檔案數據服務鏈管理平臺根據數據服務鏈體系內所鏈接的服務對象,開展相應的檔案數據管理與數據服務。
檔案利用者節點是檔案數據服務鏈的重要服務對象。按照鏈式管理的基本模式,通過檔案數據服務鏈管理平臺,由各類檔案數據服務對象在平臺之中按照相應的鏈接關系,進行自組織完善各自節點信息、需求信息并針對檔案信息服務績效進行評價,具有自身數據組織和服務評價功能。
檔案原生數據源鏈式管理平臺,按照信息服務過程中的數據供需變化、服務質量評價等信息服務過程中生成的相關數據,進行檔案數據的自組織管理,以滿足動態服務需求,具有數據優化和數據支撐功能。
各類檔案數據載體節點,在未來可能包含自組織程序模塊,相對獨立于信息平臺,形成智能檔案數據生命體或檔案智能體,具有數據自主優化、信息自輸入輸出和知識問答等微管理和微服務功能。
(2)數據服務鏈節點聯系
檔案數據服務鏈各節點的連接方式,根據各自的節點功能分別采取移交接收方式、問答咨詢方式、線上下線方式等,各節點按一定方式交叉協同和優勢互補,以提升檔案數據服務績效。
檔案數據服務鏈體系節點數量、種類、質量、技術含量和節點之間鏈接關系、銜接關系、供需關系和人機交互關系等因素直接影響檔案數據服務的復雜程度。這種復雜程度的大小,有利一面是可以增加數據服務的活躍程度,不利的一面是如果鏈性關系組織不當或協同不力,檔案數據服務的效率和質量會因此受到消極影響。
5.4 檔案數據鏈式服務體系構建。傳統的檔案信息服務涉及的檔案查閱服務、檔案展覽服務、檔案編研服務、檔案檢索服務、信息導航服務、檔案咨詢服務、檔案社區服務和檔案網絡服務等服務類型,均可以作為檔案數據服務鏈中的各種服務類型,按全鏈式管理模式和方法進行節點設計、鏈接設計和關系設計,以此形成檔案數據鏈式服務體系。
檔案數據鏈式服務體系功能的發揮程度,取決于檔案數據在形成主體和利用主體相互之間數據、信息和知識轉移的效率和質量。其中,檔案數據資源的質量和數量是基本條件,各類主體相互之間的鏈接與關系的有效組織和信息技術的有效利用是重要保障,服務績效的反饋和評估是優化鏈式服務體系和進行模式改進的重要補充。
因此,檔案數據鏈式服務體系的建立和運行,需要按照鏈式管理理論和方法深度挖掘檔案數據資源、檔案關聯主體、檔案信息平臺和數據知識化轉移的機理及其相互之間的作用關系和作用路徑,并按照鏈內鏈外依存、制約、共享、交互、協作和競合等理念進行自上而下的詳細設計、構建和實施,以提升數據環境下檔案信息資源管理與服務的水平、質量與效率。
6 總結與展望
檔案原生數據源全鏈式管理既包檔案原生信息載體和內容的鏈式管理問題,也包括檔案原生信息形成者和數據利用者以及相關平臺的鏈式管理問題,本文對此僅提出了初步設想和初步探討。
還有一些問題值得進一步的研究,如全鏈式管理模式與現有管理模式對接問題、檔案數據資源鏈接描述問題、檔案管理與服務涉及的各種類型主體節點的具體設計和鏈接關系的具體描述問題、檔案原生數據源全鏈式管理模塊設計問題和管理平臺構建問題以及鏈式管理中人機交互問題和管理體系運行保障問題等等。
對于上述問題的深入研究,會不斷豐富檔案數據化管理和檔案數據化服務研究的內容體系,為數據時代檔案管理思維方式的轉變和檔案管理模式的創新提供更加系統的理論和方法參考。
本文系國家社會科學基金項目“智慧城市背景下的檔案信息化研究(項目編號:14BTQ070)”成果之一。本成果受航空經濟發展河南省協同創新中心、鄭州航空產業技術研究院、河南航空經濟研究中心、鄭航研究生教育創新計劃的資助。
參考文獻:
[1]于英香.檔案大數據研究熱的冷思考[J].檔案學通訊,2015(02):4-8.
[2]鄭丹妮.基于信息空間理論的歷史檔案數據化及其生存模式研究[J].檔案管理,2018(03):9-12.
[3]梁惠卿.檔案數字化、數字化檔案和數字檔案概念辨析[J].檔案管理,2013(01):38-40.
[4]李筱春.手段 途徑 結果——檔案數字化、網絡化、信息化三者關系淺析[J].蘭臺世界,2002(03):4-5.
[5]于英香.檔案大數據研究熱的冷思考[J].檔案學通訊,2015(02):4-8.
[6]王學平.淺議我國檔案數字化建設實踐與發展策略[J].檔案學通訊,2011(06):54-57.
[7]屠躍明,翟瑤.檔案數字化的元數據研究[J].蘭臺世界,2012(14):60-61.
[8]王協舟,王露露.“互聯網+”時代檔案工作改革的幾點思考[J].檔案學通訊,2016(05):94-100.
[9]于英香.檔案大數據研究熱的冷思考[J].檔案學通訊,2015(02):4-8.
[10]田偉,韓海濤.“互聯網+”視域下檔案信息化建設的四重境界[J].中國檔案,2017(10):70-73.
[11]齊力上,詹銳.樹立“數據為王”的檔案數字化建設理念[J].浙江檔案,2014(02):56.
[12]程璇,高志宏,胡翔.醫院科技檔案數據化管理模式探討[J].醫院管理論壇,2008,25(12):62-64.
[13]吳國柱,李東洋,曾利玲.網絡超鏈接分析初探[J].圖書情報工作,2002(11):70-72+42
[14]袁勇,王飛躍.區塊鏈技術發展現狀與展望[J].自動化學報,2016,42(04):481-494.
[15]潘虹,王子鵬.區塊鏈技術對社交媒體信息歸檔的應用探究[J].中國檔案,2018(06):74-77.
[16]陳勇.企業鏈式管理模式的理論研究[J].華東船舶工業學院學報(社會科學版),2004(02):67-70.
[17]王新華,佟強.工業企業鏈式管理模式簡介[J].煤炭企業管理,2002(01):44-45.
[18]梁惠卿.原生電子檔案概念辨析[J].檔案管理,2018(02):27-29.
[19]江彥. 數字檔案生態鏈信息流轉機制研究[D].華中師范大學,2015.
[20]梅園.BIM應用對檔案工作的影響與挑戰[J].城建檔案,2017(12):19-20.
[21]婁策群,徐黎思.信息服務生態鏈功效的影響因素及提升策略[J].圖書情報工作,2011,55(04):19-23.
(作者單位:劉永,鄭州航空工業管理學院;龐宇飛,航空經濟發展河南省協同創新中心 來稿日期:2018-06-15)