楊世英
摘 要:在海量科技檔案數據中如何找準信息,如何使借用件、共用件關聯有用的信息是科技檔案工作者面臨的一個重要課題,本文對企業科技檔案管理面臨的困難進行了論述和分析,提出有效解決遇到問題的一些建議,以期能為我國各科研單位的科技檔案管理提供參考。
關鍵詞: 科技檔案;管理;關聯;信息
1 引言
當“互聯網+”概念迅速走紅,當“中國制造2025”正在推動制造業的智能化升級,當大數據和云計算正在推動形成新的消費理念、商業模式和產業形態,信息技術已經滲透到幾乎所有的領域。隨著研究院數字檔案館的建成和運行,幾年來無論是傳統載體的數字化,還是電子文件系統的建設,都產生了大量的檔案數字信息,過去科技檔案借用件、共用件的應用,無論在紙質檔案或《檔案管理系統》檔案都無法實現關聯,過去的傳統檔案管理已不適應目前研究院的檔案信息化建設要求。通過加強對數據管理與數據的標準化、優化數據庫性能,持續提高信息資源的傳遞和共享水平,從而做好科技檔案數字化管理中信息關聯問題,加強檔案信息化建設,提高信息服務的自動化水平。
2 科技檔案
科技檔案是指產品在研制、生產活動中形成的具有保存價值的各種技術文件。科技檔案材料主要是由本單位自己編制形成的,但與本單位科技、生產活動有直接關系的其他單位提供的、轉讓的、引進的、移交的科技文件材料,也都視為科技檔案材料。借用件、共用件是指從已定型(或鑒定)產品中借用的零、部、組件;共用件是指同一型號中共同使用的零、部、組件。
近年來,我院檔案主管部門非常重視檔案信息化建設,隨著科技信息技術的應用和數字檔案館建設,產生的大量科技電子文件(科技電子文檔)形成一個巨大的檔案數字資源。
3 當前科技檔案管理面臨的困難
3.1 快速而準確地找到所需的信息。如何在大量的科技檔案中快速而準確地找到所需的信息,是檔案服務要解決的首要問題。在大數據時代,科技檔案數量急劇增長,在進行檔案查詢時,往往需要的信息會被埋沒在大量的不需要的數據中,并且檢索性能急劇下降,甚至無法響應,即:“找準信息”。
3.2 科技檔案數字化管理中借用件、共用件信息關聯問題。檔案凝結了企業在科研、生產及經營管理等活動中所創造的全部成果,具有重要的參考價值和借鑒作用。尤其在新產品的研制或產品的改進改型中,通過借鑒檔案資料幫助企業快速、準確地設計產品尤為重要,借用件、共用件、關重件等使用非常常見。近年來,我院“檔案管理”系統平臺實現了與協同工作平臺、PDM、OA等主要業務系統的集成,電子文件實現了實時在線歸檔和自動采集,加上館藏檔案的數字化,檔案數據量的激增,不可避免地會導致用戶從大量的檔案中找到所需的消息并與之關聯難度增大。目前在科技檔案借用件、共用件關聯運用中,工作界面程序就多,耗時過長,使用不方便。譬如某套科技圖紙中有一張圖紙是借用件需要關聯,數據不在同一庫節點,根本做不到數據消息關聯,即使數據在同一庫節點上,也需要在檔案管理系統中進入2次界面,有時還出現對所需的資料檢索不到或死機現象,最后還得逐條在成千的圖紙中挑其中的這張圖紙才能關聯。
4 大數據時代科技檔案管理解決方案
為了解決在大量科技檔案中“找準信息”和“借用件、共用件信息關聯”的問題,要做好以下工作。
4.1 首先要全面收集和保存科技檔案數據。只有全面收集和保存科技檔案數據,才有可能在科技檔案數據庫中找到所需的信息。資源類數據包括館藏檔案經過數字化加工而產生的各類電子檔案,PDM、CAPP、OA等系統存儲的各類電子檔案,檔案信息網建設和維護信息。在企業檔案信息化建設過程中,如果我們具備保存海量數據的條件,首先要盡可能多地收集和保存數據,做到全覆蓋,不能因為數據量大,處理復雜,保存代價高等一系列主客觀原因,而放棄暫時對科研生產無關的數據。檔案工作其實是一項繁瑣的工作,尤其是科技檔案工作,我們永遠不知道哪份科技檔案哪一天要用,對哪個人有用,不知道這些數據可能就是明天科研人員需要關聯的數據信息,因此,在科技發達到能夠存儲海量數據的今天,我們理應全面收集和保存好科技檔案數據,需要保存的文件,確保得到及時收集、分類歸檔。對任何一份科技檔案都要做到寧可一直用不到,也不能出現科研人員用到時不能方便找到的現象。
4.2 加強對數據管理與數據的標準化。建立數據管理規范標準,嚴格規定科技檔案各類信息的著錄格式、著錄細則。由于數據庫存儲和利用的特殊性,可能幾年以前形成的數據現在已經無法利用,或者數據不能有效地讀取。例如:受控文本的錄入必須用半角格式,否則在全文批量掛接上傳時,因格式不匹配而無法掛接全文。因此,我們要規定受控記錄的范圍、格式與填寫要求,確保檔案信息錄入完整、準確、規范,培養時時更新意識,要派專門檔案人員及時對數據庫進行更新和核準,只有做到這些,才能提高數據質量,確保檔案材料的齊全、完整和準確性。具體包括科技資料更改、替換、銷毀的時間、依據、階段標記、內容、責任者,確保文件的更改和現行修訂狀態得到標識,關聯數據時就不會不同階段的資料一股腦兒地全部跳出來,防止作廢文件的非預期使用,而確因需要而保留作廢文件時,對這些文件進行標識,以防誤用;根據商業秘密的級別,對資料(含涉及商業密級的檔案資料)密級做相應密級調整,將檔案系統中文件條目“商業秘密級別”按要求標識“最重要”“重要”“一般”,PDM系統歸至《檔案管理系統》的電子檔案,除PDF格式外,WORD格式也同樣標識商業密級;科技成果補錄成果完成人,確保使用者輸入完成人的部分信息能夠關聯到該科技成果詳細科研資料。做好記錄的標識,以便使用者快速而準確識別、檢索和使用。才能有效進行數據信息關聯,進一步推動檔案信息化進程。
著錄規則包含技術文件、光盤、整套圖紙、底圖以及設計更改單、技術通知單、工程更改/偏離單等,數據庫中所著錄的標點符號都為英文半角格式。在著錄數據庫條目時,不允許覆蓋,如有換版的情況產生,必須新建條目著錄,并修改原條目中“文件狀態”欄目的屬性。圖/文件號按歸檔資料上的實際圖/文件號著錄,著錄要求完整,PDM系統數據此項為必錄項并推送至檔案管理系統;歸檔單位按資料歸檔單位填寫,用中文著錄,不可用數字或符號表示,兩個以上單位合作歸檔的資料,幾個單位全部著錄,單位之間用“/”分隔;責任者指資料的編寫者或建議者。外來資料如無明確“責任者”時,填寫資料形成單位。歸檔資料無明確編寫者,注明歸檔人或單位,例如:王君(歸);某某單位(歸)。譯文資料根據情況要注明歸檔人或單位,例如:李四(譯);形成時間指文件簽署頁的批準欄目中最后的日期,統一由8位阿拉伯數字組成,如2008.01.01;歸檔時間指文件或單據移交檔案主管的交接時間,統一由8位阿拉伯數字組成,由系統自動生成;密級指歸檔文件或單據上所標識的密級,如內部、秘密、機密、絕密。外來文件未標識密級的,填寫內部。密級變更后,應在備注中說明變更人、變更日期、變更依據文件;載體類型指文件資料存儲介質,分為紙質、光盤、磁盤、硬盤、膠帶等;文件狀態指文件現在的狀態,包含:現行、下架、作廢、封存、撤銷,文件發生換版等動作時應更改其狀態。
要快速而準確地關聯到所需的信息,必須嚴格按科技檔案各類信息的著錄格式、著錄細則規定操作。
4.3 對數據庫進行性能優化。原始數據往往由于在數據結構、數據組織、數據表達等方面與用戶需求存在不一致的地方,需要進行數據信息轉換與處理。數據信息轉換后仍不能達到數據信息化關聯的,則系統存在性能瓶頸,需要進行數據庫性能優化,就必須部署新的技術,繼續升級檔案資源管理系統平臺。
5 結束語
大數據時代,作為科技檔案管理人員有責任、有義務主動思考科技檔案管理中面臨的問題,并提出解決遇到問題的相關建議,切實推動研究院科技檔案工作的發展,同時我們將會積極參與到智慧研究院科技檔案管理建設過程中。