侯耀晨
杭州易康信科技有限公司創始人
“數字時代,萬物皆數”,業務數據的長久保存可使數據轉化為數據態檔案,讓檔案從“保存備查”的“地下油藏”增值為“知識利用”的“石油資源”。
一個民營企業十余年來的創造性實踐顯示:數字資產的管理不僅是一個關乎國家機關和民生部門歷史數據資產搶救與保護性開發的趨勢產業,也是一個正在不斷增長的剛需市場。這家開辟了一個細分產業運作標準的企業就是“易康信”。
2023年,由中國人民大學檔案學院主導,易康信參與研發的《結構化數據環境下國家文件(檔案)管理模式研究》課題,入選國家檔案局科技項目。
相關組織平臺披露的資料顯示,該項目曾于2021年入選浙江省檔案局科技項目。項目啟動至今,已歸檔的結構化數據條目達6700萬條,創造性地解決了原生數據檔案全流程、全管控、全生命周期管理運行模式,并在此基礎上探索了區塊鏈技術賦能傳統業務的標準和流程,即以區塊鏈技術作為存證手段對數據進行存證,保障數據的來源可靠,管理過程可溯。
易康信,全稱杭州易康信科技有限公司。自2007年創立以來,該公司一直在其創始人張雷的帶領下深耕大數據管理和應用市場,尤其是在政務業務類辦事應用系統的研究和探索方面,積累了一系列示范性的案例和科技成果。
“我們創新性地針對政務業務搭建了政務業務系統原生數據預歸檔平臺/模塊/組件,開創了業務系統原生數據歸檔(結構化數據+非結構化數據)新模式,突破了結構化數據歸檔瓶頸,在結構化數據檔案細分領域取得了卓有成效的業績。”張雷說。
據張雷介紹,易康信目前服務過的典型案例有嘉興市住房公積金管理服務中心、社保中心等政府民生部門下屬數據管理部門業務的結構化數據歸檔試點項目。
由于在結構化數據管理領域的原創性貢獻和長期技術積累,易康信入庫2022年度國家級科技型中小企業,參與了2021年度浙江省檔案科技項目、2021年度中國(杭州)人工智能小鎮項目專項評審,以及2023年度國家檔案局科技項目計劃等重大項目,成為研究成果和技術實力得到業內廣泛認可的頭部企業。
目前,張雷本人及易康信已累計獲得18項軟件著作權及多項相關軟件專利,這些技術均已實現了商業化和市場化應用。由于在結構化數據檔案管理研究和應用領域的原創性貢獻,張雷本人還被吸收為中國檔案學會和中國軟件行業協會會員。
“在全國能夠實現民生業務系統的結構化數據檔案化管理,而且還能在業務側、電子檔案室以及國家檔案館之間跑起來的,你們目前還是首例。”對于中國人民大學信息資源管理學院(前身為“檔案學院”)劉越男教授的肯定和鼓勵,張雷深懷感謝,他說:“這一路走來,做一件從0到1的事情,我們經歷了太多考驗。”
數據檔案是不可篡改的歷史記錄
為什么數據資產化管理和數據檔案化會成為一個戰略性的新興產業?
自中學時代就酷愛研究歷史典籍的張雷首先從“歷史”和“檔案”的特點說起。
“譬如歷史上的禪讓制,不同的人會講出價值導向不同的故事,你很難順著每個故事的邏輯線索追溯到可信的證據。”張雷解釋說,而檔案信息,必須符合來源可靠、程序規范、要素合規等關鍵條件,這也是檔案法的要求。
從這個意義上來說,檔案信息在邏輯鏈條上必須能夠實現可追溯,可查詢和利用。
當人類進入信息和數字社會后,無紙化辦公成為主流發展趨勢,各個行業和組織都產生了不斷積累的大量數據資產,這些數據的標準化歸檔管理成為必須面對的嚴峻問題。
在這些數字資產中,大量圖片(JPG、JPEG等格式)、影像(WMV、ASF等格式)、文字(Word)等非結構數據信息等文本或者非文本的數據信息,適合存入非關系型數據庫中,并使用NoSQL進行查詢。同時,與以數字、符號等可以放入關系型數據庫表格內的結構化數據(典型的結構化數據也被稱為“定量數據”,包括:信用卡號碼、日期、財務金額、電話號碼、地址、產品名稱等能夠用數據或統一的結構加以表示的信息)建立可持續利用的關聯關系。
以民生領域的數字資產而言,海量的業務數據是以離散二維表的形式存在于關系型數據庫之中,這些數字資產一旦脫離應用平臺建立的語義關系,就無法使用,如何脫離語義環境,擺脫離散數據對軟硬件的依賴,重塑語義環境就成了一個巨大而緊迫的問題。
因此,如何統一歸檔保存此前分散于不同行業、部門、企業和組織內部,尤其是一些老、舊、關、停組織和企業系統的海量數字資產歸檔問題,首先是一個緊迫的搶救性恢復和保護工程。其次,更是一個挖掘海量沉睡數據資產,進行保護性開發和利用的新興產業。
以浙江嘉興住房公積金、嘉興民政局路名及門牌管理系統、嘉興人社局養老金管理系統等政府關鍵部門下屬數據管理部門相關業務的結構化數據管理項目而言,要實現這些部門結構化數據的歸檔工作,要求技術和執行團隊必須了解檔案部門的業務邏輯,懂醫療、社保等業務運行邏輯,還要熟悉結構化數據向半結構化數據歸檔管理的軟件開發與運行邏輯。
正是在此背景下,易康信參與的《結構化數據環境下國家文件(檔案)管理模式研究》等課題,入選國家檔案局科技項目。
張雷介紹說,2023年易康信技術團隊正在服務的項目有7—8個,當地的業務數據檔案化管理需求與日俱增。
目前,結構化數字檔案管理領域的產品研發、服務規模和服務能力,遠遠無法滿足我國加快推進“十四五”時期檔案事業高質量發展的要求,張雷分析說。
按照2021年中共中央辦公廳、國務院辦公廳印發的《“十四五”全國檔案事業發展規劃》中提出的要求,十四五期間,我國要通過完善檔案信息化發展保障機制、加強電子文件歸檔和電子檔案移交接收,以及加速數字檔案館(室)建設、推進檔案信息資源共享平臺建設等關鍵措施來加快推進檔案信息化建設。
同時,《規劃》中還提出,要通過完善檔案科技創新和應用機制、加大結構化數據歸檔的攻關力度等措施加快推進檔案科技創新,助力檔案工作由數字化向數據化的轉型升級。
對應《規劃》中的相關要求,張雷分析說:當前一個地市要完成一個民生領域標準較高的結構化數據歸檔管理與保護性數據搶救項目,如果要基本覆蓋一個地區黨政機關、團體、企業事業單位和其他組織的檔案信息化建設將需要投入更多資金。
“足球隊長”的榮耀和夢想
張雷1994年畢業于北京信息工程學院的計算機輔助管理專業,這個專業實際上是國內最早的會計電算化專業。
在校期間,由于專業課不是太忙,張雷一度對于自己深愛的歷史典籍投入了巨大的研究熱情。此后,他對編程和寫代碼產生了濃厚興趣,并成為同學圈里公認的技術大牛。
臨近畢業時,由于浙江證券需要一個“懂會計知識+計算機的人”,張雷成為理想的人選并進入浙江證券。浙江證券被方正集團收購重組為方正證券后,張雷來杭州發展至今。
在1994—2007年這服務于浙江證券的十多年中,張雷深度參與了公司NOVEL局域網的搭建等信息化工作,成為公司倚重的技術骨干,并逐步走上管理崗位。
在浙江證券期間,張雷還發起組建了浙江證券足球隊,參加了由中國證券時報組織的新蘭德證券杯足球比賽。
“我們當時代表浙江證券,在跟國泰隊、君安隊等幾十家小組賽中一路殺出,最終拿到了冠軍。我們后來還參加了中國證監會和證券業協會組織的其他足球比賽,也拿到了好成績,因此領導很賞識我。我曾在1997—1998年被評為公司的先進工作者!”回想當年的激情賽事,張雷自豪地說。
2007年之后,張雷離開浙江證券,創辦了易康信。
最初幾年,他曾經從事過硬件銷售、系統運維等傳統IT(計算機)業務。此后,隨著電子政務的興起,張雷在服務一些政府機關與企事業單位過程中,在自己熱愛的歷史、檔案管理和信息技術的業務交集之間找到了用武之地,逐漸把公司核心業務聚焦于數據檔案化技術產品的自主研發和應用方向,并成為該領域一系列原創技術及方案的主要開創者。