文/雷 榮 尹 君
本文立足于基層企業管理環境,利用Python的中文分詞工具,分析文檔信息形成的特征和文檔信息利用的特點,探尋文檔信息形成場景和利用場景之間的規律,構建用戶畫像和文件之間的關聯,實現文檔信息的智能服務
檔案管理部門管理對象多樣化,包括紙質檔案、電子檔案和業務系統中在線歸檔的檔案數據。“幾乎可以肯定的是,未來文檔管理一定是處于多態并存的局面,因而對管理對象的態勢感知顯得尤為重要,不同態別的對象需要與之配套協同的管理手段和方法。”[1]面對多態的管理對象,檔案管理需要采用精細化的管理方法和手段,探尋智能化的利用服務方式。雖然檔案利用逐步實現了電子化和網絡化,但是仍局限于以文件為單位的利用服務,檔案數據的深層次開發缺乏需求導向。檔案工作者需要掌握一套快速、準確的響應用戶的需求,提供檔案信息智能服務方法和能力。
在企業運行較為成熟的辦公自動化系統中,提取該系統中核心業務數據進行詞頻分析。在實際的公文處理活動中,公文的數據可以分為發文形成的數據和收文形成的數據。選擇公文標題和責任部門(形成部門和承辦部門)兩個維度,分析公文數據的形成和處理情況。
在規范的公文標題中包含發文機關名稱、事由和文種這三個要素,其中“事由”信息揭示了公文的主要內容。通過數據清洗剔除公文標題數據中的“發文機關名稱”和“文種”信息,對“事由”信息進行分詞和統計。
利用Python的結巴中文分詞,對公文標題中的“事由”數據進行分詞處理并統計出高頻詞匯。按照承辦部門分類統計收文的詞頻結果,按照形成部門分類統計發文的分詞結果,選取人事部門和財務部門在一定時期內形成和處理的公文數據,經過分詞、統計詞頻及數據的可視化后結果見下圖:




財務部門和人事部門的公文數據中“事由”涵蓋了部門基本職能,其中高頻詞反映部門的核心關鍵業務。通過文件標題“事由”部分的詞頻分析可以看出:在職能活動中形成了與崗位、職責高度匹配的文件信息。在企業組織環境中,組織中的崗位和職責賦予了文檔形成和使用者(簡稱文檔用戶)鮮明的特性,正是這些因素構成了文檔用戶特有的工作場景。他們在職能活動中處理各種各樣的文件,同時在職能活動中生成各種各樣的文件。
正如上圖財務部門和人事部門在各自的職能活動中,既需要處理大批與其職責相關的文件,也產生了文檔信息的利用需求。部門業務活動中形成的公文數據,能夠展示出這個業務活動的前因后果,也反映出部門履職過程和業務完成情況。例如:
關于開展某某活動的通知——起因
關于印發《某某活動方案》的通知——經過
關于上報《某某活動總結》的報告——結果
在職能活動中,用戶對文檔信息的需求來源于當前工作場景;同時需要再現和還原過去相關社會活動的時間、人物、行為、背景、情景關系等一系列場景信息。
場景思維就是利用場景來對問題進行思考,從需求行為產生的時間和背景等角度,對用戶需求從不同角度和不同維度進行分析和理解,探尋本質性的需求,并據此提供符合需求的產品或者服務。文檔利用工作者一方面積極挖掘企業文檔中包含的場景信息;另一方面從企業生產經營活動場景出發分析文檔信息需求,挖掘用戶在特定業務場景中文檔信息需求;最后將文檔信息場景和業務活動場景相匹配,提供符合場景需求的文檔信息,推送相應的文檔信息,提高信息需求和信息產品連接的效率和質量,實現文檔信息利用的智能化。
在復雜的人類社會實踐活動中形成了檔案,檔案是社會活動的原始記錄,檔案記錄各種各樣的社會職能活動。檔案記錄了社會活動時間、空間、目的、用途等一系列場景信息。業務活動中形成了其特定職責、業務范圍內的檔案信息。
黨和政府機關在辦理公務活動中形成了具有特定效力和規范格式的文件和檔案。這些文檔數據一般由“時間、部門、人員、事件、主題”等要素組成,反映了公務活動起因、經過、結果。可見,檔案形成于社會實踐的各個場景中,記錄和保存了當時的場景信息。
檔案信息的收集、整理、保管、鑒定、統計和提供利用管理工作,都是為了確保檔案信息的完整、準確、系統和安全,維護檔案的原始性。文書類電子文件元數據方案明確了文書類電子文件形成、交換、歸檔、移交、保管、利用等全過程中元數據的設計、捕獲和著錄要求[2];元數據描述記錄了文件的背景、內容、結構,包括文件生成和管理的全過程的數據,包括文件、機構和人員、業務以及其關系等數據[2]。這些元數據記錄了文件形成場景信息,包括文件形成時的組織機構、時間、人員、業務、行為及其相互關系等。文書類電子文件元數據的管理過程,既確保元數據的規范和完整,也維護了文書類文件場景信息的準確和完整。可見,檔案工作也是對檔案形成場景信息規范管理的過程。
檔案利用的過程是通過查找、使用或檢索檔案信息、獲取檔案信息的過程。實際也就是指檔案工作者通過一定的方式、方法,將檔案信息提供給利用者的過程。檔案利用活動包括檔案管理者、檔案和檔案利用者這三個主體。檔案管理者通過一系列的管理工作保持檔案信息的原始性,通過利用工作來滿足利用者對檔案信息的需求,實現了檔案的價值。檔案利用者需要通過各類檔案信息還原歷史活動的真實情景,指導當下的社會實踐活動。
但是在傳統以“關鍵詞”查詢為主的利用活動中,檔案部門守著浩瀚的文件資料卻不能滿足用戶的需求。這是因為傳統的檔案工作是以“文件”為單元,以檢索為目標,通過收集、著錄、分類、編目、提供利用活動開展工作。這種利用方式不能滿足用戶對文檔內容信息多維度的智能化需求。特里·庫克認為傳統的檔案工作重點是檔案實體的保管,在后保管時代檔案工作關注重點將轉為:檔案的來源、檔案信息的形成過程、檔案的形成目的、檔案之間的關聯關系和來源部門(單位)之間的職能業務關系,檔案形成部門(單位)、形成者的職責范圍等[3]。
當用戶以一定的角色首次登錄業務系統時,系統根據用戶基本信息(如崗位、職責)結合業務系統中已有的相似角色或歷史角色信息,分析構建這個用戶“畫像”。系統定期分析該用戶在系統中形成的信息和處理的信息,不斷地修正用戶“畫像”。系統將具有相關職責的用戶活動信息進行分析,形成一定主題或一段時期內相似的用戶群的“畫像”。這樣在相對穩定的組織場景中,通過分析特定職責用戶信息記錄,積累形成用戶的信息需求特征。
改變傳統的以檢索為目標的信息收集和采集方式,注重背景信息的收集。利用信息技術,挖掘用戶在業務活動中形成和處理文檔信息的規律,利用信息技術,分析數據特有的場景信息,以此構建以特定要素為基礎的文件群,通過特定的算法為每一個用戶推薦其高度關注的文檔信息。
在用戶日常的業務活動中,通過活動場景觸發特定的用戶畫像,完成需求與信息產品的匹配,形成關聯性高度匹配的文檔信息集合推送給用戶,實現檔案信息服務的智能化。
在業務活動場景中由職能要素關聯用戶文檔需求。建立職責要素的用戶畫像,用戶在職責要素下形成的文檔群,用戶在職責要素下處理的文檔群;用戶在職責活動中觸發潛在的文檔需求,系統將“形成文檔群”和“處理文檔群”中相匹配的文檔推送給特定的用戶。
當然在實際的業務系統中,這里的匹配要素可能不僅僅表現為“職責”,也可以是“專業”“學科”“工作節點”等。根據不同的業務場景具體分析,我們才能夠滿足用戶需求的多樣性,滿足用戶潛在需求。
總之,文檔管理部門應轉變思維,立足于企業信息化建設中積累的數據信息,立足于多樣化的業務場景,運用成熟的信息技術分析用戶需求規律,摸索出適合本企業文檔信息的開發模式和智能服務方式,實現文檔信息價值,改進文檔信息服務質量和效果,提升企業檔案管理的精細化水平。