王靜
(南京航空航天大學檔案館 南京 210001)
科研機構、高等院校在從事科研活動和教學育人過程中,為國家、社會創造了許多科研成果,同時也在不同科學技術領域孕育了大批取得突出成就和具有較大影響力的人物,他們在科研活動中形成的歷史記錄,就被稱為科技名人檔案[1]。科技名人檔案資源建設就是要圍繞他們的科研、工作、教學活動,形成能夠完整反應其學術成長脈絡、科學研究成果、科學文化精神的資源整體。
目前,國內已有部分學者提出構建科技名人檔案數字化管理的系統框架,提出對科技名人檔案從數字管理到知識管理[2],以及如何激活蘊藏在科技名人檔案內的深層價值[3]。有部分學者對檔案資源整合的方法、機制等進行了研究,例如,探索了“資源優先級選擇—方法應用—服務集成”[4]的檔案資源整合路徑,和基于SOA的檔案資源整合方法[5]。還有些學者對我國高校及綜合檔案館名人檔案資源建設現狀進行了實踐分析與研究[6]。但總體而言,相關研究的視角與思維面仍舊相對零散,且缺乏對科技名人檔案資源建設的深入研究。因此,筆者認為科技名人檔案資源該如何建設這一議題有著重要意義,并在前文中已經進行了動因和思路的分析[7]。
為了更好地發揮科技名人檔案的價值,為科技名人檔案資源深度開發利用提供數據基礎,第一要義就是實現對科技名人檔案資源的富集和整合,并對整個過程實施全過程管理與保障。
從實踐現狀來看,目前科技名人檔案資源建設主要依靠兩類主體,一是科技名人工作、學習的單位,二是由國家機構指導、各部門聯合的專門組織。
(1)立足本機構的獨立整合。整體來看,國內科技名人檔案資源整合規模、整合形式、整合程度等仍有很大的發展空間。中國“985工程”高校大部分都依托于已有的檔案資源,建立了名人檔案數據庫,或名人全宗,但專門為科技名人檔案集中整理的高校很少,科技名人檔案常常與其他名人檔案集中在一起。例如,南京大學檔案館匯總了曾經在南大學習或任教,而后當選為中國科學院院士或中國工程院院士的杰出科學家名單,并將本館內存有的檔案資料、照片、實物等進行了重新整理,并在其校史館網站上設立了院士墻[8]。這些檔案館、圖書館對名人檔案的收集與保管基本實現了數字化,保證了本館范圍內檔案實體整合與數字信息整合,并依托檔案網站或校史館,向公眾開放宣傳,是反映本單位科學研究發展歷程的重要資源,具有鮮明的個性化色彩,同時還具有長期性、持續性的特點。
(2)聯合多機構和跨機構的整合。除各單位檔案館、圖書館對本單位科技名人檔案進行內部整合與開發外,中國科協提出了“老科學家學術成長資料采集工程”(以下簡稱“采集工程”),依托該采集工程相關成果創辦的中國科學家博物館(網絡版)是目前中國最大的以名人檔案信息為主要傳播內容的科技人物專題網站[9]。科技名人檔案資源建設以項目申報的形式開展,每一個科學家就是一個子項目,在中國科協調宣部指導下,將不同子項目移交給各省、各單位獨立開展。因此,這種資源建設形式以項目為主導,具有明確的階段性特點。
通過對實踐現狀的分析,發現目前科技名人檔案資源建設存在收集范圍較窄、整合層次較低、開發深度有限等問題。
(1)收集范圍較窄。科技名人檔案資源建設多為單位內的檔案館、圖書館內部自我收集,缺少對非本單位隱性資源的廣泛采集。在“采集工程”開始之前,各單位僅在自身范圍內對現有資源進行整理和集中,并且不會單獨區分科技名人檔案和其他名人檔案,只是將其籠統地整理在杰出校友或名人檔案中。這些單位大多都處于各自為政的狀態,科技名人檔案收集的完整性,以及名人檔案管理的規范性與科學性均有待提高。
(2)整合層次較低。目前對科技名人檔案資源的整合多為紙質檔案資源與數字資源的一次整合,仍舊停留在實物整合與紙質文本數字化整合的階段,并未上升至信息整合甚至知識整合的程度。上述提及的“采集工程”項目形成的全國科技名人檔案數據庫雖正在持續建設中,但目前仍未形成一定的知識體系。
(3)開發深度有限。對科技名人檔案數據的管理仍舊停留在“保姆機”階段,檔案信息只是存儲在數據庫中,未能展現這些數據之間的內在聯系以及科技名人的學術網絡等知識體系。對相關檔案信息數據的開發僅僅停留在信息的直接檢索與展示,對資源內部隱性知識挖掘與分析很有限。
科技名人檔案資源建設響應國家文化的戰略需求,滿足資源整合的現實需求,實現多層次整合的技術需求,是弘揚老科學家精神的有效途徑。
(1)國家文化的戰略需求。2020年9月11日,習近平總書記主持召開科學家座談會并發表重要講話。習近平指出,科學成就離不開精神支撐。科學家精神是科技工作者在長期科學實踐中積累的寶貴精神財富。李克強總理在國家科學技術獎勵大會上呼吁“弘揚科學家精神”;胡錦濤總書記在紀念中國科協成立50周年大會上,提出要有針對性、有重點地采集整理老科學家的學術成長資料。科學家精神是中華民族寶貴精神譜系中的重要組成部分,值得我們認真學習、挖掘、發揚與傳承,做新時代科學家精神的傳承者與創立者。
(2)資源整合的現實需求。為了更好地傳承與發揚老科學家精神,中國科協提出了“老科學家學術成長資料采集工程”,并依托該采集工程相關成果創辦了中國科學家博物館(網絡版)。但對于科技名人檔案資源的整合仍舊存在范圍窄、層次低、開發深度有限等問題。解決上述科技名人檔案資源整合的現實問題,能夠更好的傳承與弘揚科學家精神,提升采集工程的效果,因此存在著對科技名人檔案資源整合的現實需求。
(3)多層次整合的技術需求。從科技名人檔案資源整合的現狀來看,以往檔案資源的整合工作多為本單位內部資源整合,資源整合僅僅停留在本單位檔案資源的實體整合層次,資源類型也有一定的局限性,并未達到跨媒體數據整合乃至知識整合的層次。但弘揚老科學家的科學精神則要求實現對科技名人檔案資源的深層次開發,過去那種簡單的實體整合已經不能滿足這種要求。因此,需要檔案工作者實現從過去的單一整合向多層次整合發展。
科技名人檔案資源從其形成角度可以分為兩種類型:原生科技名人檔案資源和建構性科技名人檔案資源[10]。原生科技名人檔案資源是指“本來就有的或者說既有的”[11]科技名人檔案資源,主要包括收藏、保管在各單位檔案館、圖書館、名人所在部門檔案室等機構的檔案資料,以及散存在個人手中的信件、手稿等實物檔案。建構性科技名人檔案資源指“由檔案工作者或其他記憶機構工作人員主動記錄、主動建構的”[11]科技名人檔案,例如口述資料、訪談記錄等。
將科技名人檔案資源完整地收集在一起是后續資源整合的基礎。與傳統檔案資源收集不同,科技名人檔案資源來源廣、門類多、載體類型雜亂,這就要求檔案工作者要積極地將收藏、保管在各學校檔案館、圖書館、科研單位檔案室等機構的檔案資料,以及散存在個人手中的信件、手稿等實物檔案廣泛地收集與整理。特別是科學家早期的許多原生存量檔案資料,由于時間久遠,存留下來的數量少且完整度較低,需要花費大量的時間和精力尋找線索。還要求檔案工作者或其他記憶機構工作人員主動記錄、主動建構[11]科技名人檔案。
科技名人檔案具有更強的個性化特點和非官方屬性[12]。科技名人檔案資源建設的目的是為了更好地展示科學家學術成長的歷程,挖掘其學術研究過程中蘊含的科學家精神。因此,收集科技名人檔案對檔案工作者提出如下要求:一要人性化,盡可能緊密地與科學家本人進行溝通和交流,盡可能密切地與其周圍關系親近的人保持聯系,掌握更為全面、個性化的檔案資源。二要多維化,從不同維度出發,通過內部收集、社會征集、本人捐贈、口述訪談等多種渠道和途徑,構建出生動、完整、立體的科學家形象。三要常態化,保證檔案收集工作能夠常態化進行,保證后續形成的檔案資料能夠源源不斷地納入整個資源體系中。
科技名人檔案資源收集的方式包括內部收集、社會征集、本人捐贈和口述訪談。
內部收集。將科技名人在科研機構、院系從事學習、教學活動、科研工作過程中形成的檔案材料,按照本單位檔案移交要求,采取定期歸檔的方式集中在本單位檔案館(室)中。
社會征集。親朋好友、同事、校友、學生等社會人士手中往往保存著大量零散的資料,這些資料為我們認識科學家提供了新的角度,是科技名人檔案資源的重要補充。此外,還可以圍繞科技名人的家鄉、就讀地方展開調研走訪,與相關的高校檔案館、地方檔案館、圖書館及方志館的展開交流。對于這些散存在民間及社會各界的檔案資料,可以采取征集、購買或復制的方式收集。
本人捐贈。本人配合與否,直接關系到科技名人檔案資源建設的好壞。許多珍貴的手稿、實物都是通過科學家本人直接捐贈而獲得的。因此,構建科技名人檔案資源體系,不僅要征得本人的同意,獲取對方的信任,還要在整個過程中與其保持聯系與交流,定期向對方告知資源建設進展和問題,保證資源建設的順利開展。
口述訪談。科技名人口述檔案是以科研專家及其周圍親屬、朋友等相關人士為立檔對象,進行口述歷史訪談形成口述資料,并在與傳統檔案文獻史料進行校正稽核后,以錄音錄像、書籍等形式歸檔保存的文字與聲像資料[13]。通過口述訪談的形式能夠獲取很多科研、生活的真實細節和有意義的小故事,而這些細節在科研成果中往往很難體現出來。
科技名人檔案資源整合主要包含兩個層面,即數據整合層和知識整合層。數據整合,要求實現科技名人檔案資源的數字化工作,構建異種異質異構科技名人檔案數據庫。知識整合,要求利用新一代信息技術實現科技名人檔案知識的整合、挖掘與共享。
實現對科技名人檔案的富集僅僅是科技名人檔案資源建設的第一步,僅能滿足本單位對檔案資料的普通查詢利用。而要實現進一步的檔案資源整合與共享,前提必須要實現檔案數字化,只有把傳統介質的檔案通過掃描、拍攝等方式進行數字化處理,轉化為數字化檔案,在相關領域詞表、標引規則的指導下對數字資源進行標引,描述檔案資源元數據,把資源有序化,并在此基礎上構建科技名人檔案數據庫,從而實現數字資源的檢索與共享[2],才能在網絡中傳播,實現跨時空的共享[14]。對于前述提及的采集工程而言,就是構建對于老科學家學術成長資料庫。
此機制就要求對于不同類型、不同性質的科技名人檔案或資料要按照標準格式采集并存儲,并將其保存在統一的數據庫中,這就形成了原始的異種異質異構科技名人檔案數據庫。在這一數據庫中保存有最原始的數字化科技名人檔案信息,是科技名人檔案資源進行知識整合的數據來源,同時也是進行知識層面整合的數據基礎。
實現數據層面的整合僅能滿足用戶的一般利用需求,但是對于“數智”時代的用戶(研究者)來說,他們更希望能借助于數據挖掘系統、人工智能系統發現信息的隱含價值,從而發現和創造新知識。對于采集工程而言,就是希望在保障“檔案資料可靠完備”的條件下,能夠提供知識分析,發現老科學家的師承關系、交往的人際網絡、科研合作等,進一步挖掘老科學家學術成長的規律[2],實現知識的有機聚合。因此,需要對科技名人檔案資源進行第三層次的整合——知識整合。
以關聯數據為基礎的知識整合機制為例,關聯數據的本質是通過定義URI規范,使用戶利用HTTP機制和URI機制獲取關聯化的數字資源信息,通過“打破封閉環境——減少數據冗余——形成關聯訪問”,實現對檔案資源的整合[15]。以關聯數據為基礎的科技名人檔案資源整合機制,與數據整合機制聯系緊密,包括關聯數據創建、發布和應用。
(1)資源描述:創建關聯數據。科技名人檔案資源是由不同來源、不同類型的檔案資源組成,數據庫具有異種異質異構的特點。為了便于統一描述資源,需要制定統一的元數據標準格式,以實現元數據之間的互操作。將基礎數據庫中收集的異構科技名人檔案元數據進行數據清洗和規范后,使用RDF描述,創建統一、規范格式的RDF關聯數據。
(2)資源聚合:發布關聯數據。創建關聯數據后,遵循URI的復用原則發布關聯數據[16]。通過詞表映射、實體識別、數據聚合等操作,建立以RDF語義鏈接的科技名人檔案資源間的關聯關系,形成相關關聯描述及可供訪問服務的RDF關聯數據共享庫。并通過實體識別在不同的數據共享庫中建立同一實體數據之間的關聯。
(3)資源服務:知識表示、描述和重組。這要求我們不僅可以對科技名人檔案資源數據進行語義鏈接,對其進行互聯與日常維護外[17],還可以為用戶提供HTML或RDF瀏覽與檢索,并提供其他形式的深度應用[18],通過可視化呈現的方式,實現知識表示、描述和重組。例如,基于館藏名人數據資源,應用知識圖譜技術挖掘科技名人檔案數據之間的關系,從而實現深層次的科技名人知識化服務。還可以通過對不同媒體間名人檔案數據的關聯,實現跨媒體科技名人知識關聯,建立“視聽一體”的科技名人檔案檢索平臺。
前文較為詳細地闡述了科技名人檔案資源建設的機制框架,為科技名人檔案資源建設實踐提供了可能的工作方向和路徑。接下來的問題是,應當通過怎樣的制度來保障整個科技名人檔案資源建設的實施過程。基于此,我們應當開始關注資源建設的全過程保障體系。我們將保障體系劃分為三個關鍵內容:業務性保障、組織性保障和制度性保障。

圖1 科技名人檔案資源建設保障體系框架
業務是指在科技名人檔案資源建設過程中開展的各項業務活動。業務性保障要求我們將項目思維貫穿在整個資源建設過程,并對各個業務環節進行全程管理。
(1)項目思維。科技名人檔案資源建設不僅僅是將各檔案館、科研機構或采集小組的數據存儲或轉移到統一的數據庫中,還要求相關工作人員始終將項目思維貫穿于整個工作環節,即科技名人檔案資源建設的實施方式是項目。一般來說,人類有組織的活動可以分為兩種:一種是不斷重復地、常規性日常工作;另一種是臨時性的、獨特的項目工作[19]。從科技名人檔案資源建設實踐工作來看,日常工作和項目工作都有所體現,例如,南京大學檔案館就設有名人全宗,用以整理、保管本校著名教授、院士等的名人檔案。但相比于整理名人全宗這種檔案日常工作,以項目的形式對科技名人檔案進行資源整理與整合無疑是最為高效率、高質量的方法,例如筆者依托的老科學家學術成長資料采集工程,就是以項目為形式進行的。這是因為科技名人檔案資源建設工作包括人力、財物的投入和軟硬件的集成,需要相關部門在人力、資金等各方面的支持,其實質是一項以人為主體,以實物采集、口述訪談、錄音錄像為手段支撐,以資源建設為指導思想的一項系統化工程項目。
(2)業務全過程管理。科技名人檔案資源建設主要包括以下業務流程:科技名人檔案采集整理、數據整合、知識整合、開發利用等。全過程管理就是要求做好科技名人檔案資源建設各個業務環節的工作,做到事前介入,事中控制,事后評價。科技名人檔案資源建設的第一步就是名人檔案的采集工作,事前介入就是要求在開展科技名人檔案采集工作前,要對參與項目的工作人員進行事前培訓,與相關機構進行事前溝通,明確項目推進的階段與時間。事中控制就是要求明確科技名人檔案資源整合各個環節、階段的職責安排,定期進行督查指導,發現質量問題及時進行整改。事后評價就是要求在資源整合項目結束后做好項目的評價、鑒定工作,復盤項目推進時存在的問題,為下一個項目的開展做好經驗積累。
科技名人檔案資源建設是一個集體性的行為,其過程中必涉及眾多的參與者,因此其組織保障機制的建設應當帶有一定的社會性,主要涉及項目組織管理部門、人力資源的配置、工作經費的支持等,它們共同形成科技名人檔案資源建設的組織性保障。
(1)組織建設與管理。科技名人檔案資源建設需要通過合適的單位組織項目實施,相關單位進行配合,同時也離不開上級行政領導的行政支持。以采集工程為例,它是由國務院責成中國科協牽頭,國務院科教辦協助,會商中組部、教育部、科技部、工業和信息化部、財政部、文化部、國資委、解放軍總政治部、中國科學院、中國工程院、國家自然科學基金委員會等11個部委組織實施的。具體實施過程中需要多個院校、科研單位的配合。
(2)人力資源的配置。人是所有管理活動的核心,形成一個穩定的工作團隊是資源建設項目有序開展的必要前提,特別是核心人員的穩定性將是科技名人檔案資源建設項目成功的關鍵。此外,除了要求團隊具備一名高學歷、高素質、經驗豐富的團隊負責人外,還應當具備合理的成員配比,這是保證項目穩定與全面開展的必要條件,要充分重視和尊重本單位現有的人才,積極尋求跨部門優秀人才的合作。檔案數字化、管理手段的現代化、信息傳播的網絡化等都需要各領域的高層次專業人才,具備相關領域的專業知識是各項工作有序開展的充分條件。這就要求我們要重視培養和造就一支知識結構合理、業務素質過硬的高素質檔案資源建設工作隊伍[14]。
(3)經費支持與管理。科技名人檔案資源建設的各個環節都需要大量資金的投入,足夠的資金投入是檔案資源建設與共享的物質條件。在資金使用方面,根據項目需要合理分配和使用有限的資金,使每一筆經費都花在刀刃上,規矩辦事、節儉辦事,使每一筆經費發揮最大效益。
(4)技術支撐與服務。由于科技名人檔案的分散性、異構性更強,其廣泛分布在各級各類檔案館或檔案室以及互聯網中,因此需要通過多種技術的組合,多層次實現對各類、各人檔案信息的有機轉換、鏈接與整合[20]。在資源建設的全程工作中,緊緊地以技術手段為依靠,建立數據共享中心,實現各單位、各部門、社會各界與數據中心的數據交換與共享服務。
無論是科技名人檔案資源建設的任何階段,制度體系的構建都應是非常重要的。本文認為保障制度應當是綜合性的,主要包括三方面內容,即內部制度、標準規范以及政策法規。
(1)內部制度。內部制度是規范人們辦事程序和行為方式的規則,是政策法規在執行層面上的細化和執行的重要保障條件。采集工程目前起草并投入使用了《領導小組工作規則》《領導小組辦公室工作規則》《項目管理辦法》8個基礎性文件,和《數據庫建設方案》《資料存儲方案》《資料展示方案》等9個技術性文件,構成一個完整的基礎規范文件體系[21]。
(2)標準規范。建立完善的標準與規范是科技名人檔案資源建設的首要問題與關鍵。科技名人檔案資源建設離不開標準化的工作,建立一套從技術到組織的資源建設標準及規范能夠保障工作順利開展和有序進行,在全過程中控制資源建設的質量與效率。從標準的適用范圍來講,相關標準體系包括:國家標準,如GB/T 26163.1-2010《信息與文獻——文件管理——文件元數據 第1部分:原則》;行業標準,如DA/T 57-2014《檔案關系型數據庫轉換為XML文件的技術規范》;地方標準和企業標準。從標準的內容層面來講,相關標準體系應包括:業務標準,如各種科技名人檔案收集標準、檔案著錄標準、保存標準、利用標準等;數據標準,如元數據標準。
(3)政策法規。科技名人檔案資源建設是檔案信息化建設的一個重要組成部分,檔案信息化相關的政策法規能夠反映出國家各級部門對檔案信息化的重視程度,也應該得到相關信息化政策法規的支撐。國家檔案事業“十四五規劃”提出要將檔案信息化建設進一步融入數字中國建設。此外,科技名人檔案資源建設涉及到的法規包括檔案法,還有版權、個人信息保護、數據安全法、信息產權法、信息保護法和信息管理法等。
科技名人檔案資源建設是檔案資源建設的重要內容,也是檔案信息化建設的重要組成部分。本文提出的科技名人檔案資源建設框架,為相關部門的實踐工作提供了具備可行性的指導方案。但資源建設是一項長期且具有很強實踐性的工作,這一理論框架仍需在實際的檔案館實踐工作中得到進一步的驗證與完善,進而推動我國科學家記憶工程和科技名人檔案資源建設的長久發展,并為進一步挖掘老科學家學術成長的規律,更好地發掘并弘揚老科學家精神,豐富社會主義精神譜系提供資源服務。