摘要:建設科技名人檔案專題庫,有助于保存科技歷史、傳承科學文化、弘揚科學家精神。論文遴選出五個國內外典型科技名人檔案專題庫,從資源維度(遴選原則、采集渠道、維護機制)和服務維度(檢索服務、交互服務)調查科技名人檔案專題庫現狀,并從收集、管理、開發、利用四個方面總結建設困境,提出創新資源建設機制、完善平臺功能建設、加強檔案數據組織和強化數據標準化建設與協作共享的突破路徑。
關鍵詞:科技名人 檔案專題庫 名人檔案
科技名人是在科學研究與工程技術領域取得創造性成就、作出杰出貢獻的人物。科技名人檔案是科技名人在科研、工作、生活中直接或間接形成的具有保存價值的文字、圖表、聲像等不同形式的歷史記錄。隨著全社會檔案意識的增強,檔案館、圖書館、博物館等各類機構開始注重科技名人檔案資源的收集,并開展了大量有益的實踐。諸多學者也圍繞科技名人檔案的概念內涵、建檔過程與方法、資源開發利用等展開研究。[1]
本文以科技名人檔案專題庫為研究對象,通過網絡調查法與案例分析法調研國內外五個典型科技名人檔案專題庫,分析專題庫建設與運行中面臨的困境,提出科技名人檔案專題庫建設的突破路徑。
本文遴選出五個具有代表性的國內外科技名人檔案專題庫作為典型代表,并將其分為以下四種類型:(1)以高校為代表的人文研究機構,如希伯來大學愛因斯坦網上檔案館[2]、哥倫比亞大學口述歷史研究中心[3];(2)以中國科學院、工程院為代表的院士富集機構,如中國工程院院士館;(3)以檔案館為代表的文化保藏機構,如中國科學院檔案館科學家知識圖譜平臺;(4)以科學家博物館為代表的專門機構,如中國科學家博物館。下面將從資源內容和服務功能兩個維度對科技名人檔案專題庫建設現狀展開分析。
(一)資源內容現狀
1.資源遴選原則,以建設單位需求為導向打造特色資源。科技名人檔案專題庫首要服務于其建設單位,其建設運營的需求直接決定著數據資源遴選要求。(1)以服務學術研究為目標,從檔案編研與利用角度開展科技名人研究,幫助歷史學家、學者和公眾更好地理解人物經歷與社會變遷,如哥倫比亞大學口述歷史研究中心重點加強口述歷史文字與音視頻檔案的建設。(2)以建設科技名人綜合信息平臺為目標,系統整合科技名人學術和非學術資源,多角度詮釋科技名人的人生經歷、學術精神與科研歷程,打造科技名人綜合信息資源專題庫,如中國工程院院士館除了包含院士基本信息、成就貢獻、人生歷程等信息外,還包含院士聲像資料、書畫詩詞作品、成果思想等內容。(3)以弘揚科學家精神為目標,圍繞本機構、本地區、本領域科技名人,廣泛搜集并集中展示,如中國科學院檔案館科學家知識圖譜平臺,通過數據化加工、知識化組織、可視化呈現多維度展示科學家精神。(4)多元綜合目標,如中國科學家博物館從2009年開始系統、廣泛地收集科技名人的學術成長資料,以科技人物為專題系統采集相關檔案資源并進行開發,已形成“采集、館藏、研究、展示、教育、宣傳”一體格局。不難發現,國內外專題庫在資源遴選思路上各有側重,國外聚焦于資源深度,而國內則更聚焦于資源廣度,凸顯各自的建設特色。
2.資源采集渠道,以本機構檔案為基礎實現來源多元化。國內外各專題庫大多是在本機構科技名人檔案資源的基礎上,結合外部合作或購置數據等渠道實現多元化集成。希伯來大學愛因斯坦網上檔案館的資源主要來自愛因斯坦捐贈給希伯來大學的檔案材料,還包括一些私人收藏和研究人員捐贈的材料。哥倫比亞大學口述歷史研究中心除了收錄自身主導開展的口述歷史項目檔案,還通過接受捐贈和合作項目等不斷擴大收集范圍。中國工程院院士館收錄的數據主要來自官方,也得到了各類出版機構、媒體的支持。中國科學院檔案館科學家知識圖譜平臺主要依托館藏相關檔案資源,并以外部權威渠道發布的科學家公開信息為補充。中國科學家博物館依托采集工程收集的手稿、口述文字、錄音、著作、書信、證書等幾乎覆蓋所有檔案載體與門類。除此之外,它還收藏科學家史料解讀、人物報道、論文目錄等。
3.資源維護機制,以項目支持為依托更新數據。科技名人檔案專題庫的建設與運行通常為公益類事業,需要穩定、持續的財政支持與投入,一般依托持續性項目或專門機構保障數據更新。希伯來大學愛因斯坦網上檔案館、哥倫比亞大學口述歷史研究中心擁有專業化檔案管理團隊,主要依賴持續的檔案征集、研究與合作項目確保資源更新。中國工程院院士館借助院士增選契機,實現院士名單與資源內容的年度更新。中國科學院檔案館科學家知識圖譜平臺以項目形式進行資源建設,綜合運用自然語言學習等技術以半自動化方式實現數據加工處理、關聯展示等。中國科學家博物館依托老科學家學術成長資料采集工程項目,按人、分批次實現內容數據的長期更新。
(二)服務功能現狀
1.依靠普通檢索功能提供檔案資源查詢服務。普通檢索通常基于檔案的整理分類方式,允許用戶通過輸入關鍵詞來查找所需的檔案信息,一般分為基本檢索和高級檢索。如希伯來大學愛因斯坦網上檔案館提供普通檢索、高級檢索和專家檢索。哥倫比亞大學口述歷史研究中心在高級檢索中限定檢索范圍、排序方式、頁面顯示結果的數量,優化檢索結果。中國工程院院士館擴大基礎檢索范圍,提供10個檢索字段。中國科學院檔案館科學家知識圖譜平臺允許用戶一框式檢索姓名和檔案資源題名。中國科學家博物館提供公眾版和學術版兩個門戶,均提供全文關鍵字檢索服務。總體來看,大多數專題庫仍通過傳統檢索功能服務用戶。
2.通過社交媒體分享等提供簡單交互服務。移動互聯技術和社交網絡的迅速發展,使得檔案專題庫與用戶之間、用戶與用戶之間的互動更為緊密和多樣化。社交媒體強大的互動性、即時性和廣泛性為檔案專題庫提供了與用戶直接交流的渠道,如希伯來大學愛因斯坦網上檔案館支持臉書、推特等社交媒體分享。哥倫比亞大學口述歷史研究中心將用戶細分為校友、教員、學生與訪客,支持用戶與館員在線問答。中國工程院院士館提供留言、評論、基本信息下載、社交媒體分享等。然而社交媒體上的交流與互動往往呈現碎片化、表面化的特點,科技名人檔案的內容常涉及科技、歷史、文化等領域,具有一定的深度和廣度,需要用戶投入更多的時間和精力去理解與消化。[4]
基于上述現狀分析,本文總結出目前科技名人檔案專題庫建設面臨資源、平臺、知識挖掘與開放四個方面的困境。
(一)資源建設缺乏保障機制
在資源采集方面,目前科技名人檔案專題庫資源建設仍然主要依賴特定項目的形式開展,資源采集工作大多通過人工定向的方式進行,雖然確保了資源的質量相對可靠,但整體效率較為低下,而且難以形成持續性的資源增長機制。在資源整合方面,科技名人活動地域廣、時間跨度長,其在科研、教學、交流等活動中直接或間接產生的檔案材料數量龐大,且分散在許多機構和個人手中,形成了多源異構的檔案資源體系,因此需要視資源實際情況開展大量非標準化處理操作,才能將其有效整合到專題庫中。在數據維護方面,受限于項目形式,專題庫的資源難以保證長期更新維護。我們在實際調研中也發現有數據滯后、錯漏等問題,無法真實、準確地反映科技名人的最新動態和研究成果。
(二)平臺功能和受眾單一
較為單一的平臺功能和受眾,限制了檔案資源的傳播。在功能方面,大多數科技名人檔案專題庫首先被定位為存儲庫,其功能設計相對基礎且單一,通常僅提供傳統的檢索功能,允許用戶通過關鍵詞、作者或日期等查找信息;支持簡單的瀏覽功能,用戶能夠按照分類查看檔案內容;融入現代社交媒體元素,提供有限的分享、留言等功能,但缺乏深度互動和多樣化的傳播方式,限制了用戶對檔案資源的充分利用。在受眾方面,大多數科技名人檔案專題庫主要面向學者、研究人員等特定群體,在提供服務的內容和形式上缺乏多元化,無法滿足不同用戶的個性化需求。例如,對于普通公眾而言,他們可能并不關心專業的資源內容本身或數據分析,而是更加關注檔案背后的人物故事、精神內涵及與之相關的歷史文化背景。
(三)知識挖掘和組織有待提升
雖然部分科技名人檔案專題庫嘗試運用知識圖譜、數據挖掘等前沿技術對科技名人檔案資源進行挖掘,呈現科技名人學術畫像、科研關系網等重要信息,但整體表現上仍顯不足,資源的可解讀、可關聯、可再組與可共享性有待提高。首先,可視化呈現往往以表層化、碎片化、孤立化形式存在,缺乏系統性和連貫性,用戶難以全面、深入理解科技名人的學術貢獻、科研歷程及其背后的社會文化背景。其次,專題庫之間的數據壁壘尚未完全打破,導致資源的共享性和互操作性受限,進一步影響了知識挖掘的深度和廣度。最后,新一代信息技術在檔案資源開發中的潛力有待挖掘,尤其是在科學家群體特征、科學家成長規律和科學家精神的深度挖掘與知識服務上有較大的提升空間,以進一步支撐數字時代科技記憶的保存與建構。
(四)檔案資源開放關聯受限
部分科技名人檔案專題庫因版權限制、個人隱私保護要求或機構內部政策,無法完全面向公眾開放,一定程度上限制了公眾對檔案資源的獲取和利用。大多數科技名人檔案專題庫也未能提供開放的接口或通用的元數據導出功能。這意味著用戶在使用這些資源時往往受限于專題庫自身的界面和功能,難以進行深度的數據分析和個性化的應用。這種封閉性不僅限制了用戶的創造力,也阻礙了檔案資源的進一步開發和利用。此外,目前科技名人檔案專題庫建設主體呈現多元化趨勢,涉及高校、科研院所、檔案館、圖書館等多個機構,由此帶來的管理分散、重復建設、合作度低、數據標準格式不統一等問題,也進一步限制了科技名人檔案專題庫橫向關聯拓展,影響了檔案資源的共享效率與范圍。
2011年,中國科學院學部啟動“中國科學院院士文庫”項目,系統采集、整理中國科學院院士科研生涯中積累的豐富檔案資料,經過10余年建設,初步建成中國科學院院士群體的檔案專題庫。基于上述問題分析,下面將結合中國科學院院士文庫建設實踐,提煉科技名人檔案專題庫在資源建設機制、功能建設、數據組織、協作共享等方面的突破路徑,為科技名人檔案專題庫建設與發展提供參考。
(一)創新資源建設機制,從人工采集到人機協同
科技名人檔案專題庫的核心是資源建設,所以尤其要注重如何高效且全面地匯集高質量的信息資源。首先,應基于專題庫已有資源,持續開展多渠道人工采集,努力獲取或交換更多資源,不斷豐富和擴充專題庫的內容,打牢資源基礎。其次,應為科技名人團隊提供自主上傳檔案資料的渠道,鼓勵科技名人及其團隊直接參與到專題庫的建設中來,確保檔案資料的真實性和權威性,形成良性循環。最后,應充分利用人工智能和大數據技術,對互聯網上科技名人的學術成果、新聞資訊動態進行動態監測、自動抓取和智能分析,保障檔案資源內容的時效性和全面性。中國科學院院士文庫面向院士群體建設交互服務專題庫,通過網絡端、手機端給院士個人及其認證的特定人員開放端口,供他們自主上傳圖片、語音、視頻等資源,并可對庫存檔案數據進行編輯,項目組對編輯內容進行審查后可用于展示。
(二)完善平臺功能建設,從資源匯集到分眾服務
大數據時代科技名人檔案專題庫作為連接科技名人和公眾的橋梁,既要注重資源的匯集與存儲、體現專題庫記憶庫的功能,[5]又要在數字賦能的加持下深度分析不同目標人群的需求與習慣,從原來單純的檔案資源匯聚定位轉向利用檔案組織分眾服務定位,即根據受眾需求的差異性,面向特定群體提供特定檔案信息與服務。這一過程強調個性化和定制化,以滿足不同個體的需求。中國科學院院士文庫針對學術型用戶,重視學術類檔案資源的采集與組織,借鑒前端控制理念,[6]追蹤院士科研工作進展,及時增補學術成果檔案,檢索功能上加強智能化、個性化服務;細化描述粒度,增強內容的真實性和完整性,提高院士使用黏性;針對普通公眾,利用數據可視化技術展示檔案資源的規模和多樣性,多模態構建院士鮮活生動的形象,同時提供圖文、音視頻結合的專題頁面,弘揚科學家精神。
(三)加強檔案數據組織,從數據管理到知識發現
充分運用新一代信息技術提升數據組織與知識挖掘能力,是科技名人檔案專題庫建設未來的發展方向。建設科技名人檔案專題庫,一要構建動態數據更新機制,即當科技名人有新的學術成果、榮譽獎項或其他動態信息時,利用爬蟲或API接口等大數據技術實現數據的自動更新,并對采集數據進行智能分類標注,獲取高頻次、全覆蓋的科技名人新聞輿情監測數據。二要加強對科技名人檔案的深度挖掘,實現從檔案數據的管理到檔案知識的發現,可以借助大數據挖掘技術,研究科技名人科學觀念或思維模式的形成機理,[7]利用可視化工具構建學術譜系圖,挖掘科技名人及其學術共同體的學術譜系,揭示科技名人的知識傳承與發展脈絡,[8]完善國家科技記憶。中國科學院院士文庫加強對院士基本信息、教育經歷、工作經歷、建言獻策等數據的標注加工,在此基礎上深入挖掘院士的地域分布、行業分布、參政議政等多維度的信息;基于科技情報大數據技術,從院士科研成果方面分析院士研究方向變遷路線、學術關系網絡等,展示院士個人科研畫像和學科發展軌跡。
(四)強化數據標準化建設與協作共享,從各自為政到開放共享
科技名人檔案專題庫應加強檔案元數據標準化體系建設,規范元數據格式和結構,構建有效的元數據收集和更新機制,促進不同建設機構與不同專題庫之間的元數據共享互通;[9]積極探索科技名人檔案數據開放模式,采取“分對象、分領域、分階段”的開放原則,逐步推動科技名人數據資源開放標準的建立,為實現數據可復用性提供國家層面的準則支撐;借鑒國外LAM合作實踐,加強檔案館、圖書館、博物館、科技館的橫向聯動,建立數據協同、管理協同、服務協同等機制,鼓勵科研機構、高校等主體間檔案數據的開放共享。例如,可以整合中國科學院院士文庫、中國工程院院士館等現存院士檔案資源,構建中國院士數據的權威發布渠道和協作網絡,打造“中國院士”管理協作網絡,實現“中國院士”網絡的持續性、權威性、互助性建設,[10]建立資源高度匯集的國家級科技名人檔案專題庫。
本文在充分調研國內外科技名人檔案專題庫的基礎上,選取了五個國內外具有代表性的科技名人檔案專題庫,深入調研分析現狀、梳理總結建設困境,并結合中國科學院院士文庫建設實踐提出突破路徑。但囿于目前實踐案例樣本較少,未來有待于持續追蹤國內外相關情況以獲取更多樣本,對比國內外之間的共性和差異,為我國科技名人檔案專題庫建設的進一步發展探明實踐路徑。
*本文系2024年中國科學院學部項目“中國科學院院士文庫”(項目編號:E429170301)研究成果。
注釋及參考文獻:
[1]高勝楠.我國科技名人建檔研究的現狀與問題[J].北京檔案,2020(1):29-32.
[2]The Hebrew University of Jerusalem. About AlbertEinsteinArchives[EB/OL].(2019- 04- 01)[2024-09-10].https://albert-einstein.huji.ac.il/aboutus.
[3]ColumbiaUniversityLibraries.OralHistoryPortal[EB/OL].(2022-01-01)[2024-09-10].https://library. columbia.edu/collections/oral-history-portal.html.
[4]任德昕,孟超.社交媒體環境下檔案文化傳播:挑戰與路徑[J].山西檔案,2024(1):92-94.
[5]馬繼萍.論科技名人檔案庫的功能定位與實現[D].武漢:湖北大學,2017:23.
[6]陳建,章偉婷.科技名人檔案收集與利用的難點與路徑創新——以老科學家學術成長資料采集工程為例[J].檔案學刊,2022(4):70-78;98.
[7]覃兆劌,馬繼萍.論科技名人檔案與科技發展的互構——以我國“老科學家學術成長資料檔案庫”建設為例[J].檔案學研究,2016(4):52-56.
[8]陳雨.數字人文視域下科技名人檔案知識化開發探析[J].檔案學研究,2023(4):99-107.
[9]王靜.科技名人檔案資源建設理論框架及保障體系[J].山西檔案,2023(2):150-157.
[10]武虹,高潔,李硯章,等.國內外院士信息綜合集成與展示平臺的對比[J].科技導報,2020,38(17):92-99.
作者單位:1.中國科學院文獻情報中心2.中國科學院檔案館3.青島農業大學檔案館