吳予晨 許春漫
(福建師范大學社會歷史學院,福州 350117)
開放數據是所有人都可以免費訪問、使用和共享的數據[1]。這一概念自2007年在國際語義網會議上提出后,便得到了各界的廣泛關注。圖書館擁有海量的數據資源,具備數據收集整理的專業知識,是開放數據服務的重要提供者之一。國際圖聯指出,圖書館是開放數據計劃天然的合作伙伴[2]。圖書館開放數據服務是圖書館以開放數據為核心要素所開展的一系列服務的總稱,包括將館內已有的數據資源開放、對館外開放數據的研究與開發利用以及指導用戶合理使用開放數據等,其宗旨是發揮開放數據的最大價值,造福社會。對于圖書館而言,開展開放數據服務不僅能夠提高數據資源的利用率,提升圖書館信息技術的應用能力,而且可以優化圖書館的內部管理,拓展服務的廣度和深度;對于全社會而言,圖書館開展開放數據服務意味著可訪問數據量的增加,也意味著更加公平的數據獲取[3],圖書館在服務過程中深化了與社會各類機構之間的伙伴關系,有助于增進多方合作,共同利用開放數據激活城市潛能,構筑智慧城市。
美國是世界上較早將數據進行開放的國家,前總統奧巴馬于2013年開始陸續簽署了一系列開放數據法案,此舉掀起了美國國內開放數據運動的熱潮,許多機構紛紛圍繞開放數據的現實需求開展服務。眾多美國圖書館也積極參與其中,2019—2020年,旨在促進圖書館開放數據服務發展的Civic Switchboard項目授予15家在開放數據服務方面表現出色的圖書館“實地項目獎”(Field Project Awards),這些獲獎圖書館所開展的開放數據服務針對性強、重點突出,具有代表性,較為全面地展現了美國圖書館開放數據服務的多樣化,對我國圖書館有良好的參考價值。因此,本文以Civic Switchboard項目獲獎圖書館為研究對象,采用網絡調查法對這些圖書館開展的開放數據服務進行全面調研,具體了解其開放數據服務的內容,分析特點,以期為我國圖書館開展開放數據服務提出建議。
Civic Switchboard項目的全稱為“城市的轉換機:連接圖書館和社區信息網絡”(Civic Switchboard:Connecting Libraries and Community Information Networks),其目標是鼓勵和推進圖書館開展多樣化的開放數據服務。項目秉持合作共贏的理念,幫助公共圖書館和學術圖書館確定當地開放數據的需求和環境,探索圖書館在開放數據服務中的角色、機會與實踐方式,預測并應對圖書館開放數據服務中面臨的問題與挑戰,從而提高圖書館的組織能力和應變能力,最后根據圖書館成功的實踐案例編制指南、開發工具包,為全國性開放數據共享網絡提供參考,完善城市開放數據建設體系[4]。項目始于2017年,由美國匹茲堡大學圖書館系統(the University Library System at the University of Pittsburgh)、匹茲堡卡內基圖書館(Carnegie Library of Pittsburgh)、西賓夕法尼亞州區域數據中心(Western Pennsylvania Regional Data Center)和國家鄰里指標合作伙伴(National Neighborhood Indicators Partnership)四方合作共建,同時,項目也得到了美國博物館和圖書館服務研究所(Institute of Museum and Library Services)的認可與支持[5]。
Civic Switchboard項目啟動后,于2018年和2019年分別面向全美廣泛征集圖書館開放數據服務的實例,并從中評選出表現優秀的圖書館,評選的依據是:圖書館開放數據服務計劃、時間、預算的可行性;圖書館開放數據服務主題與項目主旨的契合程度;圖書館開放數據服務所體現的多樣性、公平性和包容性;圖書館開放數據服務對當地經濟社會建設的貢獻度。該項目于2019—2020年共評選出15家優秀的圖書館,并授予“實地項目獎”[6-7]。
2021年4月,Civic Switchboard項目舉辦公開討論會,對后續發展進行商議,項目經理、獲獎圖書館館員、圖書情報教育者及地方政府工作人員等25人參會,會議明確了未來圖書館的開放數據服務將在以下三方面做出努力:第一,在數據的開放收集方面,進一步開放數據,加強不同圖書館之間數據的交換共享,培養圖書館與社區之間的合作伙伴關系;第二,在開放數據的保存方面,明確數據資料的版權歸屬,做好開放數據歸檔整理工作;第三,在數據素養教育方面,倡導數字公平,加強對館員的培訓教育,使其具備數據素養,為圖書館開放數據服務提供決策支持[8]。
本文以獲得Civic Switchboard項目“實地項目獎”的15家圖書館為調查對象,筆者從Civic Switchboard項目的官網和博客、各獲獎圖書館網站以及相關新聞報道等渠道收集這些獲獎圖書館開放數據服務的相關信息,分析其實踐內容。
開放數據生態系統是以開放數據為核心,由數據提供者、數據賦能者、數據中介等組成的動態有機體系[9]。Civic Switchboard項目從開放數據生態系統構成主體的角度思考圖書館進行開放數據服務的方式,鼓勵圖書館在生態系統中扮演不同角色,提供重點性服務,促進數據的交互,增強數據的流動性,從而發揮數據的作用,展現圖書館的優勢。總體而言,獲獎圖書館的開放數據服務實踐展現了其在開放數據生態系統中扮演的3種角色。
2.1.1 開放數據資源的提供者
圖書館是知識的中心、數據的寶庫,有學者指出,數據將成為未來圖書館綜合資源體系中一大重要的組成部分。而其擁有的用戶數據、館藏數據就是潛在的開放數據,獲獎圖書館的開放數據服務首先將目光著眼于自身,挖掘已有資源,在開放數據生態系統的供給端發揮力量。例如,全美訪問人數排名前三的皇后區公共圖書館(Queens Public Library)在“數據統計”(Data Counts)社區項目中利用Excel等可視化工具將館內用戶數據進行開放共享,重點補充當地人口普查中缺失的部分統計數據(如0~5歲兒童、低收入群體、少數種族群體、無證移民等),協助紐約市長數據分析辦公室全面了解居民信息,與政府部門共同完成人口統計工作,圖書館此舉有利于日后惠民政策的制定[10]。
高校圖書館則對本館特藏資源進行創造性轉換后開放共享,北卡羅來納州中央大學信息科學學院圖書館(the School of Library at North Carolina Central University)對館內珍藏的北卡羅來納州房產契據進行數字化轉換,建立開放獲取的房產契據數據轉錄集,并以物理和數字形式共享。該項目將手寫文件轉化為機讀數據,為專家、學者和民眾了解當地種族問題的歷史提供了重要資料[11],同時,這些公開的史料數據資源也為當地經濟適用房問題提供了背景信息[12]。芝加哥大學圖書館數字獎學金中心(the University of Chicago Library’s Center for Digital Scholarship)利用館藏中與當地治安相關的犯罪數據、庭審數據建立庫克縣刑事司法系統的開放數據記錄集,為庫克縣治安管理和司法干預的調整提供了必要的數據參考,有助于城市刑事司法系統的優化完善[7]。
2.1.2 開放數據利用的指導者
數據只有付諸應用才能真正發揮價值,獲獎圖書館在提供數據的基礎上也積極引導各方利用開放數據,讓數據“活”起來,提高開放數據的利用率,釋放數據的能量,為社會帶來福祉。例如,印第安納州南本德市的圣約瑟夫縣公共圖書館(St.Joseph County Public Library)利用南本德市數據中心提供的先進設備、各種處理軟件對城市開放數據的現狀進行分析,構建“圖書館—城市”合作方案模型(Library-City Partnered Programming),闡明圖書館在城市數據生態系統中的作用,并針對存在的不足探討改進方法[13],此舉不僅能明確圖書館的主體責任,而且有助于城市其他機構主體了解開放數據,提供恰當的服務。
紐約西部圖書館資源委員會(Western New York Library Resources Council)同樣也開展了區域數據生態掃描工作,隨后編制白皮書報告,將其對當地開放數據環境的調查、對開放數據來源、類型、范圍和差異的分析以書面文本的形式向全社會公開,供決策者、教育者、社區組織者使用[14]。該調查得到了布法羅州立大學巴特勒圖書館(Butler Library at SUNY Buffalo State)、分析公司rprt和LLC以及專門參與開放數據計劃的組織Open Buffalo和InfoTech的大力支持。
在數據保存方面,匹茲堡大學圖書館系統為西賓夕法尼亞州區域數據中心的開放數據管理提供指導,圖書館重點關注存儲庫平臺中元數據的安全等問題,并為西賓夕法尼亞州區域數據中心的開放數據管理保存計劃提供若干建議,有助于片區內數據的合理存儲[15]。
2.1.3 開放數據交流的中介
圖書館因公益性和大眾性得到社會各界的信賴,是不同主體之間溝通交流的橋梁。部分圖書館通過舉辦數據交流活動,承擔數據中介的身份,將社會民眾、政府官員、企業領袖、非營利性機構代表聚集在一起,讓他們通過面對面交談消除誤解、構建信任,共同為本地數據應用出謀劃策。阿拉斯加州圖書館(Alaska State Library)利用其與民眾間緊密聯系的優勢,舉辦阿拉斯加社區創新峰會(Alaska Community Innovation Summit),邀請社區民眾和企業代表參會,共同確定開放數據的來源、數據的訪問渠道和數據的使用方式。阿拉斯加州圖書館的舉措吸引了民眾對開放數據的關注,增強了民眾的社會參與,也增進了政府、企業及其他社區組織之間的關系,作為聯系不同開放數據機構的紐帶,圖書館促進了利益相關者之間的信任[16]。
紐約州安大略縣的先鋒圖書館系統(Pioneer Library System)為應對當地藥物濫用問題,專門舉辦大型數據生態系統制圖活動,圖書館作為安大略縣預防藥物濫用聯盟的有機組成部分,發揮橋梁作用,引導心理健康、教育和災害預防等領域的參與者同全體民眾和機構部門分享相關數據,構建本地藥物數據生態圖,參會者在了解影響社區民眾健康問題的重要數據(如警方和市長公布的煙草數據)基礎上,進行數據分類和優先級確定。這一活動使當地藥物數據更加直觀,增強了數據的公開與雙向互動,有利于深化各方的理解,促進社會問題的深入研究,凈化社會用藥環境[17]。
為應對開放數據的孤島問題,提高數據傳輸效率,獲獎圖書館吸納政府、企業、高校、民眾的力量,通過跨界合作的方式組建數據管理機構,暢通開放數據的共建共享。
阿拉斯加州圖書館在舉辦創新峰會的基礎上又開展數據和數字資產管理計劃(Data and Digital Asset Management Program),與阿拉斯加管理和預算辦公室、信息技術辦公室共建全州范圍內的數據中心,整合數據目錄服務和工具,使數據用戶、生產者和中介能夠共享、使用和轉換阿拉斯加州的數據,以便能對其下屬各級地方政府產生的數據進行集中訪問和管理[16]。
與阿拉斯加州圖書館做法相同的還有夏洛特梅克倫堡公共圖書館(Charlotte Mecklenburg Public Library),該館與北卡羅來納大學夏洛特城市學院(UNC Charlotte Urban Institute)合作建立數據委員會(Data Council),召集政府議員、企業管理者、社會組織領導者、民眾代表等成員定期就數據報告機制混亂的問題進行磋商,最終在開放數據的調查審核、元數據標準的集中建立、開放數據的合作利用等議題上達成一致。圖書館的舉措有效協調了當地復雜的開放數據環境,成功解決了因數據報告機制不同而困擾當地多年的數據孤島問題[18]。
數據素養是一種閱讀、理解、創造、交流數據信息的能力[19],擁有良好的數據素養是正確合理使用開放數據的前提和基礎,許多獲獎圖書館自覺承擔社會文化教育的責任,設計多樣的數據課程,向用戶提供數據素養教學,提高用戶的數據意識,拓展用戶的數據思維,有助于數據更好地被利用。
獲獎圖書館對開放數據教育課程的設計非常用心,根據服務對象的特點制定專門的教學目標和教學計劃,并根據實際培訓情況進行適當調整,確保民眾能夠真正學有所獲、學有所成。例如,萊斯大學方德倫圖書館(Fondren Library,Rice University)在對民眾進行數據素養教育前,向參與者發放調查問卷,了解他們的文化程度和感興趣方向,評估他們對數據的認知水平,根據調查問卷分析的結果補充NBA球星數據和Fortnite、Apex Legends兩種電子游戲中的球員數量數據,正是由于增加了參與者感興趣的數據元素,首次培訓后參與者的數據素養評估分比原先高出34.5個百分點。為了進一步提高參與者的數據應用能力,該圖書館在第二次培訓中增加了社區街道安全數據,鼓勵參與者運用已有數據處理技能為社區發展進言獻策[20]。又如普羅維登斯公共圖書館(Providence Public Library)在對青少年進行數據素養教育前,全方位了解服務人群的學習需求,開設的課程內容涉及編程、營銷、健康等多方面,每門課程有特定的受眾類型和專門的使用工具,便于學生根據自身興趣選擇課程。在數據素養教育期間,先后有600余名青少年完成學習,獲得了學校官方課程認可的數字證書或行業認證,說明普羅維登斯公共圖書館取得了可喜的實踐成果[21]。
明尼蘇達州的圣保羅公共圖書館(Saint Paul Public Library)和佛蒙特州的弗萊徹免費圖書館(Fletcher Free Library)分別通過制作《開放圣保羅》手冊(Open Saint Paul Brochure)、舉辦共享數據項目(BTV Share Data Project)的方式為圖書館和社區非營利性組織的工作人員進行數據素養培訓[22-23],以提高工作人員的數據安全意識以及對當地開放數據門戶的認識,培養良好的數據處理能力。
數據是推動數字經濟發展的核心要素,而現階段我國數據開放和共享的程度仍不夠,需要加快政府和公共部門的數據開放進程,促進數據無償共享[24]。圖書館作為公共文化機構,應積極開展開放數據服務,助力我國數字經濟快速發展。目前,我國已有圖書館開展開放數據服務實踐,例如:國家圖書館將館藏古籍、民國藏書的全文影像數據作為公共數據對外開放;上海圖書館對外開放家譜、手稿檔案等數據。但整體而言,我國圖書館囿于資金、技術、安全等問題,尚未大規模開展開放數據服務,且已有服務的影響力還可繼續提升。對比而言,美國圖書館開放數據服務得到了多方支持,取得良好成效,值得我國圖書館學習。因此,筆者根據我國具體國情,綜合Civic Switchboard項目獲獎圖書館開放數據服務的實踐與特點,為我國圖書館提出如下建議。
開放數據生態系統由政府、社會組織和公民共同構成,通過各要素之間的相互配合,運用數據和信息技術解決城市問題[25]。我國圖書館可參考Civic Switchboard項目獲獎圖書館的做法,著眼于城市開放數據生態系統,找準圖書館在生態系統具體領域的定位,深化服務內容。
(1)在政治領域,充當政府數據開放平臺的建設助手。當前,我國部分省市已建立了政府開放數據資源網、政府開放數據平臺等專門網站,向社會公開各領域的數據集,便于社會公眾查閱、利用與監管數據,落實透明政府的建設要求。筆者通過對這些平臺調研后發現,與圖書館相關的數據集內容以地理位置、開放時間等基本要素為主[26-27],而將館藏文獻數據、用戶借閱數據等圖書館重要數據公開的平臺較少[28];同時,政府開放數據平臺中,數據的關聯與可視化分析較為缺失。對此,圖書館一方面需要密切與政府部門的合作,擴充政府數據開放平臺中圖書館的資源,利用平臺優勢提高圖書館數據的利用率;另一方面,圖書館可以運用各種技術,參與政府數據開放平臺的建設,協助數據整理,增強數據集之間的關聯,提高數據的可視化程度,為居民查找和利用各類數據提供便利,推進我國數字政府的建設進程。
(2)在經濟領域,成為企業提升競爭力的助推器。對于企業而言,善于洞悉開放數據中的經濟價值,可以在激烈的市場競爭中搶占先機。如今,眾多社會機構都將自身數據公之于眾,越來越透明的開放數據成為企業提升競爭力的有力武器。我國圖書館可以先從國務院、網信辦或當地政府網站、各類銀行官網、各大開放專利數據庫等渠道采集有利于企業經營的政策、金融、科研等方面的開放數據,結合企業自身目標和競爭對手背景,為企業制定有針對性的戰略規劃,如根據不同銀行或融資公司所公開的歷年信貸數據選擇性價比較高的貸款方式,利用有限的資金提高產品質量,贏得市場。
(3)在文化領域,扮演文化遺產開發利用的孵化機。現代信息技術的發展為圖書館文化遺產的數字化保護、開發、利用提供了契機,目前國家圖書館、上海圖書館都已對館藏珍貴的史料數據進行開放共享,用戶可以獲取和重用RDF、XML、JSON等格式數據。筆者認為,我國圖書館在已有實踐基礎上還可以和博物館、美術館、檔案館、出版社等機構合作,利用開放關聯數據將各單位珍貴藏品的一系列數據關聯,使文化遺產的歷史脈絡更加清晰、完整,實現我國優秀歷史文化的創新利用。
美國圖書館積極開展開放數據服務,并取得良好的成效,這與Civic Switchboard項目對內的支持和獲獎圖書館對外的跨界合作密不可分。當前,我國圖書館有限的開放數據服務以“各自為政”居多,大部分圖書館不了解開展什么服務、怎樣開展服務、為誰開展服務,這對我國圖書館而言是不利的,若能像美國圖書館一樣有專門的項目組織對內提供指導,評選優秀的服務案例進行物質層面和精神層面的鼓勵,則有益于促進越來越多的圖書館加入服務的行列之中,加快我國圖書館開放數據服務的進程。筆者認為,此類組織可以以開放數據服務聯盟的形式開展,由中國圖書館學會、中國高等教育文獻保障系統等機構統一領導,國家圖書館、上海圖書館、北京大學圖書館等在開放數據服務方面有成功實踐的先行者作為聯盟中的指導者,號召各類圖書館參與其中,加強聯盟內部的對標學習、臨近學習、跨地區學習,圖書館之間互幫互助,共享經驗,相互促進。聯盟可以定期表彰具有先進性、典型性的實踐項目,出臺指導文件,使我國圖書館的開放數據服務有方向、有目標、有計劃、有安排,切實提高服務的效果。同時,聯盟中的圖書館也需要積極走出去,結合當地實情,與政府、企業、高校等機構密切合作,使服務內容和形式更具多元化和針對性。
縱觀Civic Switchboard項目獲獎圖書館的實踐不難發現,其對民眾的數據知識培育極為重視,通過多種形式對不同群體提供針對性教育,力圖全面提升民眾對開放數據的認識與應用能力。我國圖書館也應該大力發揮在數據素養教育方面的作用,提升民眾的“數商”。
(1)作為未成年人的“數據引路人”。對于未成年人群體,由于其仍處在大腦發育階段,對開放數據的概念比較模糊,圖書館應重點培養其對開放數據的整體認識,如學習普羅維登斯公共圖書館的做法,通過益智游戲和嵌入教學等方式帶領未成年人踏入開放數據的大門,領略其中的奧妙。
(2)作為中青年人的“生活錦囊”。對于中青年人,由于其已具備一定的數據思維和數據意識,對于學習有更強的自主選擇性,圖書館應關注中青年人的現實需求,將數據素養教育與其生活緊密聯系,可以教授上班族如何自主獲取、分析居住片區的開放道路交通數據,選擇合適的出行工具和路線,縮短通勤時間。
(3)作為老年人的“智慧數據助手”。對于老年人,他們是數智時代的弱勢群體,圖書館對老年人開展數據素養教育首先應努力改變其對信息技術抗拒和排斥的態度,從退休金補助、醫療保障等方面入手,引入政府數據開放平臺、醫療數據開放平臺,在得到老年人認可后,以手把手教學的方式,循序漸進,幫助其逐步掌握智能設備的使用方法,進而學會從正規渠道獲取開放數據,最后能在開放數據平臺上得到疾病科普、用藥指南等服務,從中受益。
知識元是知識控制與處理的基本單位,呈現了文獻作者對特定學科問題的最新發現,是知識結構的基元[29]。對知識元模型的建設與應用能更加直觀地展現圖書館文獻知識的價值和知識之間的關系,將其以開放數據的方式呈現給用戶,可以縮短其科研創新的時間,提高研究效率。圖書館應利用自身在信息資源建設與組織方面的優勢,成為知識元的創建者,對文獻所包含的知識元進行描述、組織、形式化表述和共享。首先,圖書館界應對知識元描述的詞表進行統一,確定共用的詞匯體系;其次,抽取館藏文獻中的創新知識元內容、支持信息與來源信息,補充自身的創建者信息,并采用RDF/XML格式對知識元進行形式化表示,使之成為機器可讀、可交互處理的數據;再次,利用本體對知識元進行語義組織,形成知識圖譜,呈現知識元間的聯系,并存儲為知識元庫[30];最后,將數據進行開放,成為任何人都可以無條件使用、重用的開放數據。國家圖書館還可以在此基礎上整合各館知識元庫,為用戶查找知識元提供一站式檢索平臺,提升知識元開放與共享水平。
在開放數據環境中,作為海量數據存儲庫的圖書館應承擔隱私數據捍衛者的職責,切實保護個人數據,與全社會一道維護數據安全的良好環境。首先,我國圖書館界在處理個人信息的過程中要貫徹落實我國《個人信息保護法》和《數據安全法》,履行數據安全保護的義務,避免因操作不當導致用戶數據的泄露、篡改、丟失,損害圖書館信譽和社會形象。其次,中國圖書館學會與國家圖書館可以牽頭制定適用于本行業的行為規范和標準,與信息保護、監督管理部門通力合作,為館員正確處理開放數據提供參考依據。再次,圖書館在利用用戶個人信息進行自動化決策的過程中,應該根據《個人信息保護法》第二十四條的規定,提供不針對其個人特征的選項,或者向個人提供便捷的拒絕方式。最后,我國圖書館還可以在做好本館數據安全規范的同時,效仿Civic Switchboard項目中獲獎圖書館的做法,為社會其他數據存儲機構提供隱私保護建議,確保個人數據未經允許不得公開。
開放數據為智慧城市建設提供了有力的資源支撐,也為圖書館改善、創新服務提供了豐富的燃料,以Civic Switchboard項目獲獎圖書館為代表的美國圖書館發揮在開放數據收集、整理、利用方面的長處,將圖書館的發展與社會緊密聯系在一起,實現了圖書館與社會的共同進步。我國圖書館應認真分析當前國內環境,明確圖書館在開放數據服務中的定位,抓住機遇,承擔服務社會的責任與使命,推動圖書館的發展,彰顯圖書館的價值,實現圖書館的轉型升級。