
摘? ?要:面對新文科建設需求,高校圖書館需要主動進行服務創新來回應數智時代新文科建設的呼喚,承擔起新時期高校圖書館的新使命。文章梳理了學科服務到學科數據服務的發展演進過程,并依據數據生命周期理論構建了“大數據+小數據”的學科數據服務模式,進而提出相應的實施策略。文章認為,數智時代的高校圖書館要樹立大數據思維理念,根據新文科建設需求重塑圖書館學科服務模式,提供高效、精準、專業的學科數據服務,全面提高學科數據服務的服務層次和質量。
關鍵詞:數智時代;高校圖書館;新文科建設;數據服務
中圖分類號:G258.6? ?文獻標識碼:A? ?DOI:10.11968/tsyqb.1003-6938.2021063
Research on Subject Data Service of University Library Facing the Construction of New Liberal Arts in the Era of Digital Wisdom
Abstract Facing the needs of new liberal arts construction, university libraries need to actively carry out service innovations to respond to the call for new liberal arts construction, and undertake the new mission of university libraries in the era of digital intelligence. The article sorts out the development and evolution process from subject services to subject data services, and constructs a "big data + small data" subject data service model based on the data life cycle theory, and then proposes corresponding implementation strategies. The article believes that university libraries in the era of digital intelligence should establish the concept of big data thinking, reshape the library subject service model according to the needs of new liberal arts construction, provide efficient, accurate, and professional subject data services, and comprehensively improve the service level and quality of subject data services.
Key words era of digital wisdom; university library; construction of new liberal arts; data service
云計算、大數據、人工智能等新一代信息技術的飛速發展,在全面推進科技創新和產業革命的同時,對人們生活、生產與學習產生了巨大影響,世界已進入“數智”時代。數智時代就是以大數據和人工智能為代表的數據思維和技術應用的深度融合,這些思維與技術深刻地影響著人類的思維習慣、工作方式和生活狀態。大數據作為人工智能的基礎,又推動著人工智能的應用,帶動其他相關新技術不斷發展,形成新的“數智”技術體系與應用。這種“數”的規模擴張和“智”的深度升級,“數”和“智”全方位結合形成“數智”時代的典型特征。“數智”理念與技術的發展為高校“雙一流”與新文科建設提供了重要支撐。尤其是新文科建設亟需突破傳統文科思維模式,利用新一代信息技術賦能、數據賦能,從而實現跨學科的深度融合,進而推動文科建設的轉型升級。新時代催生新文科建設,新文科建設呼喚高校圖書館必須以新姿態新方法創新新服務。高校圖書館也要主動回應新文科建設的呼喚,轉變傳統的資源觀、服務觀,以技術和數據賦能新文科建設,構建數智時代的新型學科服務模式,以現代信息新技術賦能文科教育,為實現新文科建設目標發揮應有責任和擔當。本文依據數據生命周期理論,嘗試構建了“大數據+小數據”、“技術”+“數據”+“資源”融合賦能的新文科建設學科數據服務模式,為面向新文科建設,樹立新理念、采用新方法、利用新技術的學科服務研究起拋磚引玉作用。
1? ?從學科服務到學科數據服務的發展與演進
學科服務是高校圖書館為適應新的信息環境,以滿足學科用戶需求為目標,按照學科、項目、專業等的科學研究來采集、檢索、組織、利用信息資源,提高用戶對信息服務需求的滿意度和任務支持力度的一種新型的服務模式[1]。在國內于1998 年由清華大學率先提出并實施以來,圖書館業界對其進行了持續的實踐探索,學科服務也成為了新世紀以來我國圖書館特別是高校圖書館和專業圖書館從傳統向現代轉型變革的里程碑[2]。
從我國圖書館學界所展開的學科服務理論研究可以看出,在學科服務提出之后的前20年中,相關研究主要以傳統的學科服務體系建設為主,中國科學院國家科學圖書館等機構實施的全新學科化服務模式與機制,則將學科服務提升到了嵌入式學科服務發展水平。隨著2015年以來移動互聯網的飛速發展與移動智能終端的廣泛應用,學科服務逐漸向移動化、智能化、個性化方向發展[3],相關研究開始向有關“雙一流”“大數據”“人工智能”“數據服務”等特色學科服務方向轉型。其中,“數據服務”本質上就是學科數據服務的一種形式,其中數據館員由學科館員兼任,是對學科館員能力要求的進一步延伸。2018 年 4 月 3 日,我國首屆《全國高校數據創新研究大賽》中展示“數據分析驅動科研創新重要性”參賽作品[4]也啟示圖書館:數據服務將是高校圖書館學科服務的延伸,學科數據服務是高校圖書館學科服務的新的生長點。
根據學科服務科學研究的發展及態勢可以發現,數智時代的到來讓圖書館的學科服務發生了較大變化,將學科數據作為一種資源,利用大數據、云計算等技術分析和組織數據資源,并利用數據挖掘實現技術增值,通過聚類和關聯將交叉學科中的數據采集和過濾,進而根據用戶個性化需求提供相應的服務成為了學科服務發展的方向。可以預見,隨著《新文科建設宣言》的發布和新文科建設的正式啟動,傳統學科服務內容已無法滿足新文科建設的要求,在數智理念的引導下轉型升級學科服務,利用新技術革命轉型升級的契機,借鑒其他相關領域的理論,探索面向新文科建設的學科數據服務既是高校圖書館在新時代的新使命,也將是數智時代圖書館學科服務面向新文科建設的新方向[5]。
2? ?面向新文科建設的學科數據服務模式設計
數智時代,新文科建設亟需進行學科交叉融合的探索,圖書館要深刻把握各類用戶對于文獻、數據、信息與知識資源等方面的新需求,通過大數據分析預測學科未來需求趨向,樹立新的資源觀,不斷進行資源優化;通過小數據分析用戶多元化、個性化需求,滿足新文科建設對圖書館學科數據服務提出的新要求。基于此,本文所設計的面向新文科建設的學科數據服務主要從兩方面開展:一是基于大數據的新文科學科數據發展趨向預測,通過大數據挖掘分析,獲得更多新的知識,從資源供給角度優化用戶體驗;二是基于小數據的多元化、個性化用戶學科服務產品定制,從用戶與資源匹配角度提供分類、分層、精準服務。
2.1? ? 模式設計理念
(1)樹立“數智”思維理念,創新數據資源觀。樹立“數智”思維理念,實現“從樣本到全體”“從精準到繁雜”“從因果到關聯”的數據思維轉變。積極參與新文科大數據建設,采用靈活的形式,以數據共同體取代固定的單位。在數據標準管理上,構建靈活的、可擴展的元數據體系,增強數據共享的可能性;在建設內容上,創新固有數據資源觀,除已有結構化的文獻資源、數字資源外,加強對多源多類型的海量半結構化、非結構化數據的收集、整理、分析、利用和共享[6]。從凌亂、繁雜、多源、異構的數據中,清洗出關系到事物根本性的認識;從對大量、模糊、動態變化、多類型數據的深度分析中,挖掘有價值的信息,掌握和預測新文科數據建設未來發展的最大可能,或者從深度挖掘中發現異樣,從而引起關注,做出預警推測[7]。
(2)“技術”+“數據”+“資源”融合驅動新文科建設。新文科的“新”主要體現在學科協同之新、信息技術融入之新、人才培養模式之新等方面[8]。數智時代的到來,圖書館從技術賦能(Technology Empowerment,TE)到數據賦能(Data Empowerment,DE),推動著學科服務從文獻服務向數據服務轉型。憑借“技術”+“數據”+“資源”先天優勢承擔起數智時代新文科建設的新任務,重塑文科思維方式,實現傳統科研范式向數據密集型科研范式轉型。創新新文科建設的學科數據服務,形成可推廣、可移植的學科數據服務模式,提升面向新文科建設的學科服務能力和服務水平。
2.2? ? 模式框架構建設計
數據生命周期是指從數據產生開始,經過對數據的收集、加工、分析、存儲、訪問和共享,最終實現數據再利用的循環過程。依據數據生命周期理論將面向新文科建設的“學科大數據+用戶小數據”服務模式分為四個層次:第一層為數據采集層;第二層為數據管理層;第三層為數據分析層;第四層為數據挖掘層(見圖1)。
(1)數據采集層。數據采集是基礎,是數據開發和利用的前提條件。在此層面,可根據 5W原則,利用監控器、傳感器等智能傳感設備實現數據采集與計算,并通過 Flume、Hadoo及 Spark集群技術將其進行有效存儲與分析。全面采集新文科建設相關數據資源,包括館藏資源、聯盟資源、特色資源、業務數據、云資源庫、機構庫等資源數據,同時采集用戶特征數據、行為數據、社交數據,并依據數據資源描述標準對相關數據進行有序化組織,使之有序、可用。通過各類數據的有序化過程形成粗粒度知識,為下一步知識組織的粗粒度知識細化提供數據來源,實現知識融合的底層數據準備[9]。在此層面,圖書館將資源數據與用戶數據進行有效關聯,進行數據參考咨詢、學科導航、文獻檢索等傳統的學科服務。
(2)數據管理層。數據采集不是目的,讓采集來的數據產生價值才是最終目的。從海量、復雜、多種類型和結構的數據中提取對新文科建設和學科數據服務有重要價值的數據,并組織整理存儲到用HDFS 技術建立的數據庫中。與此同時,利用分離數據庫架構和分離表架構等數據清洗技術刪除與學科數據服務無關的數據或信息,并全面提高數據安全性、隔離性和災難備份可控性,提升數據價值密度[10],從而實現學科數據服務與用戶需求的無縫對接并獲得對服務意見的及時反饋。
(3)數據分析層。數據分析主要包括兩個方面:一方面是圖書館相關學科大數據分析。 對圖書館的現有相關數據對象進行分析,在海量數據中提取和分析新文科建設相關數據,經過粗粒度知識描述和細粒度知識組織等環節,重組傳統文科數據資源,實現跨學科融合發展,使其在新文科建設過程中產生新價值;另一方面用戶小數據分析。通過Spark 集群進行數據的高效分析計算,利用算法預測新文科建設用戶的服務需求,深入挖掘用戶深層次服務需求,將用戶需求與新文科建設專業學科數據資源進行有效匹配,并向用戶提供個性化、精準化的知識推薦服務,從而滿足用戶個性化服務需求。此外,大數據智能可視化技術是“數智”時代圖書館面對海量復雜數據的有效分析方法之一,其實質是從證實性數據分析到探索性數據分析的跨越。強調的不僅是數據量的巨大增長,還隱藏著海量非結構化數據間關聯性、交互性關系的可視化[11]。總之,數據分析要有足夠的用戶意識,學科數據服務在大數據分析與挖掘中首先要讓數據與用戶關聯起來,其次要讓“休眠數據”活起來,把高價值的知識挖掘出來。
(4)數據挖掘層。數據挖掘是指從海量數據中挖掘出隱含的,先前未知的并有潛在價值的信息的非平凡過程。數據挖掘可以與用戶或知識庫交互,將用戶與知識庫進行有效關聯,為用戶提供精準學科數據服務。其任務有關聯分析、分類分析、聚類分析、異常分析、特異群組分析和演變分析等[12]。圖書館擁有大量的學科數據資源,新文科建設迫切需要將這些數據資源轉換成對新文科建設有更大價值的學科數據。這就要求學科數據服務使用 Hadoop 的 Mahout 等數據挖掘技術,通過K-Means聚類、SVM統計學習、NaiveBayes分類等算法挖掘、識別、組織與分析數據,對學科前沿和研究熱點進行預測分析,為新文科建設提供個性化、精準化的知識服務,為用戶提供持續準確的學科數據支持,并準確預測用戶的知識服務需求,進而提供多元化、個性化定制產品[13]。同時,可通過深度學習、機器學習、數據挖掘、聚類、關聯分析和回歸分析等技術提取用戶屬性特征,利用用戶偏好與行為數據,深入挖掘其潛在服務需求并構建用戶畫像,進行用戶行為預測,分析數據關聯關系和用戶需求等之間的關聯關系,最終實現新文科建設學科數據精準定制服務。
2.3? ? 模式實施策略
2.3.1? ?加強數據素養教育,提升面向新文科建設的服務能力
數據素養是指在充分關注數據管理與分析的基礎上,組織、定位、創建和評估信息和數據的能力,是信息素養的核心組成部分[14]。高校圖書館數據素養是人才培養的核心。要從數據意識、數據能力、數據倫理三個層次有意識地培養新文科研究者、建設者與學生的數據素養。發揮學科服務的紐帶作用,為新文科的建設與未來研究“賦能”。如武漢大學、南京大學、中山大學、北京大學等先后推出類似《信息素養》《數據素養》等課程,為我們提供了很好的借鑒。高校圖書館在面向新文科建設的新環境,要發揮自己在數據素養教育、 學術規范訓練等方面的優勢,開展數據素養通識教育、學術沙龍、展覽體驗等活動或服務來拓寬新文科學生的視野,豐富他們的知識結構,推進數據素養教育。同時,高校圖書館要積極嘗試拓展信息素養教育模式,利用MOOC、微信等平臺開展虛擬課堂教學,在線為用戶提供自主學習數據庫知識和信息檢索技巧的教育途徑[15]。
2.3.2? ?建設學科數據服務空間,為新文科建設賦能
學科數據服務離不開學科研討空間、跨學科協作空間、虛擬仿真空間等一套完整的空間服務設施的支持。特別是新文科建設的提出,為技術賦能、數據賦能新文科而打造的新文科實驗室,為跨學科融合發展提供了“文+文”“文+理”“文+信息技術”的交流、共享、互動的線上線下全媒體學科數據服務空間。如上海交通大學圖書館首創了IC2服務模式,將信息共享空間(Information Commons,IC)和創新社區(InnovationCommunity,IC)相結合,強化學術創新支持與人文素養拓展,努力提升圖書館服務效能[15]。將網上 IC 移植到物理 IC 可使學習空間與學科服務更好地融合,促進學科服務與用戶的學習研究更加密切地結合在一起,形成一種開放的泛在服務體系。
2.3.3? ?加快學科數據服務平臺建設
新文科建設的學科交叉融合急需一個能橫跨各學科知識體系提供交流合作的數據服務平臺。圖書館可作為學科交叉的交融點,將新文科建設研究者信息、各類研究數據與資源、研究成果等進行組織、存儲、整合,為學科用戶提供一個資源無縫鏈接、功能強大的一站式學科信息服務平臺。為新文科建設搭建一個傳輸學科數據資源,開展學科數據服務,促進跨學科的交流、協作、分享的創意平臺。如重慶大學圖書館建設的“智慧型資源門戶”將紙質文獻元數據與數字文獻元數據整合在一起,實現紙質文獻和數字文獻的聚類,為不同學科的師生提供個性化的知識推送服務,讓不同學科讀者擁有專屬的資源門戶。這無疑是學科資源建設與學科服務進一步融合的方向[16]。
當前,新文科建設中風頭最強勁、發展最迅猛、成就最顯著,也最被看好的當屬數智人文“Digital-Intelligent Humanities (DIH)”[17]。其為新文科提供了跨學科交流平臺和新的研究工具,激發了新的研究方法、研究范式和研究活力,推動了學術機制的重組(構)和再造。如計算社會科學就是旨在打造“數智人文”、用計算手段來研究社會科學的一門交叉學科[18]。目前,北京大學、武漢大學、復旦大學、華東師范大學等高校都建立了人文科學大數據平臺。南京大學能源科學研究院、全球能源科學信息中心更是學科數據服務平臺建設的典范。
3? ?結語
數智時代,圖書館學科服務進入新時期。面向新文科建設,高校圖書館要迎接新挑戰,樹立新理念,重建新資源,重構新服務。要抓住新文科建設契機,憑借自身“技術”+“數據”+“資源”的優勢,創新學科數據服務模式,服務新文科建設,促進跨學科融合發展,實現向第四次科研范式“數據密集型科學發現(Data-Intensive Scientific Discovery)”的轉型。
參考文獻:
[1]? 羅秀娟.學科信息共享空間2.0服務模式的構建[J].圖書與情報,2013(3):94-97.
[2]? 趙梅.同伴教育:高校圖書館嵌入研究生學科服務新模式[J].圖書館學研究, 2017(4):85-89.
[3]? 張向先,郭順利,李昆.新媒體環境下高校圖書館學科服務團隊知識共享機理分析[J]. 圖書館建設,2017(5): 79-86.
[4]? 首屆全國高校數據驅動創新研究大賽在北大舉行[EB/OL].[2021-04-06].http://pkunews.pku.edu.cn/xwzh/2018-04/06/content_301808.htm.
[5]? 邵波,單軫,王怡. 新一代服務平臺環境下的智慧圖書館建設:業務重組與數據管理[J].中國圖書館學報,2020,46(2): 27-37.
[6]? 楊艷紅,王昆侖.思維嬗變引領信息服務創新與發展[J].情報理論與實踐,2014,37(12): 53-56.
[7]? 維克托·邁爾-舍恩伯格,肯尼思·庫克耶.盛楊燕,周濤,譯.大數據時代[M].杭州: 浙江人民出版社,2013:27-94.
[8]? “新文科”的來源、特性及建設路徑[EB/OL].[2021-05-20].http://www.cssn.cn/kxk/202009/t20200911_5181760.shtml.
[9]? 楊昭.大數據時代高校圖書館世界一流學科評價服務研究[J].圖書與情報,2018(5):81-86.
[10]? 董同強,馬秀峰.“人工智能+圖書館”視域下智慧型學科服務空間的構建[J].圖書館學研究,2019(2):83-88,46.
[11]? 張宸,吳廷照,戴平等.大數據智能可視化在北美高校圖書館的應用研究[J].圖書館建設,2017(8):69-73.
[12]? 劉凡.數據如水-漫談統計推斷、數據挖掘和大數據[J].調研世界,2014(3):57-58.
[13]? 王丹.大數據影響圖書館服務與發展趨勢的調查研究[J].圖書館工作與研究, 2017(6):76-80.
[14]? Schield M.Information Literacy,Statistical Literacy and Data Literacy[EB/OL].[2021-05-02].http://www.iassistdata,org/downloads/iqvol282- 3shields.pdf.
[15]? 劉妍,王天泥.“雙一流”背景下高校圖書館智慧化學科服務研究[J].圖書館工作與研究,2019(10):5-10.
[16]? 肖希明,尹彥力.服務于“雙一流”建設的高校圖書館信息資源建設[J].圖書館建設,2018(4):79-84.
[17]? 新文科建設:“新”從何來,通往何方[EB/OL].[2021-05-06].http://theory.people.com.cn/n1/2021/0320/c40531-32056287.html.
[18]? 徐飛:新文科與創新創業[EB/OL].[2021-05-20].http://www.ahskj.org.cn/system/2021/01/15/011848022.shtml.
作者簡介:鄭金萍,女,太原師范學院圖書館副研究館員,研究方向:圖書館學教育,數字圖書館,學科數據服務。