馬光華,夏 昕,張 文,劉為瓊,雒 虹
(1.西北大學 圖書館,陜西 西安 710127;2.中國人民解放軍空軍工程大學 圖書館,陜西 西安 710000;3.中國人民武裝警察部隊特種警察學院 訓練部,北京 100000;4.西安職業技術學院 圖書館,陜西 西安 710077;5.西安交通大學 圖書館,陜西 西安 710000)
新制定的“圖書館法規”對圖書館工作人員的數字人文素養與圖書館“數字信息資源建設”提出了新的要求,如《中華人民共和國公共圖書館法》(以下簡稱《圖書館法》)第八條規定:“推動運用現代信息技術和傳播技術,提高公共圖書館的服務效能”[1];第十九條規定:“政府設立的公共圖書館館長應當具備相應的文化水平、專業知識和組織管理能力……”[1];第四十條規定:“政府設立的公共圖書館應當加強數字資源建設、配備相應的設施設備……”[1]。《普通高校圖書館規程》(以下簡稱《規程》)第二十七條規定:“圖書館應注重建設數字信息資源管理和服務系統,參與校園信息化建設和學校學術資源的數字化工作……”[2]。以上“法律”及“規程”均要求:圖書情報人員——文化資源之一“應當具備相應的專業知識與技能”“大數據知識、數字人文素養”與圖書館應加強“數字信息資源建設”,其前提是:圖書情報人員的“數字人文素養”。可見“數字資源是圖書館信息化建設的核心……”[3]“信息技術的快速發展對圖書館的技術能力提出空前挑戰……”[3]
當前,全國乃至世界的“抗擊新冠肺炎(英文名:Novel coronavirus pneumonia,簡稱NCP)之狙擊戰”正在進行,產生及變化著的數據,是我們增強信心取得勝利的有力武器;同時也是我們制定科學決策的重要依據!對其進行統計與分析,是一應具備的知識和素養!我們已經進入大數據時代,“我們已經看到海量數據的爆炸式景觀,特別是來自云端的數據……我們已深處‘大數據’時代”[4]。
當前的“電子文獻”及“數字圖書館”之出現,掌握并加強“數字信息資源”建設至關重要,其知識與技術為當代圖書情報人員之“數字人文素養”之必備,甚至為“應知應會”“數字圖書館的概念:隨著計算機技術的迅猛發展,特別是網絡技術、數據存儲與傳輸技術等的全面普及,使得人們對文獻信息的加工、存儲、查詢、利用等方面有了新的要求……本質功能是利用現代信息技術和網絡通信技術,將各種傳統介質的文獻進行處理并轉化為數字信息資源”[5]。依據上述有關《法規》的要求,應對“大數據時代”的挑戰,結合長期的圖書館工作實踐與研究,分析認為:今天,我們無論使用ATM機取款、預定航空與高鐵等票,還是查詢我們即將出行到達的目的地(異地甚至異國)的天氣狀況,以至我們在圖書館工作中查詢有關文獻借閱量、文獻點擊率等,都離不開關系數據庫……;許許多多的東西需要用數據加以表示,用數學及統計學方式進行統計分析與計算——此舉會使圖書情報工作及研究更加嚴謹化、科學化、公正化、透明化,世界著名哲學家康德早就指出:“對于任何學科都是一樣,數學成分的多寡決定了它在多大程度上夠得上是一門科學”。例如:“公共文化服務均等化統計數據與分析?檢全率與檢準率之計算?文獻增長率之計算?情報信息量——‘比特’的計算?讀者與公眾問卷調查之‘滿意度’數據分析?農家書屋覆蓋率?讀者到書屋數字?圖書館的人員職稱構成?學歷構成?讀者滿意度?數據庫被檢索利用率?論文被轉引率?工作人員及學生論文發表數?核心刊數?被引用率?工作量之統計細化?讀者到館率的多少?書刊利用率的多少?SCI的檢索?數字情報信息(純情報信息)與模糊情報信息”乃圖書館、科研情報部門科學管理的一種方法,或稱科學管理的方法論——數字人文!其中,也含有《文獻計量學》《數學》《統計學》及《大數據》等知識內容。早在1948年,世界著名圖書館學家阮岡納贊(S.R.Ranganathan)就已預言:“由于圖書館工作與服務涉及大量的和數有關的問題,圖書館學工作者必須得效仿生物計量學、經濟計量學和心理計量學來發展圖書館學的計量技術”。
數字人文(Digital Humanities)前身為人文計算(Humanities Computing),至今已有近50年歷史。當前世界已有了不少的數字人文研究機構及教學部門,例如英國的倫敦帝國學院“數字人文系”,美國的加州大學洛杉磯分校的“數字人文中心”,日本的立命館大學也有“數字人文研究中心”,臺灣大學的“數位典藏發展中心”,武漢大學新聞傳播學院的“數字人文研究中心”等。我們圖書館學界之核心刊物:《數字圖書館論壇》之研究內容之一,便是“數字人文”欄目。
作為一門新興的文理交叉學科——數字人文,它是偉大導師馬克思所預言的:“自然科學的滾滾洪流正奔向社會科學”思想觀點的論證與結晶!它的發展得到了各個學科學界的關注和支持及其更進一步的研究!“數字人文對傳統人文學術的滲透和影響并不僅僅是因為數學、信息科學、計算機技術等所謂強學科的輻射力所致……簡要來說,是由于獲取知識和知識傳播的體系發生了改變……當下熱詞‘大數據’就鮮明地表明了這個時代的特點”[6]。
圖書館學的系統學科之一《文獻計量學》及當前熱議的“大數據”是數字人文研究中的內容的重要組成部分:“大數據對于今天史學在內的人文研究工作者的研究在方法和手段上提出了更高的希望和要求。一是資料庫使用的門檻問題……另外,就是‘數據冗余’問題:例如過量的資料如何處理,如何讓大量的資料產生新的意義……”[6]邱均平教授認為:“文獻計量學、科學計量學和信息計量學……它的主要內容是應用數學、統計學等定量方法來分析和處理信息過程中的種種矛盾,從定量的角度分析和研究信息的動態特征,并找出其中的內在規律”[7]。
分析認為:世界發達國家關于“數字人文素養”之研究及設立專門機構、人員之教育與培訓已有50年之歷史,而我國圖書館界及科研情報部門“數字人文素養”研究較少,尤其是圖書情報人員其意識不夠強,致使該學科始終不夠充實、完善,處于“冷落”狀態,遲遲不能登堂入室……但是,當代各種狀況,迫使圖書館界及科研情報部門“數字人文素養”研究及圖書情報人員有關知識之掌握迫在眉睫、責無旁貸!數字人文素養也應包含科學數據素養,或有相互交叉、滲透之處及當前的“大數據素養”!“對高校圖書館來說,培養師生的科學數據素養,是一項緊迫而重要的任務”[8]。
葉繼元之文章所論:“……1995年-2005年全國圖書總量為1 696 766種。如果從中扣除自然科學類圖書……根據最保守的估計,自然科學圖書占30%的話……上文提到,‘30%說’認為2005年38 573種、2006年39 079種、2007年40 000種……這些學術圖書的數據是通過2005年、2006年和2007年的初版圖書總量乘以30%得出來的……”[9]
下面列舉西北大學圖書館(1988年與2000年)有關數據比較分析,1988年,“西北大學圖書館:工作人員89名,高級職稱7名,館舍面積6 700m2,館藏文獻140余萬冊,外文圖書15萬冊……”[10]
2000年,“西北大學圖書館:館舍面積15 131m2,工作人員72名,高級職稱10名,館藏文獻1 689 892冊,外文書刊235 187本……”[11]
對兩組數據進行分析,館舍面積、文獻量均增長;高級職稱、外文資料數量也在增長;而工作人員減少——因為實現了自動化設備,印證了馬克思一百多年前預言的“技術有機構成的提高,便造成大量工人的失業……”
從上文中,既看出了圖書館學專家葉繼元的“數字人文素養”,也看出了對“西北大學圖書館有關數據”統計分析之結果及其重要性,同時得出結論:當代圖書情報人員(包括任何公民)均應具備應有的“數字人文知識與素養”——“統計、計算、分析”等知識與素養。
簡言之,圖書情報人員的數字人文素養,即:有關數學知識、統計分析知識及大數據知識與素養之培訓、培養與掌握,是加強“數字信息資源建設”的前提條件,圖書情報人員的“數字人文知識與素養”的培訓、培養勢在必行。
現僅舉一“檢索事例”加以說明:一位某駕校校長來圖書館查閱有關“汽車上坡時,為增大牽引力而必須減速的原因?”——駕校理論課的要求。筆者直接告訴他:一部汽車的功率是一定的,而上坡時需要增大牽引力,就必須降低速度——物理學科學的要求。
公式表示為:

即:功率(P)=力(F)×速度(V)
結論:依據上述公式之推導可知:汽車功率(P)一定,當上坡時,為增大牽引力(F),就必須減低速度(V)——此乃科學的依據與解釋。
上述這一例子說明:優秀的圖書館工作人員,應具備一定的“數字人文知識與素養”。同樣說明:“數字人文知識與素養”的培養與培訓勢在必行。
國外不少大學成立有專門的數據管理機構,近似于數字人文管理機構,如,約翰·霍普金斯大學的Sheridan圖書館的數字研究和監管中心。有鑒于此,我國各大圖書館也應設立相應的機構,并由專家擔任研究及咨詢任務。
編寫《數字人文知識與素養》之教材,對圖書館等部門在職人員進行“繼續教育培訓”,對在校專業大學生及研究生作為教材進行專業學習。
《數字人文知識與素養》的基本內容應涉及數學計算知識、統計知識、計算機基礎知識、數據收集與分析知識、數據處理知識、文獻分布形態等。
因此,教材之內容應包括:“數學基本知識”“統計學及其分析基本知識”“計算機基本知識”“文獻計量學基本知識”“布拉德富定律”“大數據知識”“檢全率(又稱查全率)、檢準率(又稱查準率)、漏檢率、誤檢率計算知識”,模糊數學知識,構建數學動態模型。
因篇幅所限,僅簡論幾部分內容。
①“檢全率”(又稱查全率:Recall ratio,簡稱R)的計算公式:
②“誤檢率”的計算公式:

③“檢準率”(又稱查準率,Precision ratio,簡稱P)的計算公式:
④“檢全率、檢準率、漏檢率、誤檢率”之間的辯證關系:
A.加大“檢全率”,勢必增加“誤檢率”——“寧可誤檢一千,不可漏檢一個”;
B.加大“檢準率”,勢必增大“漏檢率”——主要取決于圖書管理人員的知識與素質;
“檢全率、檢準率、漏檢率、誤檢率”之結果,主要取決于圖書情報人員的業務水平及數字人文素養,也是圖書館及科研情報部門“個人與組織”“工作優劣”的“數據性(數字人文素養)檢驗”。也是該部門科學管理——“獎懲與激勵”的依據。
布拉德福為一位英國化學家,而在文獻計量學中又發明了一定律:“文獻分散之定律”,因此認為,布拉德富還可稱為文獻計量學家。依據邱均平教授所著文獻,對該定律簡述如下:假如某一學科領域有期刊124種,共刊載相關科學論文330篇。按照“布拉德富”論述的文獻分散之定律,則第一區域中的“核心”期刊只有4種,第二區域中的“相關”期刊為4×5=20種,第三區域中的“邊遠”期刊數為4×52=100種,而每個區均應刊載220篇文章,具體如表1。

表1 文獻分散定律
從表1可看出:各區域的單種期刊的載文量逐區下降;而各區域期刊數量則是逐區上升的;核心區域情報密度高,每種期刊平均載27.5篇論文,相關區域次之,每種期刊載5.5篇論文,外圍區域情報密度最低,每種期刊僅刊約登1篇相關論文。
后經過維克利的研究,式:
(n1∶n2∶n3=1∶a∶a2,其中a>1)被推廣為:
n1∶n2∶n3∶…=1∶a∶a2∶…
即把分3個區域討論的文獻離散規律推廣到任意多個區的情況。
分析后,將其更加通俗易懂的表示為:
n1∶n2∶n3∶…=M∶M×a∶M×a2=∶…(M為正數數字;a>1)
僅引用專家所著一段文獻內容加以簡單說明——邱均平教授認為:“作為網絡信息計量學研究對象的網上信息,可以分為3個層次:第一層次是以‘比特’形態存在的網絡最基本的信息單元……第二層次是關于網上文獻的信息及其相關特征信息……在第三層次上,網絡信息計量學通過對網絡站點或數據庫等結構單元進行研究……”[7]
因篇幅所限,僅引用馬光華所著文章的一段作為論述:
人們當前多用“比特”作為信息計量單位……再如甲隊與乙隊進行羽毛球單打對抗賽。雙方如果各上4人,首輪的對手是誰呢?如果各上8人,首輪的對手又是誰呢?由4個當中來定一個所需的信息總量是2比特,由8個當中來確定一個所需的信息總量是3比特。依次類推,我們可以用數學公式表示如下:
指數表示法:2x=a
對數表示法:log2a=x
其中:x表示比特數,a表示用來確定比特數的選擇數……我們可稱此為數字化信息情報,或稱為信息情報的數字化[12]。
即:若8名隊員上場,確定首輪對手的信息量x的算法公式為:2x=8(8名隊員);換成對數式為:x=log28=3(比特)
這是體育比賽中,兩隊勢均力敵時,所采取的選派隊員的一種策略。
上述這段論述足以說明:數字化情報、比特信息量的計算,在圖書館及科研情報機構的應用及其自身的嚴謹性。該內容也應編入《數字人文知識與素養》之教材中。更加需要說明的是:圖書情報人員應具備基本的數學知識。
文獻引文的分析,可反映出一系列有“血緣關系”及“脈絡關系”的學術論點及科學論證的發展演變過程,也可以反映出科學研究與學術理論的進化過程,其之間的量化關系可以勾勒出科學研究與學術發展的遺傳譜系圖。
圖書情報人員應是一名“博學”人才,對其培訓時,建議還應選用已編兩本教材:①《科學技術概論》——胡顯章、曾國屏著,高等教育出版社;②《人文社會科學概論》——彭新武主編,首都經濟貿易大學出版社。
上述兩部教材可拓寬圖書情報人員的文理工科知識面,使其建立合理的三角形知識結構之“博學”內容,即:中外圖書情報人員還應具備合理的三角形知識結構,見圖1所示。

圖1 圖書情報人員知識結構
此外,還應開設《數學》《統計學》《大數據》《計算機》《中華文化》等課程。
上述這些即為分析建議的所編《數字人文知識與素養》之教材及其所包含內容,要求《數字人文素養》教材既有嚴謹性,又有實用性。同時說明:當代圖書情報人員及專業研究生、大學生等應具備數學及統計分析學、大數據及文理公管法等多學科基礎知識。
簡言之,培訓培養的方式可采取:大學生、研究生在校的上述課程及內容培養和在職人員的繼續教育培訓。
繼續教育培訓是對培訓人員進行回爐、充電的一種新知識培訓方式,現已列入評定職稱的“硬件”要求之一就是開設大課堂講座。
數字人文素養之培訓與教育,是一項系統的工作,人員隊伍和組織機構建設是開展培養教育的前提條件,業界人們思想的重視也是前提條件之一,此項培訓與教育是以圖書館及科研情報部門等為中心,以圖書館學界為教學及科研指導部門,以圖書情報人員的科研成果及工作經驗及讀者的需求為內容之一,以廣大讀者為參與者,培訓機構為執行者,以數學及統計學為支柱性學科。我國圖書館界“數字人文素養及教育”還存在以下改進之處:①“數字人文素養”的概念之理論層面還處在初期階段,未形成完整的理論框架;②對數字人文素養的教育培訓之重要性還不夠重視;③數字人文有關知識及問題之調研還不能“主動出擊”,只有被動應對;④數字人文研究與培訓內容還不夠完善。
大數據背景下,數字人文素養接近于數據素養,是當代人們,尤其是圖書情報工作者及研究者——文化資源之一與在校教師、學生應具備的素養之一——“數據爆炸性增長,數據分析能力也在快速進步”[13]。數字人文,是數學、計算科學、統計學等與人文學科之間相互交叉、滲透的一門創新學科。對于以數據、信息、知識等為載體及存儲、傳播對象的圖書館等部門來說,有著重要的意義。因此,現今的圖書情報人才培養及在職人員的繼續教育與研究,更應該注重數字人文方面的內容及知識。數字人文素養,已成為當代圖書情報工作者、圖書情報專業在校學生、圖書情報專業教學與研究者必備的素養之一,即:有關數學知識、統計分析知識及大數據知識與素養之培訓與掌握,也是加強“數字信息資源建設”的前提條件。中外圖書情報人員還應具備“高尖的圖書情報專業知識及廣博的文理公管法各學科知識”之合理的三角形知識結構。
關于新型圖書情報人員的培養與培訓,其探討與研究始終“在路上”!“2017年12月國務院辦公廳發布的《關于深化產教融合的若干意見》中明確將‘產教融合、校企合作’列為高校改革發展的重要任務。教育部也明確指出普通高校尤其是地方普通本科高校,應以培養應用型技能型人才為主要目標”[14]。