秦嘉杭
(南京財經(jīng)大學圖書館,江蘇 南京 210046)
大數(shù)據(jù)源于虛擬網(wǎng)絡(luò)的迅速發(fā)展和現(xiàn)實世界的快速網(wǎng)絡(luò)化。“大數(shù)據(jù)”具有規(guī)模性、多樣性、高速性和有價值(value)等特點。大數(shù)據(jù)數(shù)量巨大、類型繁多,處理和傳播速度呈倍數(shù)級提高。在大數(shù)據(jù)環(huán)境下,高校圖書館用戶需求更加個性化與專業(yè)化,傳統(tǒng)的電腦以及掌上電腦、手持閱讀設(shè)備、高清電視、手機等都可以用于存取、定位、傳遞泛在圖書館提供的信息、服務(wù)。在大數(shù)據(jù)背景下,高校圖書館要以用戶為中心,針對不同類型的資源,構(gòu)建不同的資源建設(shè)及服務(wù)策略。
結(jié)構(gòu)化資源是指存儲在數(shù)據(jù)庫,可以用二維表結(jié)構(gòu)來邏輯表達實現(xiàn)的資源。典型的如圖書館圖書錄入數(shù)據(jù)與借還數(shù)據(jù)及電子資源利用數(shù)據(jù)等。在大數(shù)據(jù)環(huán)境下,傳統(tǒng)的結(jié)構(gòu)化資源服務(wù)發(fā)生了變化。隨著文獻類型和信息傳遞方式的多元化發(fā)展,圖書館為讀者服務(wù)的方式向多元化延伸,最大限度地滿足讀者的個性化、專題化、特色化、社會化以及開放性、多樣性、綜合性服務(wù)需求。隨著遠程訪問與數(shù)字資源的廣泛利用,讀者的學習與閱讀習慣已發(fā)生很大改變,讀者對傳統(tǒng)紙質(zhì)圖書的依賴下降,對電子資源的需求量越來越大。圖書館應(yīng)合理配置電子資源比重,加大資源共享共建力度,構(gòu)建移動數(shù)字資源服務(wù)體系。
在大數(shù)據(jù)環(huán)境下,電子資源的利用率越來越高。高校圖書館應(yīng)遵循整體規(guī)劃、統(tǒng)籌安排、保證重點、兼顧一般的原則進行文獻資源建設(shè),既要保證高校各學科文獻的系統(tǒng)發(fā)展,又要適當向重點學科和新專業(yè)的傾斜。提高電子資源比重,合理配置各類型電子資源比例。電子資源配置堅持高品質(zhì),內(nèi)容覆蓋重點學科、重點專業(yè),兼顧其他專業(yè)。有機結(jié)合高校學科前沿的重點需求和面廣量大的普遍需要采選電子資源,重點選購具有權(quán)威性、學術(shù)價值和利用價值較高的各類數(shù)據(jù)庫。密切配合學校優(yōu)勢學科建設(shè),按照學校學科建設(shè)和人才培養(yǎng)的需求,精心選擇、合理配置中外文數(shù)據(jù)庫,構(gòu)建學科完整、內(nèi)容權(quán)威、注重質(zhì)量、彰顯特色、細化層次、使用便捷的高校數(shù)字資源體系,以有效地滿足讀者日益增長的電子資源需求。
在大數(shù)據(jù)環(huán)境下,館際互借、文獻傳遞、資源共享是館藏資源的必要補充,也是現(xiàn)代圖書館的發(fā)展方向。各高校圖書館之間,需要在合作共建的基礎(chǔ)上,采用現(xiàn)代網(wǎng)絡(luò)通訊技術(shù)及時互通有無,根據(jù)用戶需求,及時進行原文的互相傳遞,同時為來館的各類讀者服務(wù)。南京地區(qū)的南京航空航天大學、南京理工大學、南京農(nóng)業(yè)大學、南京林業(yè)大學、南京體育學院五校圖書館以無縫館際合作來促進資源共建、共知、共享[1]。以成員館的共享資源作為館藏資源的延伸和擴展,為讀者的需求提供資源保障。
大數(shù)據(jù)環(huán)境具備“可移動”的特征,這種“可移動”的特征表現(xiàn)在普通用戶和讀者可以不必依賴于PC機即可實現(xiàn)數(shù)字資源的瀏覽、下載和閱讀。用戶和讀者可通過手機、MP3/MP4、PDA等手持閱讀器以及筆記本電腦等移動閱讀設(shè)備瀏覽、下載、閱讀和欣賞數(shù)字資源。移動閱讀作為數(shù)字閱讀的深化應(yīng)用閱讀形式,克服了需要電腦、網(wǎng)絡(luò)以及固定位置才能進行數(shù)字閱讀的限制,極大地滿足了讀者數(shù)字閱讀的需要。利用讀者移動設(shè)備的短信、彩信等技術(shù)功能與圖書館OPAC系統(tǒng)對接,可實現(xiàn)點對點的信息服務(wù)。移動數(shù)字資源服務(wù)平臺的開通,對有預(yù)約的圖書,可實行圖書催還,縮短圖書的周轉(zhuǎn)期,對于提高圖書利用率具有重要作用。通過構(gòu)建基于大數(shù)據(jù)與泛在知識環(huán)境的移動數(shù)字資源服務(wù)體系可實現(xiàn)四大功能:與OPAC系統(tǒng)的集成,實現(xiàn)紙質(zhì)館藏文獻的移動檢索與自助服務(wù);與數(shù)字資源門戶集成,實現(xiàn)電子資源的一站式檢索與全文移動閱讀;與共享云服務(wù)體系集成,實現(xiàn)館外資源聯(lián)合檢索與文獻傳遞服務(wù);構(gòu)建讀者信息交流互動平臺,實現(xiàn)公告信息發(fā)布與讀者個性化服務(wù)定制。
伴隨著社交網(wǎng)絡(luò)、移動圖書館、物聯(lián)網(wǎng)等興起,諸多非結(jié)構(gòu)化與半結(jié)構(gòu)化知識與信息涌現(xiàn)出來[2]。無論在圖書館資源建設(shè)過程中,還是高校學科建設(shè)過程中,半結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)大量產(chǎn)生。在資源建設(shè)過程中,高校圖書館要對讀者的關(guān)注點進行分析,如關(guān)注用戶查詢書目產(chǎn)生的OPAC日志,用戶借還書產(chǎn)生的流通日志,用戶檢索、瀏覽、下載電子資源產(chǎn)生的日志,用戶訪問產(chǎn)生的流量數(shù)據(jù),讀者的檢索歷史、檢索時間段、檢索關(guān)鍵詞、借閱文獻、借閱時間等信息,這些都表現(xiàn)為用戶信息非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)[3]。同時,高校在學科建設(shè)過程中也積累了大量的非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù)。針對用戶和學科建設(shè)的內(nèi)在需求,圖書館有必要構(gòu)建半結(jié)構(gòu)化與非結(jié)構(gòu)化資源庫。
讀者非結(jié)構(gòu)化與半結(jié)構(gòu)化知識具有不易獲得性、情景嵌入性、難言性、個性化等特點,使得讀者非結(jié)構(gòu)化與半結(jié)構(gòu)化知識的獲得與發(fā)現(xiàn)不同于結(jié)構(gòu)化知識,需要充分利用讀者的借閱歷史記錄,觀察讀者的借閱行為,并建立暢通的讀者非結(jié)構(gòu)化與半結(jié)構(gòu)化知識獲取與整理平臺,包括網(wǎng)絡(luò)互動平臺和面對面交流的物理互動平臺。其中,物理平臺更有利于非結(jié)構(gòu)化與半結(jié)構(gòu)化知識的發(fā)現(xiàn)。同時可以通過知識生產(chǎn)源如網(wǎng)絡(luò)博客或出版商與讀者直接交流的互動平臺獲取讀者非結(jié)構(gòu)化與半結(jié)構(gòu)化知識。開發(fā)利用讀者非結(jié)構(gòu)化與半結(jié)構(gòu)化知識,建立讀者信息與使用知識庫。通過讀者的自身參與非結(jié)構(gòu)化與半結(jié)構(gòu)化知識庫的建設(shè),不僅有利于讀者自身的非結(jié)構(gòu)化與半結(jié)構(gòu)化知識轉(zhuǎn)化為結(jié)構(gòu)化知識,同時也體現(xiàn)了個性化知識庫建立的特點,使圖書館非結(jié)構(gòu)化與半結(jié)構(gòu)化知識庫更加滿足讀者的需求。
在大數(shù)據(jù)環(huán)境下,隨著網(wǎng)絡(luò)化的發(fā)展,高校圖書館在學科資源建設(shè)上要改變以前那種“大而全,小而全”的觀念,了解和掌握高校學科與重點學科的學術(shù)隊伍狀況,通過對網(wǎng)絡(luò)信息進行分析、篩選、編輯、整理,構(gòu)建基于非結(jié)構(gòu)化與半結(jié)構(gòu)化知識的學科信息平臺。通過學科信息平臺,將學科網(wǎng)絡(luò)導(dǎo)航、學科發(fā)展最新成果、國內(nèi)外相關(guān)學科排名及研究動態(tài)信息、學科專題、學科專家創(chuàng)建的博客和國內(nèi)外相關(guān)學科學術(shù)會議等學科資源進行整合,建立非結(jié)構(gòu)化與半結(jié)構(gòu)化的專業(yè)學科網(wǎng)絡(luò)導(dǎo)航庫和專題數(shù)據(jù)庫。同時,可以按學科對資源進行組織,建立具有本館特色的數(shù)據(jù)庫及虛擬專業(yè)化館藏。構(gòu)建圖書館與一線用戶的服務(wù)鏈,將眾多分布和異構(gòu)的文獻信息資源與服務(wù)有機組成無縫的服務(wù)體系,形成統(tǒng)一的非結(jié)構(gòu)化與半結(jié)構(gòu)化學科信息資源整合服務(wù)平臺。該平臺主要涵蓋以下兩方面內(nèi)容:其一是專業(yè)上的非結(jié)構(gòu)化與半結(jié)構(gòu)化知識。某個專業(yè)的專家掌握著某專業(yè)領(lǐng)域大量的知識內(nèi)容,包括前沿知識的發(fā)展背景、文獻綜述、研究現(xiàn)狀、最新成果、研究重點、研究難點等問題,在此基礎(chǔ)上對專業(yè)上的非結(jié)構(gòu)化與半結(jié)構(gòu)化知識進行深入研究,提出創(chuàng)新的觀點,在知識服務(wù)中完成有預(yù)測性、建設(shè)性的報告。其二是技能上的專業(yè)上的非結(jié)構(gòu)化與半結(jié)構(gòu)化知識,包括那些非正式的、難以表達、難以掌握的技能、技巧和訣竅等。Masters曾指出“專家技能的特征涉及具有自動的、不費力氣的、隱性性質(zhì)的功能”。同時,也可以對圖書館員在資源檢索、查詢與分析等非結(jié)構(gòu)化與半結(jié)構(gòu)化知識進行顯性化,共同構(gòu)建立學科非結(jié)構(gòu)化與半結(jié)構(gòu)化知識庫。
在大數(shù)據(jù)環(huán)境下,由于數(shù)據(jù)的異質(zhì)、異構(gòu)、半結(jié)構(gòu)化、非結(jié)構(gòu)化等特征,大數(shù)據(jù)知識組織與服務(wù)需要解決大數(shù)據(jù)的獲取、組織、分析與處理等幾個關(guān)鍵問題。首先,需要從非結(jié)構(gòu)化信息中獲取不同主題內(nèi)容的集成 (如用戶支持和內(nèi)容分析等)、異構(gòu)數(shù)據(jù)的集成、異構(gòu)格式(文本、圖像、視頻、音頻等)、不同層次(原始數(shù)據(jù)、集成數(shù)據(jù)、整合數(shù)據(jù)),對大數(shù)據(jù)進行抽取與集成,經(jīng)過關(guān)聯(lián)與聚合之后采取一定的組織結(jié)構(gòu)來存儲這些數(shù)據(jù)。在大數(shù)據(jù)與泛在知識環(huán)境下,需要通過有機組織來構(gòu)建一個以用戶為中心,協(xié)作的、分布的、多層次、多語種、多媒體、語義關(guān)聯(lián)的知識服務(wù)網(wǎng)[4]。應(yīng)該充分利用現(xiàn)有條件,挖掘潛力,改善基礎(chǔ)設(shè)施,提高對大數(shù)據(jù)的分析和處理能力。通過聚類分析技術(shù)、數(shù)據(jù)挖掘技術(shù)、網(wǎng)絡(luò)分析、可視化分析、索引與查詢技術(shù)、數(shù)據(jù)分析技術(shù)、數(shù)據(jù)融合與數(shù)據(jù)集成技術(shù)對圖書館大數(shù)據(jù)進行分析。需要清晰地看到,目前這研究技術(shù)更多的是針對結(jié)構(gòu)化數(shù)據(jù)進行聚類分析、共現(xiàn)分析等[5]。而對于半結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)來講,還有待于進一步探索。在大數(shù)據(jù)處理上,目前,Hadoop是最為流行的大數(shù)據(jù)處理平臺。大數(shù)據(jù)知識服務(wù)體現(xiàn)了智慧化、協(xié)作化、泛在化等特點,是一種基于網(wǎng)絡(luò)的用以解決結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)多維度處理的知識服務(wù)新模式,嵌入了泛在化知識服務(wù)模式的新理念,是現(xiàn)代信息服務(wù)理念的具體體現(xiàn)[6]。在大數(shù)據(jù)與泛在知識環(huán)境下,大數(shù)據(jù)知識服務(wù)需要注意以下三個問題:大數(shù)據(jù)的異構(gòu)性、大數(shù)據(jù)的質(zhì)量控制、大數(shù)據(jù)的隱私問題。數(shù)據(jù)的異構(gòu)性會出現(xiàn)變化,數(shù)據(jù)類型漸漸轉(zhuǎn)為結(jié)構(gòu)化、半結(jié)構(gòu)化與非結(jié)構(gòu)化三者的融合。另外,對大數(shù)據(jù)的質(zhì)量控制也是一個值得注意的問題,需要清洗一些干擾數(shù)據(jù),避免信息垃圾的泛濫。同時,也應(yīng)高度關(guān)注和重視大數(shù)據(jù)的隱私問題,由于數(shù)據(jù)具有關(guān)聯(lián)性與累積性,隱私數(shù)據(jù)的暴露需要有效控制[7]。
在大數(shù)據(jù)環(huán)境下,讀者的學習與閱讀習慣已發(fā)生較大改變,傳統(tǒng)的資源服務(wù)構(gòu)建策略已難以適應(yīng)新環(huán)境,需要注重分析讀者內(nèi)在需求,擴大知識服務(wù)的覆蓋范圍。對大數(shù)據(jù)的分析、提煉與處理將成為新時代環(huán)境中高校圖書館的重要業(yè)務(wù),應(yīng)確立與大數(shù)據(jù)資源分析和處理相關(guān)的知識服務(wù)標準,注重用戶的隱私。
[1]王宇寧.南京五高校建圖書館文獻共享聯(lián)合體[EB/OL].[2014 -05 -26] .http://ah.people.com.cn/n/2012/0423/c227156-16968313.html.
[2]張計龍.大數(shù)據(jù)驅(qū)動圖書館業(yè)務(wù)應(yīng)用與服務(wù)創(chuàng)新[J].上海高校圖書情報工作研究,2013(3):1-6.
[3]姜山.大數(shù)據(jù)對圖書館的啟示[J].圖書館工作與研究,2013(2):52-54.
[4]歐陽劍.泛在信息環(huán)境下圖書館信息資源組織探討[J].圖書情報工作,2011(19):68-72.
[5]韓翠峰.大數(shù)據(jù)時代圖書館的服務(wù)創(chuàng)新與發(fā)展[J].圖書館,2013(1):121-122.
[6]秦曉珠,李晨暉,麥范金.大數(shù)據(jù)知識服務(wù)的內(nèi)涵、典型特征及概念模型[J].情報資料工作,2013(2):18-22.
[7]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計算機研究與發(fā)展,2013(1):147-169.