999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據背景下圖書館知識咨詢服務策略

2014-02-12 06:56:02馬娜梅
圖書館研究 2014年4期
關鍵詞:圖書館用戶分析

馬娜梅

(首都圖書館,北京 100021)

1 何謂大數據

隨著物聯網、移動互聯網、智能便攜終端和云計算技術的發展,數據正以前所未有的速度不斷增長和累積,人類社會進入了大數據時代。關于大數據的概念,目前還沒有明確的一致的看法,大數據的基本概念、關鍵技術以及對其的利用上均存在很多的疑問和爭議。維基百科將大數據稱為巨量數據、海量數據、大資料,指的是所涉及的數據量規模巨大到無法通過人工,在合理時間內達到截取、管理、處理、并整理成為人類所能解讀的信息[1]。鐘瑛、張恒山認為,大數據,一方面反映的是規模大到無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合;另一方面主要是指海量數據的獲取、存儲、管理、分析、挖掘與運用的全新技術體系。這一定義指出了大數據不僅包括大量化、多樣化具有可追蹤、可分析、可量化特性的數據,而且包括大數據技術及其應用,即從各種各樣類型的數據中,快速獲得有價值信息的能力[2]。大數據研究機構Gartner認為:大數據是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產[3]。綜合以上各種觀點,筆者認為,大數據的概念內涵包括大數據本身的含義和大數據技術兩部分。大數據中的數據量大,是結構化數據、半結構化數據與非結構化數據的總和,具有規模大 (Volume)、數據種類多 (Variety)、數據要求處理速度快 (Velocity)、數據價值密度低(Value)四V特性。大數據主要來源于服務器生成的數據(如各類日志文件)、網站用戶創造的信息、各類數字設備產生的數據(如各類傳感器、物聯網設備、智能手機等)。世界各個角落的電腦、傳感器、移動設備、在線交易和社交網絡每時每刻產生大量數據。根據互聯網數據中心 (IDC)的監測,2011年全球數據量達到 1.8 ZB,預計到 2020年,全球將總共擁有35 ZB的數據量。大數據的數據類型多樣,以非結構化數據為主。非結構化數據量已占到數據總量的75%以上,且非結構化數據的增長速度比結構化數據快10倍到50倍。要求數據的快速處理,是大數據區別于傳統海量數據處理的重要特性之一。大數據對數據實時處理有著極高的要求,需要實時反饋結果,捕捉、分析、處理每一個瞬時出現的數據。大數據的價值雖然巨大,但價值密度卻很低,有效的信息相對于數據整體是偏少的。大數據技術是指從各種各樣類型的巨量數據中,快速獲得有價值信息的技術,具體包括數據采集技術、數據存取技術、數據處理技術、統計分析技術、數據挖掘技術、模型預測技術等。解決大數據問題的核心是大數據技術。大數據的應用,可提升政府的提升服務能力和運作效率,有助于“智慧城市”的打造,幫助商家開展針對性的營銷活動,以搶占商品銷售市場份額,爭取更多客戶的關注。

2 大數據給圖書館知識咨詢服務帶來的機遇

知識咨詢強調嵌入用戶的管理決策、教學科研、科技開發的全過程,提供以智力、知識、專業、工具的應用為特征的深度知識服務。圖書館知識咨詢是圖書館針對用戶工作、學習與生活中的信息與知識需求所提供的一種專業化知識服務。大數據時代的到來,意味著我們進入到了一個以密集型數據的相關挖掘、分析、處理來推動社會創新發展的時代。圖書館在大數據時代已具有大數據特征,圖書館數據種類繁多,信息資源總量日益龐大,用戶規模尤其是網絡用戶規模逐步擴大,利用大數據開展知識咨詢服務,必將推動圖書館知識咨詢服務水平和層次的提高。

2.1 為圖書館知識咨詢服務帶來了更加多態的數據資源

知識咨詢是在對相關知識信息進行提煉、總結的基礎上,為用戶提供專業性強的系統化知識服務,需要大量知識信息做支撐。在大數據背景下,非結構化數據、半結構化數據大量激增,夯實了圖書館知識咨詢服務的資源基礎。從圖書館角度分析,除了可利用的紙質出版物外,各種學術研究機構的結構化數據庫以及學術研究類網站資源、個人博客(微博)中的文本、圖片、XML、HTML、各類報表、圖像和音頻/視頻信息等半結構化、非結構化數據,是圖書館知識咨詢重要的參考情報源。據美國互聯網研究機構Netcraft發布的最新調查結果顯示,截至2012年3月份,全世界活躍網站數量已超過6.44億個[4]。這些網絡蘊藏著眾多的、動態的、有價值的數據資源,且數據量逐年增加,對這些數據資源進行存儲、分析與利用,豐富了圖書館知識咨詢服務的參考源。

2.2 為圖書館知識咨詢服務提供了更為先進的數據分析技術

及時準確地從海量數據中提取信息和知識,面向社會開展知識咨詢服務,這就需要對海量數據進行處理和分析。現有的數據倉庫、數據挖掘技術等只能對結構化數據進行處理,并不能挖掘更深、更多的隱含信息,進而得到更能揭示事物發展本質以及發展規律的知識。大數據技術的出現,為有效處理非結構化數據提供了技術保證。通過高速捕捉、發現和分析,從大容量、多類型的數據中獲取價值的大數據技術架構將為數據分析業務帶來更多的變化與支撐,如目前廣泛關注和應用的分布式系統基礎架構 Hadoop、非關系型數據庫技術NoSQL等大數據技術。

2.3 為圖書館知識咨詢服務帶來了新的服務流程

傳統圖書館知識咨詢業務流程是:問題接收—提問解析和分派—咨詢館員作出答案—答案發送—跟蹤,是一種逆向思維模式。在大數據背景下,圖書館知識咨詢流程是:收集數據—量化分析—找出相互關系—提出優化方案,使用戶的問題解決方案從成功躍至卓越,是一種正向思維模式。知識生產方式和傳播方式發生了變革。這種解決問題思維方式將為圖書館的知識咨詢服務帶來發展機遇,改變了圖書館被動接受咨詢者咨詢的做法,從數據分析入手,得出用戶知識需求特征,從而主動提供知識服務。

3 大數據時代圖書館知識服務策略

3.1 知識資源的挖掘與組織

圖書館知識咨詢服務是一種基于一切信息資源(包括館藏物理資源和網絡虛擬資源),以用戶需求為目的、面向知識內容的、融人用戶決策過程并幫助用戶找到或形成問題解決方案的知識增值服務。對現有知識資源進行收集、整理、組織,是成功開展知識咨詢服務的關鍵。目前,各個圖書館都引進了數量不等的商業數據庫和自建了一些特色數據庫,如首都圖書館引進CNKI學術資源總庫和ABI/INFORM商業和經濟管理期刊數據庫、牛津在線學術專著數據庫、Emerald管理學期刊數據庫和自建“首圖講壇資源庫”等。這些數據庫在圖書館知識咨詢服務中發揮了積極的作用。但在大數據時代,完全依靠現有的數據庫作為知識咨詢服務的信息源,難以為用戶提供最新的知識信息。在大數據背景下,海量化的大數據中存在著各種學科的最新知識及研究動態,是咨詢用戶急需了解和掌握的知識。因此,圖書館要挖掘與組織各學科的大數據,建立知識存儲系統,為用戶提供新穎的、前瞻性的學科知識,幫助用戶解決各種問題。數據挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程,利用分類、回歸分析、聚類、關聯規則、特征、變化和偏差分析、Web頁挖掘等數據挖掘方法,能處理結構化數據,如商業型 Oracle、Sql Server、開源型MySql等,均具備了強大的結構化數據管理功能、數據倉庫功能,但針對復雜的結構化和非結構化數據處理需求,Sql語言表達能力就暴露出了一定局限性。需要把數據從數據庫中讀取出來,借助于統計分析軟件進行大數據深度分析和決策,導致大量數據的移動。隨著Hadoop開源框架及其相關技術的逐步完善,采用Hadoop分布式文件系統的可靠大數據存儲服務及基于MapReduce編程模型的高性能并行大數據處理服務,能夠提供對結構化和復雜數據、非結構數據的快速、可靠分析變為現實,讓圖書館更容易地分析和研究復雜數據[5]。圖書館在挖掘學科大數據的基礎上,可建立知識存儲系統。鑒于圖書館人力和技術應用的局限性,筆者建議可通過與軟件開發商合作,建立基于云計算的知識存儲系統。

3.2 用戶數據的分析

根據用戶需求偏好,提供個性化知識服務,是大數據背景下圖書館知識咨詢服務的初衷。收集和分析用戶正確的數據、切實理解用戶體驗及用戶行為已成為圖書館的當務之急。用戶利用圖書館所產生的借閱信息、查詢信息以及用戶網絡信息行為等,是圖書館分析用戶需求偏好、了解用戶需求特征的可靠信息源。云計算、物聯網、社交化媒體、GIS提供了豐富的數據來源。數據中包括每個用戶的身份、地點、時間、喜好、厭惡、社會關系等大量的信息。對用戶個人信息、瀏覽信息、借閱方式、行為愛好、搜索歷史、搜索時間等信息以及社交網絡產生大量的與用戶有關的非結構化數據進行分析處理,可發現用戶的個性化知識需求。在大數據時代,圖書館尤其要收集用戶在網站上發生的所有行為,如搜索、瀏覽、打分、點評、參與討論、社交媒體上的交流、與好友互動等行為,這些行為深度地反映出用戶的知識需求心理和傾向。由于大數據的特殊性,大數據分析技術還處于發展階段,目前可利用可視化分析、數據挖掘算法、預測性分析、語義引擎、數據質量和數據管理等技術對用戶數據進行分析。國外的數據分析市場相對比較成熟。美國有近萬家專門從事數據分析的服務公司,英國有三千多家,日本有一千多家,瑞典也有五百多家有影響的數據分析服務公司[6]。印度班加羅爾已有超過100家以數據分析為主要業務的新型數據公司,如 Analytic Edge、Zinnov以及自稱是全球最大的專業性數據分析公司的 Mu Sigma[7]。這些數據公司重點開展大數據分析業務,為企業分析產品流向信息及客戶需求信息,從而使企業開發出客戶所需的產品和構建新的營銷戰略,促進企業的發展。我國數據分析行業經過10年的快速發展,目前已經形成遍布全國的專業數據分析機構。一些企事業單位開始接觸數據分析行業,了解了數據分析的價值,并加入到數據分析應用行列中來,通過數據分析使各種難題得到了解決。數據分析包括數據的采集、存儲、處理、分析、呈現及應用,每一個環節都涉及專業知識的應用,圖書館單獨進行數據分析,其成本非常高。圖書館可與國內外數據分析公司合作,開展用戶數據分析業務,既可減少數據分析方面的投入成本,又能把握用戶知識需求方向,實現雙贏。

3.3 知識咨詢服務形式的多樣化

一是提供準確的知識推送服務。知識推送服務是指圖書館根據擁有的需求,主動將其所需要的知識內容推送到用戶訪問網頁、電腦終端、移動設備等。在大數據環境下,因為有了準確的用戶需求信息和興趣愛好、興趣變化曲線、用戶需求預測信息,從而為圖書館的資源采集、資源更新提供依據,最終將用戶最需的知識利用最快捷的手段推送到用戶的使用終端上。如利用My Library進行推送,My Library是一種基于Web數據庫平臺的圖書館個性化信息服務系統。圖書館可建立學科知識庫,掛接在圖書館的網站上,用戶從圖書館網站上所提供的全部數字資源里,選擇自己需要的信息組織在My Library中,之后訪問My Library,用戶將獲取與此相關的具體內容。

二是細粒度個性化服務。目前,圖書館主要依靠讀者調查問卷、讀者基本信息、讀者的研究領域、讀者檢索集等方式來對個人定制服務策略,無法滿足讀者更細粒度的個性化需求。在大數據背景下,圖書館將利用大數據技術,參考目前盛行的大數據環境下的”猿題庫”模式,捕捉用戶的動態操作行為,自動監控用戶行為的變化情況進行分析,自動調用不同層次、類別的數據智能式推送給用戶。同時,咨詢館員可以將符合大數據特征的咨詢課題融入大數據系統,系統將根據咨詢主題,利用數據分析技術、可視化技術,瞬時以圖形展示查詢結果,從而縮短了咨詢館員獲取資源的時間,擴大了咨詢館員對資源的獲取面,最大限度的滿足用戶需求,提高了參考咨詢的效率。

4 大數據背景下圖書館知識咨詢服務需正確處理的幾個問題

4.1 成本問題

圖書館利用大數據開展知識咨詢服務,需要投入較大比例的資金。數據采集、數據分析、數據預測等需要強大的軟硬件的支撐。無論是公共圖書館還是高校圖書館,經費緊張問題始終存在。因此,在利用大數據時,需要綜合考慮技術成本,最好采取業務外包的方式,對重點用戶進行分析,提供知識咨詢服務。如利用云計算技術,為大數據提供彈性可擴展的基礎設施支撐環境以及數據服務的高效模式,以解決基礎設施投入不足的問題

4.2 隱私問題

因對用戶的各種信息進行分析,涉及用戶的一些隱私。如何有效保護用戶隱私權,已成為加強圖書館與用戶之間信任感和用戶群忠誠度的重要保障。圖書館如果利用大數據技術開展知識咨詢服務,泄露用戶大量的隱私信息,這不僅使用戶遠離了圖書館,而且還面臨侵犯隱私權而被起訴的困境。因此,圖書館在有效采集、整合、分析與挖掘用戶數據的同時,需加強用戶數據的安全管理與保密工作,加強數據的安全管理和監控,避免對用戶信息無限制的采集和使用。圖書館在用戶隱私數據采集和使用中,應保證用戶具有知情權和控制權,對圖書館存儲的用戶隱私數據擁有管理、利用、修改、分發和刪除的決定權。利用云計算技術保護用戶個人隱私,與具有較高安全保障能力和技術水平的云服務商簽署云服務協議,明確雙方在用戶隱私數據管理、使用過程中的權利、義務與責任。

4.3 人才問題

《中國大數據技術與服務市場2012-2016年預測與分析》[8]認為:“大數據專業人才,特別是數據分析專家這類復合型人才的稀缺將會影響該市場的發展。”在大數據時代,圖書館知識咨詢館員既要掌握信息檢索、信息分析、信息組織及相關平臺與工具使用等知識,還要掌握大數據環境下的數據挖掘、數據組織等大數據技術,但目前這方面的人才十分奇缺。IT行業與大型互聯網公司早已意識到了大數據人才緊缺的問題,都在積極建立專門的大數據科學團隊。圖書館可以采取與專業的數據處理公司合作,通過合作培養方式,建立圖書館大數據服務人才隊伍。另外,也可從國內外高校中引進大數據人才。清華大學于2014年秋季招收首批大數據碩士,并且還與山東省青島市合作成立“清華—青島數據科學研究院”,以開展大數據科學研究,培養具備大數據思維和創新能力的復合型人才,推出具備自主知識產權的大數據分析開源軟件和服務[9]。

[1]大數據[EB/OL].[2014-04-15].http://zh.wikipedia.org/wiki/%E5%A4%A7%E6%95%B8%E6%93%9A.

[2]鐘瑛,張恒山.大數據的緣起、沖擊及其應對[J].現代傳播(中國傳媒大學學報),2013(7):104-109.

[3]姜山,王剛.大數據對圖書館的啟示[J].圖書館工作與研究,2013(4):52-54.

[4]今年3月全球活躍網站數量達6.44億個[EB/OL].[2014-04-23].http://www.sootoo.com/content/252016.shtml.

[5]樊偉紅,李晨暉,張興旺,等.圖書館需要怎樣的“大數據”[J].圖書館雜志.2012(11):63-68.

[6]淺析數據分析行業未來發展趨勢[EB/OL].[2014-04-25].http://www.data-analyse.com/data-news/2014032963.html

[7]韓翠峰.大數據時代圖書館的服務創新與發展[J].圖書館,2013(1):121-122.

[8]IDC《中國大數據技術與服務市場2012-2016年預測與分析》發布 [EB/OL].[2014-04-25].http://www.5lian.cn/html/2012/xueshu_1129/35805.html.

[9]清華大學今秋招收首批大數據碩士 [EB/OL].[2014-04-28].http://news.xinhuanet.com/yzyd/local/20140427/c_1110 427377.htm.

猜你喜歡
圖書館用戶分析
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
電力系統及其自動化發展趨勢分析
飛躍圖書館
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
圖書館里的是是非非
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
主站蜘蛛池模板: 亚洲国产亚综合在线区| 乱人伦中文视频在线观看免费| 久久超级碰| 99国产在线视频| 国产香蕉在线| 国产精品一区二区不卡的视频| 91丨九色丨首页在线播放 | 亚洲aaa视频| 三级欧美在线| 福利片91| 国产欧美精品一区二区| 免费高清a毛片| 国产三级毛片| 欧美成人午夜在线全部免费| 欧美a在线| 日本人妻一区二区三区不卡影院| 黄色网在线| 亚洲成人手机在线| 亚洲一区无码在线| 欧美精品v欧洲精品| 国产尤物在线播放| 暴力调教一区二区三区| 日韩欧美中文字幕一本| 欧美啪啪精品| 日韩精品少妇无码受不了| 久热re国产手机在线观看| 秘书高跟黑色丝袜国产91在线| 成人午夜福利视频| 久久精品娱乐亚洲领先| 秋霞国产在线| 不卡视频国产| 成人午夜天| 72种姿势欧美久久久大黄蕉| 毛片免费视频| 一级毛片免费高清视频| 久青草网站| 欧美一级色视频| 亚洲欧美日韩久久精品| 在线亚洲天堂| 狠狠做深爱婷婷久久一区| 久久人午夜亚洲精品无码区| 丁香五月婷婷激情基地| yjizz国产在线视频网| 97在线免费| 欧美日韩一区二区三区在线视频| 亚洲无码四虎黄色网站| 九九久久精品免费观看| 青青青国产免费线在| 国产精品视频999| 欧美a网站| 亚洲国产综合自在线另类| 91九色国产porny| 3344在线观看无码| 国产精品999在线| 人妻少妇久久久久久97人妻| 日韩av无码DVD| 国产香蕉在线视频| 最新加勒比隔壁人妻| 亚洲一道AV无码午夜福利| 99视频在线免费| 国产精品网址你懂的| 欧美a级完整在线观看| 伦精品一区二区三区视频| 国产亚洲第一页| 欧美一区二区啪啪| 美女一区二区在线观看| 国产美女无遮挡免费视频| 最新国产你懂的在线网址| 欧美人与动牲交a欧美精品| 精品视频福利| 亚洲日韩AV无码一区二区三区人| 久久精品这里只有国产中文精品| 国产精鲁鲁网在线视频| 中文字幕在线观| 18禁黄无遮挡网站| 日韩无码视频播放| 亚洲无线国产观看| 久久综合亚洲鲁鲁九月天 | 天天综合网亚洲网站| 亚洲浓毛av| a毛片基地免费大全| 毛片三级在线观看|