朱稅顯
摘 要 大數據技術在信息搜集、整理、分析和提煉中發揮著重要作用。高校圖書館應用大數據技術有著重要的作用,大數據技術有利于實現圖書館資源的“大”,大數據技術有利于實現圖書管管理的“快”,大數據技術有利于實現圖書館服務的“精”。高校圖書館提升服務水平所需要的大數據技術主要有文獻管理系統、傳感器技術、RFID 技術和移動終端技術。高校應用大數據技術存在諸多困境,如大數據管理人才缺乏,圖書館數據采集對象模糊,高校圖書館用戶隱私保護存在問題。
關鍵詞 高校圖書館 大數據技術 必要性 困境
中圖分類號:G255.2 文獻標識碼:A DOI:10.16400/j.cnki.kjdks.2017.03.012
1 高校圖書館應用大數據技術的必要性
大數據技術的應用使得高校圖書館在圖書資源的搜集、整理、分類、貯藏、使用等方面等到了優化和改進,使得圖書管服務從傳統的館藏、借閱等服務拓展到了個性化服務、學科知識服務等領域,提升了圖書館的服務水平和服務層次。
(1)大數據技術有利于實現圖書館資源的“大”。大數據技術結合了云計算分布式處理、分布式數據庫、虛擬化技術、云存儲技術等,實現了圖書存儲的海量化發展。大數據技術引入圖書館使得結構化數據(能夠用統一結構加以表示的數據,如符號、數字、文字等)、非結構化數據(不能用統一結構表示的數據,如所有格式的辦公文檔、各類報表、圖片、錄像、音頻、網頁等)、半結構化數據(完全無結構數據與完全結構化數據之間的數據,如HTML文檔)等各類數據都能夠存儲于云服務器中,創新了傳統的數據采集和處理模式。高校圖書館對大數據技術的應用有效地實現了空間上和時間上的突破,使過去的圖書管理模式發生了質的提升,促進了圖書管理的便捷化、科學化和高效化,有利于實現圖書館服務向以用戶為中心的轉變。
(2)大數據技術有利于實現圖書管管理的“快”。傳統圖書館信息傳遞的介質主要是紙質書籍,圖書館管理也主要表現為對紙質圖書及相關服務的管理。在過去,圖書館員基本是通過手工的形式對圖書進行搜集、分類、整理、館藏、檢索、匯編、借閱、使用等,即便計算機技術引用圖書館管理后,對傳統圖書的搜集、分類、整理、館藏、檢索、匯編、借閱、使用等也沒有從根本上超越手工處理階段,因為對圖書資源的搜集、分類、整理、館藏、檢索、匯編、借閱、使用等各個環節是彼此脫節的,無法實現圖書館服務管理的“快”。大數據技術引用圖書館使得個性化服務成為可能,極大地提高了圖書館管理效率。高校圖書館可以利大數據技術對圖書的搜集、分類、整理、館藏、檢索、匯編、借閱、使用等環節進行資源整合,大大提升了高校圖書館管理效率。
(3)大數據技術有利于實現圖書館服務的“精”。傳統圖書館服務時代,服務的內容聚焦于圖書借閱服務、圖書館藏服務以及與之相關的其他服務上,缺乏以用戶為核心的個性化服務,尤其缺乏對用戶在與圖書館發生關系過程中產生的各種數據的搜集、整理和分析,因此無法掌握廣大師生的使用偏好,進而為他們提供個性化服務,使得服務粗糙而不精。這與當時的計算機技術密切相關,在傳統的圖書館服務時代,計算機還只能充當協助存儲、協助管理角色,還不能對廣大師生在與圖書館發生關系過程中產生的巨量數據進行搜集、整理、分析和提煉,并把這些有價值的數據運用于對用戶的使用偏好、研究偏好等的預測上,因而無法及時有效地為他們提供個性化、針對性服務。而大數據技術的發展和在圖書館領域的應用,實現了圖書管理的智能化,圖書館管理由此而進入了“第四范式”。大數據技術發揮它的信息搜集、加工處理、預測分析優勢,能夠形成用戶個性分析庫,為他們提供定制式服務。
2 提升高校圖書館服務水平所需的主要大數據技術
2.1 文獻管理系統
作為大數據技術重要支撐的圖書館文獻管理系統,記錄了高校師生在搜索資源、借還書籍等過程中產生的一切數據,這些數據可以表現出他們的閱讀興趣和閱讀習慣,也可以反映出他們的研究領域和研究方向。這方面的數據能夠為大數據技術提供重要的數據來源。通過大數據技術可以提升圖書館已有數據的價值。隨著互“聯網+”時代的到來,用戶能夠接觸到的信息量越來越大、渠道越來越多、方式越來越廣,對圖書館館藏圖書的需求有所減少。歸根到底是高校圖書館沒有充分關照師生用戶的實際需求要。因此,利用大數據技術深入地挖掘、分析、整理和提煉圖書館文獻管理系統中用戶留下的各種數據,采用可視化技術,洞察和分析讀者的閱讀行為和習慣,了解他們的研究領域、閱讀偏好,進而有針對性地、主動地為他們提供教學、科研和學習所需要的知識服務是非常必要的。在“互聯網+”時代,尤其是在大數據時代,用戶所需要的不是資源線索,而是與自己的教學、科研及學習相關的知識,高校圖書館要建設在復雜學科背景下的知識集成、知識整理、知識匯編、知識創造、知識發現等知識服務,運用大數據技術,充分利用文獻館藏系統跟蹤用戶教學、科研和學習需要,挖掘知識主體、知識客體等之間的相互關系,為知識服務的實現提供前提條件。
2.2 傳感器技術
傳感器是能夠感應規定的被測對象,且能夠有規律地把所測數據轉換成可用信號的裝置。傳感器技術作為數據獲取的重要方式,與計算機技術、通信技術一道構成了信息技術的三大支柱。隨著傳感器技術的不斷發展,其應用領域越來越廣泛,覆蓋了環境保護領域、交通運輸領域、文化教育領域、醫療衛生領域等。傳感器能夠將人類生活、學習、工作等各個方面的信息,按照一定的規律,轉化成為可用的信號。部分智能傳感器還能夠識別被測對象產生的價值數據,并進行信號轉化,為大數據的獲取提供了重要支持,避免了大量數據同時被轉化,造成數據堵塞和數據處理困難的問題。傳感器技術的發展和應用為大數據技術的發展和應用提供了數據支撐。目前,高校圖書館應用傳感器的方式多種多樣,如使用紅外傳感器,以解決高校圖書館普遍存在的“占位”問題。因此,利用傳感器技術,搜集圖書館內的各種數據,并利用大數據技術處理這些數據,對于研究用戶的閱讀行為習慣、閱讀偏好,進而有針對性地調整服務策略,具有重要的實踐價值。
2.3 RFID 技術
RFID(Radio Frequency Identification)技術,即射頻識別技術,是對傳統條形碼技術的發展和創新。RFID技術與傳統條形碼技術相比,操作距離得到擴展,標簽的使用更便捷,只需要一個可移動閱讀器,就可以對標簽信息進行識別和閱讀。除此之外,RFID技術還有許多優勢,比如,操作范圍廣、性能穩定、存儲能力強,這些優勢使它越來越成為物聯網時代的重要信息獲取技術。這種技術在未來的圖書館發展中,必然會得到廣泛運用。高校圖書館應用RFID技術能夠實現對圖書等資源及相關服務的實時跟蹤、即時分析,獲取和把握知識資源及相關服務的情況。如此,就可以及時分析和了解高校圖書館為師生提供的知識服務效果,并根據效果情況不斷調整服務策略,最大程度滿足用戶的秩序需要。由此可見,RFID技術將成為大數據時代圖書館數據處理和分析的重要工具。
2.4 移動終端技術
我們正處于互聯網時代,互聯網時代使移動終端得以普及,手機、平板電腦等等已經成了人們生活、工作和學習不可缺少的工具,也成為人們各種數據產生的重要來源。手機、平板電腦等移動終端本身具有較強的信息處理能力,比如二維碼掃描、GPS定位等。高校圖書館已經基本普及了移動圖書館、微信圖書館、二維碼技術等服務,這與移動終端的普及是分不開的,離開了移動終端,這些服務就無法實現。圖書館用戶在通過移動終端享受圖書館服務過程中,會產生各種各樣的數據,這些數據直接為大數據技術提供了支撐。大數據技術能夠實現對移動終端上產生的數據的處理和分析。一般來說,高校圖書館通過用戶的移動終端采集信息的來源主要有三種:第一,用戶在移動終端上查閱、瀏覽書籍產生的數據;第二,用戶使用的移動終端內置的傳感器采集到的數據;第三,用戶在互聯網上發生的網絡行為產生的數據,如網絡評論、轉發的微博等數據。移動終端技術能夠促進大數據技術在圖書館中的運用和普及。通過大數據技術,搜集用戶在使用移動終端過程中產生的各種數據,了解他們的閱讀偏好和閱讀習慣,掌握他們的知識需求,對于提升圖書館的知識服務水平有著重要意義。
3 高校圖書館應用大數據技術面臨的問題
3.1 大數據管理人才缺乏
大數據文件系統主要有Hadoop的分布式文件系統(HDFS)、谷歌的可擴展分布式文件系統(GFS)、集群文件系統公司開發的平行分布式文件系統(Lustre),Facebook開發的Haystack文件系統等等。大數據時代,高校圖書館需要對用戶與圖書館發生關系過程中產生的海量數據進行管理,但是,圖書館數據管理人員缺乏,對大數據文件系統有所了解的人更少,由此而制約了高校圖書館從傳統服務向知識服務的轉型。高校圖書館數據管理人才必須對圖書館學、統計學、數學、大數據技術等都有所了解,并能夠融會貫通,是非常難得的復合型人才。目前,對這類人才的培養還存在諸多問題,因此,這類人才較為缺乏。為了解決這個問題,高校圖書館一般都是通過委培等方式,與有關的培訓機構簽訂培訓協議,把有志于從事大數據管理的圖書館員選拔出來,派出進修,較為系統地學習大數據技術等大數據管理所需要的知識,在學有所成后回到原單位從事大數據管理方面的工作。可見,高校圖書館應用大數據技術面臨的一大困境就是人才問題。
3.2 圖書館數據采集對象模糊
大數據技術對高校圖書館來說是一項全新的技術,高校圖書館員很少有人真正了解這門技術。高校圖書館通過對大數據管理人才培養、引進中,雖然逐漸擁有了一批大數據管理人才,但是仍然存在一些問題,比如數據采集對象的問題。在應用大數據技術采集數據資源時圖書館員首先面臨的問題是采集什么數據,通過什么方式采集這些數據,通過這些數據是否可以了解用戶的閱讀習慣和閱讀偏好,這些數據是否對圖書館知識服務有用,等等。這些問題都是圖書館員在應用大數據技術時必須要深入考慮的。此外,對于大數據的采集與分析,圖書館員還要考慮數據采集和分析的經濟性,即采集數據的成本和效益。對于時效性強、存在周期短、數據量大(下轉第66頁)(上接第25頁)的數據,必須有要相應的采集標準。同時,高校圖書館引入大數據技術必須以提升用戶的滿意度為目的,對于高校而言主要是以為用戶提供高效率、有價值的知識服務為目的。比如,美國的Hiptype公司就通過大數據技術分析電子書閱讀用戶的喜好,并提供了更加貼近讀者的人性化服務。
3.3 高校圖書館用戶隱私保護存在問題
大數據時代是彰顯數據價值的時代,但是價值主體不同,會使數據的使用方式不同。價值主體如果是合法主體,那么大數據就能造福于人。價值主體如果是不法分子,那么數據及其反映的個人、法人等的隱私就面臨泄露的危險,甚至會因此而給個人、法人等帶來嚴重的損失。此外,大數據技術的數據采集對象是兼具海量化和復雜性,通過大數據技術,要從這些數據之中獲取有用的信息,是比較容易的。不法分子可以跟蹤用戶信息,分析用戶產生的各種數據,破譯他們的各種密碼,使其隱私泄露,人身和財產安全受到威脅。而且,大數據的搜集、分析等工作,很多高校都外包給第三方機構,第三方機構可能因為各方面的原因泄露高校圖書館用戶數據,如:自身系統的安全系數不高,數據庫被攻破,信息外泄;內部人員受利益驅使,而盜取數據,造成數據外泄,等等。另外,高校圖書館本身也存在泄露用戶隱私的問題。我們知道,高校圖書館引入大數據技術是為了更好地為用戶服務,提升用戶的滿意度,并促進高校科研、教學等的不斷發展,但是部分高校圖書館為了最大化地提升服務效益、提高自身的競爭力,可能會泄露部分用戶的個人隱私。可見,大數據時代,高校圖書館應該從技術、制度等層面加強對用戶隱私的保護。
參考文獻
[1] 曾瑛.Web挖掘工具與數字圖書館信息服務[J].中國科技信息,2005(7):38-39.
[2] 梁澤本.數據挖掘技術在數字圖書館個性化服務中的應用[J].科技情報開發與經濟,2005(18):96-97.
[3] 李志明,胡樹森.數據挖掘及其在現代化圖書館中的應用[J].圖書館學研究,2006(6):39-41.
[4] 楊小云.數據挖掘在圖書館中的應用[J].渭南師范學院學報,2005(2):129.
[5] 來紅梅.數據時代圖書館信息服務面臨的挑戰與對策[J].圖書館學刊,2014(3):30-31.
[6] 楊海燕.數據時代的圖書館服務淺析[J].圖書與情報,2012(8):15-17.
[7] 陳臣.于大數據的圖書館個性化服務安全體系構建研究[J].新世紀圖書館,2014(11):20-21.
[8] 韓煒.數據時代公共圖書館消除數據不平等的路徑選擇[J].圖書館論壇,2014(3):10-11.