999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數(shù)據(jù)挖掘技術在數(shù)字圖書館服務中的應用

2019-03-22 02:17:22許楠
卷宗 2019年9期
關鍵詞:大數(shù)據(jù)

摘 要:大數(shù)據(jù)挖掘技術作為一項新興的信息處理技術,給圖書館信息化建設帶來了深遠的影響。本文首先分析了數(shù)字圖書館的發(fā)展現(xiàn)狀和現(xiàn)存服務系統(tǒng)中的問題等,隨后介紹了典型數(shù)據(jù)挖掘技術和方法,并且探討了大數(shù)據(jù)挖掘技術在數(shù)字圖書館服務中的應用。

關鍵詞:大數(shù)據(jù);挖掘技術;數(shù)字圖書館

隨著科技的發(fā)展,我們已經(jīng)逐漸開始了大數(shù)據(jù)時代,在這個社會當中,數(shù)據(jù)挖掘技術的誕生,讓人們的生活更加便利。同時數(shù)據(jù)挖掘技術也是在新時期社會發(fā)展需求下誕生出來的一種分析類技術,這種技術能夠針對擁有不同特點的用戶需求,提供個性化的服務,并且逐漸在社會各個領域中普及開來,文章就此介紹了數(shù)據(jù)挖掘技術在數(shù)字圖書館中的有效應用。

1 數(shù)字圖書館發(fā)展現(xiàn)狀

1.1 數(shù)字圖書館發(fā)展特征

數(shù)字圖書館一直是圖書館領域中的重點研究對象。從廣義角度來講,以網(wǎng)絡為基礎,同時能夠滿足人們信息需求的就可以叫做數(shù)字圖書館。從較為嚴格的定義角度來分析,數(shù)字圖書館就是收藏各種數(shù)字信息,能夠支持用戶進行采集、檢索、定位信息等服務的信息技術,突出了數(shù)字圖書館中的技術、服務與收藏等三種要素[1]。服務是數(shù)字圖書館的發(fā)展基礎,目前圖書館中信息服務模式屬于一種分布分散形式的傳播模式,并逐漸向用戶中心的集中式服務模式發(fā)展,數(shù)字圖書館在未來發(fā)展過程中也應該將重點放在智能應用、空間聚合、集成服務等領域中下功夫。

1.2 服務系統(tǒng)中的現(xiàn)存問題

從現(xiàn)有的服務模式實際發(fā)展狀況來看,個性化服務系統(tǒng)目前存在以下幾方面的問題,首先是信息組織的問題,比如MyLibrary主要是以現(xiàn)有動態(tài)網(wǎng)頁技術和數(shù)據(jù)庫技術為基礎,但是沒有對圖書館信息組織方式進行徹底的改變。其次是沒有充分了解用戶的實際需求,用戶只能被動挑選自己想要的信息資源。圖書館所提供的服務基本也是以現(xiàn)有資源為基礎,而不是從用戶需求角度入手提供各種服務。最后是沒有對用戶的消費行為進行精準分析,在現(xiàn)有的服務系統(tǒng)當中,只能根據(jù)用戶所記錄的個人資料提供相應的服務,但是卻沒有主動跟蹤和獲取用戶實際需求,更不用說對用戶信息進行整理加工,并在數(shù)據(jù)挖掘技術的基礎上找到各種規(guī)律性事物,為數(shù)字圖書館的建設發(fā)展提供可靠的參考依據(jù)。

2 大數(shù)據(jù)挖掘技術在數(shù)字圖書館中的有效應用

2.1 分類模型

分類模型是監(jiān)督式學習模型,即分類需要使用一些已知類別的樣本集去學習一個模式,用學習得到的模型來將不同種類的數(shù)據(jù)信息進行分類。數(shù)字圖書館可以分析、利用用戶特點,對用戶進行科學的分類研究,了解用戶的屬性和特征,掌握用戶對于圖書館所提供服務的滿意程度。比如數(shù)字圖書館可以根據(jù)用戶的不同需求,為其提供個性化服務,通過神經(jīng)網(wǎng)絡、規(guī)則總結、決策樹等多種常見的分類方法對用戶特征進行分析,從而了解怎樣的用戶擁有怎樣的服務需求,了解擁有哪一種共性特征的用戶會制定某一服務,而在所有的圖書館用戶中,這一群體的所占比例為多少。最終通過分類模型所得出的結論為圖書館提供服務推送,提供可靠的參考依據(jù),挖掘潛在用戶群體,同時還可以結合用戶的職業(yè)背景和學歷特征等因素,制定合理的服務措施。比如某些群體的用戶擁有良好的經(jīng)濟收入,同時對在線數(shù)據(jù)庫擁有較強的興趣,對于知識的需求程度較高,那么就可以將其劃分到固定服務對象一類當中,可以對其提供一定的優(yōu)惠政策,促進其購買和使用在線數(shù)據(jù)庫,并將數(shù)據(jù)庫中不斷更新的信息技術傳送給用戶,針對這一群體實施問卷調(diào)查,為后期的服務改進做好基礎準備。

2.2 關聯(lián)模型

關聯(lián)模型主要是用來分析數(shù)據(jù)庫中各種數(shù)據(jù)信息之間關系的一種規(guī)則,也就是說在某一事物當中,隨著某一項的出現(xiàn),能夠引發(fā)出其它項出現(xiàn)在同一事物當中,就是深埋在各種事物當中的隱藏關聯(lián)[2]。比如我們可以在關聯(lián)規(guī)則的基礎上發(fā)現(xiàn)以下現(xiàn)象,假如某位用戶制定了圖書館中的某項服務,那么隨之而來的也會定制其它的服務,或是和某種網(wǎng)絡資源進行鏈接的用戶,也會存在極大的可能與另一網(wǎng)絡資源進行鏈接,那么數(shù)字圖書館就可以將兩種資源或是服務結合到一起提供給用戶,并挖掘具體原因,制定有效的服務措施。

2.3 序列模型

序列模型在一定程度上,十分接近關聯(lián)模型,兩者主要的不同是序列模型的服務對象是根據(jù)時域進行劃分的,即序列模型發(fā)現(xiàn)的規(guī)律按照事件發(fā)生順序進行分布。例如在以B/S模式為基礎的個性化服務當中,可以通過Cookies來記錄圖書館用戶曾經(jīng)訪問過的各種資源信息,最終可能會發(fā)現(xiàn),假如用戶閱讀A鏈接,那么就會存在百分之四十八的幾率會在三十分鐘內(nèi)訪問B鏈接,這也是序列模型中所發(fā)現(xiàn)的規(guī)則,假如獲得了這樣的結論,用戶在訪問A鏈接后,那么進入B鏈接就有百分之四十八的可能,這也是關聯(lián)規(guī)則[3]。

2.4 聚類模型

聚類分析是數(shù)據(jù)挖掘的重要研究內(nèi)容與熱點問題,它是按照某種相似性度量方法(標準)對一個數(shù)據(jù)集合進行劃分成多個類簇,使得同一個類簇之間的相似性盡可能高,不同類簇之間不相似或者相似性低。與分類模型有所不同,聚類模型屬于無監(jiān)督學習,事先并不需要知道每個對象所屬的類別,既不了解相應的分類標準,同時也不了解會有哪些類出現(xiàn),根據(jù)所給的聚類參數(shù),如相似度對數(shù)據(jù)實施分解、合并。最終讓領域?qū)<遗袛嗨媒Y果,假如無法滿足預期目標,就需要進行改良,重新聚類。一旦滿足目標需求,分類規(guī)則也可以利用聚類參數(shù)獲得。在這一過程中,可以針對某一群體用戶實施聚類,并挖掘其中的最為相似的群體,實施有效的服務策略,選擇合理的服務方式,結合用戶的體驗反饋,準確判斷聚類成果,了解用戶的滿意度。

2.5 時間序列模型

時間序列模型可以在現(xiàn)有數(shù)據(jù)信息基礎上,對未來進行準確預測,從這一角度出發(fā)我們能夠發(fā)現(xiàn),時間序列模型和回歸模型十分接近。回歸模型主要是通過歷史數(shù)據(jù)對未來發(fā)展趨勢進行預測,最簡單情況下,應用標準統(tǒng)計方法即可,例如線性回歸方法。但多數(shù)情況是非線性問題,比如數(shù)據(jù)庫中的流量升降、網(wǎng)頁訪問數(shù)量變化等,在多種因素影響下,問題也變得更加復雜。在回歸模型中,并不十分看重時間發(fā)生順序,但是在時間序列模型中卻十分看重時間特性,其中最為關鍵的就是時間周期層次,例如年、月、周、日等,除此之外,有時還需要結合日歷問題進行分析,比如節(jié)假日等方面的影響。例如在線書庫中的訪問數(shù)量,隨著時間的變化會產(chǎn)生相應的周期變化,為此數(shù)據(jù)圖書館可以根據(jù)周期變化挖掘具體發(fā)展規(guī)律,同時還可以發(fā)現(xiàn)周期變化的具體原因,比如遇到的假期或是學期發(fā)生了一定的變化,為此需要進一步調(diào)整工作計劃。其中需要注意的問題是,挖掘時間序列數(shù)據(jù)和時間數(shù)據(jù)模型分屬于兩種不同概念。在挖掘時間序列數(shù)據(jù)信息的過程中可以綜合利用各種方法或者模型。

3 結語

綜上所述,在信息技術飛速發(fā)展的時代,數(shù)字圖書館具有較為廣闊的發(fā)展前景。從長遠發(fā)展角度來看,數(shù)字圖書館想要實現(xiàn)可持續(xù)發(fā)展的目標,就需要有效利用先進的科學技術,分析掌握不同用戶的真正需求,為用戶提供精準的個性化服務。而大數(shù)據(jù)挖掘技術能夠在海量信息資源中迅速挖掘出最為有用的信息,并且不需要專家知識檢驗所得到的結論,是推進圖書館信息化進程的強有力手段,也是未來數(shù)字圖書館創(chuàng)新的重要領域。

參考文獻

[1]馬桂英,李會民.大數(shù)據(jù)技術在應用型本科高校數(shù)字圖書館建設中的作用[J].北華航天工業(yè)學院學報,2017,27(04):55-57+60.

[2]柳益君,熊太純.大數(shù)據(jù)挖掘在高校圖書館個性化服務中應用研究[J].圖書館工作與研究,2017(05):23-29.

[3]趙志遠,孫劍華.數(shù)據(jù)挖掘技術在高校數(shù)字圖書館個性化服務中的應用[J].無線互聯(lián)科技,2018,15(12):141-142.

作者簡介

許楠(1984-),女,漢族,研究生學歷,講師,研究方向:智能信息處理、圖像處理。

猜你喜歡
大數(shù)據(jù)
基于在線教育的大數(shù)據(jù)研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數(shù)據(jù)的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數(shù)據(jù)時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數(shù)據(jù)在出版業(yè)的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯(lián)網(wǎng)+”對傳統(tǒng)圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 麻豆精品在线播放| 欧美啪啪网| 亚洲精品国产日韩无码AV永久免费网 | 久996视频精品免费观看| 亚洲国产欧美国产综合久久 | 免费又黄又爽又猛大片午夜| 久草性视频| 亚洲成人黄色在线| 97成人在线视频| 国产肉感大码AV无码| av在线手机播放| 欧美黄网站免费观看| 二级特黄绝大片免费视频大片| 青青草原国产精品啪啪视频| 国产日本欧美亚洲精品视| 亚洲欧洲综合| 尤物精品视频一区二区三区| 日韩欧美网址| 久久国产精品影院| 国产精品免费久久久久影院无码| 免费va国产在线观看| 999福利激情视频| 国产真实乱子伦视频播放| 91亚洲视频下载| 国产欧美精品一区二区| 伊人久久婷婷五月综合97色| 日韩精品久久久久久久电影蜜臀| 青青草综合网| 国产经典免费播放视频| v天堂中文在线| 久热中文字幕在线观看| 日韩福利在线视频| 人人91人人澡人人妻人人爽| 亚洲精品人成网线在线| a级免费视频| 亚洲成人高清在线观看| 久久人搡人人玩人妻精品一| vvvv98国产成人综合青青| 国产国产人成免费视频77777| 在线精品欧美日韩| 国产精品久线在线观看| 国产欧美日韩专区发布| 亚洲欧美人成人让影院| 国产欧美视频一区二区三区| 91成人免费观看| 欧洲av毛片| 国产精品网拍在线| 午夜啪啪网| 久久久亚洲国产美女国产盗摄| 亚洲国产精品一区二区第一页免 | 91小视频在线播放| 69国产精品视频免费| 久久久久亚洲精品成人网| 亚欧美国产综合| 激情六月丁香婷婷四房播| 女人一级毛片| 久精品色妇丰满人妻| 一本视频精品中文字幕| 91探花国产综合在线精品| 亚洲成肉网| 亚洲首页在线观看| 99精品影院| 91小视频版在线观看www| 在线a网站| 欧日韩在线不卡视频| 老色鬼久久亚洲AV综合| 国产爽爽视频| 国产精品人人做人人爽人人添| 伊人91在线| 精品视频福利| 久久久久九九精品影院| 全部免费毛片免费播放 | 亚洲国产理论片在线播放| 国产精品毛片一区| 丝袜无码一区二区三区| 久久精品人人做人人爽电影蜜月| 午夜免费视频网站| 亚洲日韩Av中文字幕无码| 日本黄网在线观看| 亚洲国产综合第一精品小说| 国产国产人成免费视频77777| 国产精品v欧美|