999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺析用戶信息搜索行為大數據分析框架及其關鍵技術

2018-03-30 14:55:44袁露
神州·中旬刊 2018年3期

袁露

摘要:大數據分析技術有效規避了研究傳統用戶信息搜索行為的不足,為該課題的研究提供了新的理論視角與實踐工具。本文構建了大數據分析框架,用于對用戶信息搜索行為進行分析,然后介紹了大數據可視化等關鍵技術,以為大數據分析的應用提供理論依據。

關鍵詞:信息搜索行為;大數據分析;關鍵技術

引言

用戶在進行搜索和瀏覽時,會產生非常多的行為記錄,逐漸積累構成了大體量的數據?,F階段,針對用戶信息搜索行為進行研究的方法非常多,主要針對傳統網絡環境下的結構較為單一的數據,對大數據的應用能力非常弱,局限性也比較大。而應用大數據分析技術,可以快速處理海量數據,獲得足夠的用戶信息,并從中發掘出有規律的信息,將其展示出來。本文在此基礎上,針對用戶搜索行為構建了大數據分析框架,同時對其關鍵技術的應用進行介紹。

一、用戶信息搜索行為的大數據分析框架

(一)用戶信息搜索行為模型的構建

在已有文獻研究成果的基礎上,筆者對用戶搜索行為模型進行構建,將其分為前中后三個部分,分別與用戶層、人機交互層和評價利用層相對應[1]。用戶層分為信息用戶和用戶需求;人機交互層包含選擇信息源以及選擇檢索方式和瀏覽行為。而評價利用層包含用戶的物理行為以及心理行為。但是信息搜索是一個過程,并且該過程有可能是循環過程,用戶在信息評價時如果沒有得到令其滿意的結果,則會重新回到用戶層對其需求進行調整,然后在人機交互層對信息源和檢索方式等進行重新選擇,直到最終獲得滿意的結果。

(二)構建大數據分析體系

以往的學者在對這一問題進行研究時,所提出的構建大數據處理系統的流程,包括收集和預處理以及存儲分析、挖掘等。本文的研究在此基礎上,把大數據分析劃成數據收益與預處理以及數據存儲和分析、結果呈現等。大數據的收集可以來自于多種數據源,對于收集的大數據,要進行預處理后,才能進入下一環節,即進行存儲和處理。在此基礎上,對其進行分析更加容易發掘研究對象的內在規律,最后再將結果呈現出來,即從數據中提取有用的信息。

(三)構建用戶信息搜索行為的大數據分析框架

從橫向來看,該框架是以大數據處理流程為基礎,將其分為數據層和分析層以及結果呈現層與支撐層等。對于整個框架而言,數據層是基礎,分析層是核心,目標是結果呈現層,根本保證是支承層。數據層包括收集和預處理以及存儲數據等環節。收集的數據主要來源于互聯網和物聯網,預處理則包括數據的清洗和轉換以及數據加載等。數據存儲則是對大體量的數據采用分布式的方式進行存儲。分析層主要依據人工智能領域的多項技術,比如統計分析和數據挖掘等。結果呈現層就是將得到的結果呈現出來,支撐層是手機和預處理大體量數據的關鍵所在。

二、關鍵技術

(一)數據層的關鍵技術

首先是數據收集所應用的關鍵技術,主要包括數據收集、預處理以及數據存儲等。數據收集主要包括采集系統日志和網絡數據、物聯網技術以及智能移動終端。用戶的搜索行為所產生的數據均記錄在日志文件中,比如頁面訪問量和訪問時間以及搜索的關鍵詞與時間等[2]。日志文件能夠較好的記錄歷史數據,也不會受到防火墻的阻隔,而且日志文件所記錄的復雜信息在格式和內容方面都有一定的差異,需要采用專業的工具對其進行處理。在采集網絡數據時,可以采用API,這是目前應用比較廣泛的技術。物聯網技術主要包括RFID和紅外傳感以及全球定位等,關鍵在于傳感器技術,是物聯網技術獲取新的的關鍵。智能移動終端的普及率越來越高,比如智能手機和平板電腦等,這些設備隨時都在發送和接收信息。用戶在智能終端上進行信息搜索時,同樣會產生大量的數據。數據預處理的技術主要包括SSIS技術,不斷改進非結構化和半結構化的數據。數據存儲可以以云數據的模式進行,通過集群應用等,促使各類存儲設備協同工作,以更好的進行數據存儲與業務訪問等。

(二)分析層的關鍵技術

分析層的關鍵技術主要包括統計分析和機器學習以及自然語言處理與數據挖掘等。統計分析主要是利用統計學分析方法對數據進行一系列處理,分析人員可以采用定性和定量相結合的方法研究用戶信息搜索行為,運用到的分析工具包括SPSS和R語言以及SAS等。機器學習是要求計算機利用數據進行工作的方法,可以根據用戶的搜索數據等,識別用戶的搜索意圖,完成對用戶的策略學習[3]。自然語言處理主要應用的工具是OpenNLP和FundanNLP等,而數據挖掘常用的技術與統計分析基本一致。

(三)結果呈現層與支撐層的關鍵技術

結果呈現層所應用的技術主要是分析人員所應用的將數據進行可視化的技術,比如Tableau和Ember Charts等。而支撐層主要是為用戶信息搜索行為的研究提供數據處理平臺,核心在于分布式系統架構?,F階段該架構主要包括騰訊大數據平臺和阿里云的ODPS等。伴隨計算機技術的進步,該類技術也在不斷的更新,出現了很多新的技術,比如Spark、Storm等。

結語

當前時期,大數據技術的價值不斷凸顯,采用該技術對用戶信息搜索行為進行分析,可以更加有效的深度挖掘用戶的搜索需求,對于搜索引擎與信息組織方式的改進提供了方向,也給傳統信息服務模式帶來了較大的沖擊。在大數據背景下,構建分析用戶搜索信息行為的框架,需要注重各層關鍵技術的應用,確保分析框架的先進性和實用性。

參考文獻:

[1]易成岐,鮑媛媛,薛一波.社會網絡大數據分析框架及其關鍵技術[J].中興通訊技術,2014(1):5-10.

[2]袁紅,朱睿琪.用戶信息搜索行為大數據分析框架及其關鍵技術[J].圖書館學研究,2016(24):39-46.

[3]徐飛,徐緒堪,吳廣印.基于大數據的用戶閱讀行為分析[J].數字圖書館論壇,2014(12):56-62.

主站蜘蛛池模板: 国产精品国产三级国产专业不| 国产精品亚洲天堂| 国产高清在线观看| 91色爱欧美精品www| 欧美第九页| 18禁影院亚洲专区| 9啪在线视频| 亚洲永久精品ww47国产| 天堂va亚洲va欧美va国产| 在线精品视频成人网| 中国一级特黄视频| 91小视频在线| 精品人妻AV区| 国产一在线观看| 人妻丰满熟妇αv无码| Aⅴ无码专区在线观看| 青青青国产精品国产精品美女| 啪啪永久免费av| 国产精品浪潮Av| 日韩天堂视频| 欧美专区在线观看| 亚洲欧美精品一中文字幕| 美女无遮挡免费视频网站| 亚洲精品爱草草视频在线| 毛片免费高清免费| 97国产成人无码精品久久久| 国产女人喷水视频| 国产一级毛片在线| 中文字幕乱妇无码AV在线| 91麻豆国产精品91久久久| 欧美中文字幕在线二区| 永久免费AⅤ无码网站在线观看| 超清人妻系列无码专区| 日韩精品一区二区深田咏美| 免费全部高H视频无码无遮掩| 台湾AV国片精品女同性| 五月六月伊人狠狠丁香网| 欧美一级在线播放| 亚洲精品大秀视频| 国产精品网址你懂的| 又猛又黄又爽无遮挡的视频网站| 亚洲精品卡2卡3卡4卡5卡区| 国产精品国产三级国产专业不 | 激情网址在线观看| 国产偷倩视频| 这里只有精品国产| 18禁影院亚洲专区| 在线欧美一区| 欧美激情网址| 天天综合色天天综合网| 亚洲精品国产精品乱码不卞| 丁香五月婷婷激情基地| 好吊色妇女免费视频免费| 亚洲成aⅴ人在线观看| 99在线视频网站| 国产特一级毛片| 色综合热无码热国产| 无码在线激情片| 四虎亚洲国产成人久久精品| 国产女人18毛片水真多1| 国产18在线| 久久综合亚洲色一区二区三区| 国产00高中生在线播放| 91免费片| 国产情精品嫩草影院88av| 婷婷亚洲综合五月天在线| 熟妇丰满人妻av无码区| 亚洲精品第一页不卡| 国产91色在线| 伊人久久久久久久久久| 无码AV动漫| 亚洲成肉网| 久久婷婷六月| 视频二区国产精品职场同事| 欧美精品成人| 97国产精品视频自在拍| 伊在人亞洲香蕉精品區| 蜜芽一区二区国产精品| 香蕉国产精品视频| 人妻无码一区二区视频| 99久久精品免费看国产电影| 91视频区|