999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Hue 的自動化數據分析系統設計與實現

2021-03-24 08:22:02王帥萬小霞
現代計算機 2021年3期
關鍵詞:用戶系統

王帥,萬小霞

(鹽城師范學院信息工程學院,鹽城224002)

0 引言

淘寶、京東以及世界各地的大型商場和連鎖門店,每日都有大量的交易清單產生,一個購物狂歡節就有過億交易金額要處理。快遞、物流每天也有各種數據產生如國內外物流清單、發貨退貨記錄等,醫院、診所也有藥物清單、病人資料、就診記錄等,就連日常聊天一段時間下來也是篇幅巨大。騰訊的數據中心內有大量的會話信息,基于這些數據進行新型應用開發。總之,這些數據不可避免地成為了一個新平臺,大數據時代要求我們在以數據為中心的平臺上進行分析并去開發新型數據管理系統和相應的應用系統[1]。

1 系統分析

大數據分析平臺由商城系統和數據可視化系統組成。具體來說,商城系統有離線日志發送、實時數據轉發兩大功能;數據可視化系統具有用戶總人數及活躍度統計、熱銷商品分析、廣告實時點擊量以及地域分布統計等功能。

1.1 商城系統

(1)離線日志發送

將商城的離線數據發送給Flume 日志系統并在本地備份

(2)實時數據發送

將商城的實時數據發送給Kafka 消息管理中心。

1.2 數據可視化系統

(1)用戶統計

表格展示商城用戶總人數、新增用戶人數、昨日活躍度、昨日活躍率。

(2)標簽點擊量TOP5

環狀圖展示點擊數量最多的前5 個分類。

(3)商品點擊量TOP5

半環狀圖展示點擊數量最多的前5 個商品。

(4)熱銷商品TOP5

環狀圖展示購買數量最多的前5 個商品。

(5)收藏商品TOP5

柱狀圖展示加入購物車數量最多的前5 個商品。

(6)廣告實時點擊量

折線圖展示當天各時段的廣告點擊量

(7)銷售區域分布

中國地圖展示各區域銷售情況

1.3 Hadoop服務器

(1)離線日志分析

Flume 日志系統接收離線日志,使用Hive 數據倉庫存儲數據,Spark SQL 處理離線數據

(2)實時數據轉發

2 系統設計

2.1 商城系統設計

商城系統重點是整合獲取離線和實時數據兩部分功能,具體實施應與對應上線系統對接,本次使用的商城系統為簡易設計的模擬系統,目的是保證大數據分析平臺的數據來源真實可靠。

本系統主要配置兩大模塊,離線日志發送,實時數據發送。

(1)離線日志發送模塊

首先商城中的離線數據發送至Linux 服務器中的Flume 日志系統,及那根離線數據日志存在服務器上,而后將日志上傳至HDFS 分布式文件管理系統并按格式導入Hive 數據倉庫,再運行編寫好的Spark SQL 和Spark ALS 的JAR 包,將Hive 數據倉庫中的數據提取分析并將結果寫入MySQL 數據庫中。

離線日志發送模塊的流程如圖1 所示。

圖1 離線日志發送模塊流程圖

(2)實時數據發送模塊:

實時數據則由商城系統直接發送給Kafka 消息中心,將Kafka 消息中心作為中轉站,把實時數據轉發給已經啟動好的Spark Streaming 服務,Spark Streaming 就會按照時間滑窗將數據按小時分組存入MySQL 數據庫中。

2.2 數據庫設計

本系統將設計1 個MySQL 數據庫。數據庫名為shop,數據庫中包含的數據庫表有:

addCar 表:存儲加入購物車匯總信息;

buyGoods 表:存儲購買商品匯總信息;

clickAd 表:記存儲廣告實時點擊匯總信息;

clickGood 表:存儲瀏覽商品匯總信息;

clickTab 表:存儲瀏覽分類匯總信息;

hotGoods 表:存儲銷售區域分布匯總信息;

userStatistics 表:存儲各用戶統計信息;

recommend 表:存儲所有用戶的推薦商品信息。

其中最主要的是推薦表,是推薦算法的直觀展示,表1 給出商品推薦表的詳細設計。

表1 商品推薦表

3 系統實現

3.1 離線數據處理模塊

離線數據處理分為3 步:商城發送日志,過濾日志,導入數據倉并分析。

(1)商城發送日志

商城整合日志組件,配置Logback 配置文件。

以上代碼為Logback 詳細配置,一共兩塊日志采集的功能。fileAppender 的功能為本地備份,日志信息記錄為log 格式的文件,每5MB 生成以一個記錄文件,以時間格式命名。Flume 的功能為發送日志的功能,與Flume 建立連接后,追條發送日志給Flume。每當使用INFO 級別的日志功能就會觸發這兩個功能,將日志本地備份并且發送給Flume 日志系統,如圖2 所示。

圖2 后端日志圖

(2)過濾日志

配置Flume 啟動配置文件,編寫Shell 腳本。

以上代碼為Flume 詳細配置,通過此配置啟動Flume 日志系統,每當接收到日志數據時,按照攔截格式保留需求數據,存于本地shop 目錄下的logs 文件夾內。

以上代碼為Shell 腳本中的部分功能,目的是將logs 文件夾中的昨日數據,剪切到臨時文件夾logsmv,通過HDFS 命令將歷史文件夾中的日志上傳到HDFS文件管理系統,最后清空臨時文件夾。使用臨時文件夾logsmv 的目的是因為在命令執行期間可能會有新的日志進來,清空數據的時候會產生誤刪的情況。

(3)導入數據倉并分析

啟動Hive 和Spark 服務,執行Spark SQL 的JAR 包。

以上代碼為Spark SQL 詳細功能,使用Scala 語言開發。先將HDFS 文件系統中的日志導入Hive 數據倉庫中內,再將日志數據分類分析,最后將結果存入MySQL 數據庫,便于查詢。

3.2 實時數據處理模塊

實時數據處理分為3 步:商城發送消息、消息中轉、實時分析數據。

(1)商城發送消息

為商城整合消息組件,與Kafka 建立會話。

以上代碼為商城將廣告點擊的消息發送給Kafka的實現代碼,通過配置的參數將消息發送到指定IP 和端口的Kafka。

(2)消息中轉

將Kafka 作為消息中轉站。

以上代碼為啟動Kafka 服務并開啟shop 會話。

(3)實時分析數據

數據可視化模塊獲取消息,分析實時數據。

以上代碼為Spark Streaming 獲取Kafka 的消息,而后將計算每個小時的各個廣告點擊量并存入MySQL。

3.3 數據可視化模塊

本功能模塊為前后端分離項目,前臺使用VUE 框架,后臺使用Spring Boot 搭建的SSM 框架,界面效果如圖3 所示。

圖3 數據可視化界面

3.4 商品推薦模塊

本功能模塊為離線分析拓展模塊,通過算法實現數據分析進階功能,即針對每一位用戶,為其推薦滿足其喜好的商品,讓平臺具有智能化。

(1)ALS 推薦算法

本模塊使用的技術是Spark MLlib,基于Spark ML?lib 實現的ALS 推薦算法。

以上代碼為商品推薦的具體實現。ALS 是交替最小二乘(Alternating Least Squares)的簡稱。在機器學習中,ALS 特指使用交替最小二乘求解的一個協同過濾推薦算法。它通過將用戶的瀏覽、收藏和購買行為進行打分,將用戶與商品之間缺失的評分補齊,以評分為依據來推斷每個用戶的愛好并向用戶推薦適合的產品。

(2)RMSE 算法調優

ALS 推薦算法訓練過程中存在擬合問題,擬合問題有兩種,欠擬合和過擬合,都會影響結果的精準度。欠擬合就是擬合精度不夠,舉個例子,數據集是個第一象限的冪函數,而我們得到的結果卻是個一次函數直線,雖然也接近目標,但是誤差還是比較大。過擬合是指精度要求過高,過分考慮到每一個數據點,使得原本很完美的結果曲線變形。在科學研究過程中,對于異常數據的排除和忽略是至關重要的環節。在算法調優時,可以通過RMSE 均方根誤差判斷擬合參數是否合理。

以上代碼為算法調優的具體實現,代碼對評分矩陣進行分解,隱特征數量設置為10,迭代10 次,正則化參數設為了0.01。將真實評分數據集與預測評分數據集合并,可以得到用戶對每一個商品的實際評分和預測評分,然后計算評分的根均方差,以誤差值為依據,調整參數進行調優。

4 結語

本次大數據分析平臺的重要核心功能就是數據的分析模塊,分析中針對不同需求場景,對應著不同的算法。在對算法的研究過程中,了解到聚類、分類、推薦、決策樹等高階算法,更加加深了對普通算法的理解,即使使用尋常算法,許多難題也都迎刃而解。繼大數據學習之后,學習算法接觸人工智能也是主流方向,用大規模數據訓練模型,可以給后續學習打下基礎。

猜你喜歡
用戶系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統
半沸制皂系統(下)
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
主站蜘蛛池模板: 国产精品黄色片| 狠狠色综合网| 人妻中文久热无码丝袜| 久久精品只有这里有| 国产97公开成人免费视频| 久久国产V一级毛多内射| 国产精品成人AⅤ在线一二三四| 91在线精品免费免费播放| 第九色区aⅴ天堂久久香| 国产色偷丝袜婷婷无码麻豆制服| 亚洲精品欧美日韩在线| 97视频精品全国免费观看| 国产激情无码一区二区免费| 日韩欧美国产区| 国产办公室秘书无码精品| 亚洲男人天堂久久| 国产在线一区视频| 欧美区一区| 萌白酱国产一区二区| 国产XXXX做受性欧美88| 国产精品.com| 中文字幕欧美日韩高清| 热99精品视频| 国产主播福利在线观看| 亚洲精品日产AⅤ| 久久香蕉国产线看观看式| 99人体免费视频| 亚洲天堂精品视频| 亚洲国产精品成人久久综合影院| 亚洲AV一二三区无码AV蜜桃| 亚洲第一视频网站| 国产精品久久久久久久伊一| 国内99精品激情视频精品| 国产福利小视频在线播放观看| 国产视频a| 亚洲精品无码人妻无码| 精品国产成人av免费| 免费观看国产小粉嫩喷水| 亚洲人妖在线| 无码丝袜人妻| 成人国产三级在线播放| 婷婷六月在线| 露脸一二三区国语对白| 欧美国产综合色视频| 亚洲色图另类| 亚洲精品成人福利在线电影| 日本不卡视频在线| 久久男人资源站| 欧美精品1区| 高清色本在线www| 91久久性奴调教国产免费| 日韩精品免费在线视频| 久久亚洲高清国产| 久久精品人妻中文系列| 在线精品亚洲一区二区古装| 国产高清在线观看91精品| AV不卡在线永久免费观看| 一本大道香蕉高清久久| 麻豆精品在线| 亚洲欧美国产五月天综合| 国产精品久久久久久搜索| 国产精选自拍| 久久不卡精品| 久久夜色精品| 国产欧美视频在线| 午夜激情福利视频| 3344在线观看无码| 国产黄色视频综合| 亚洲男人在线天堂| 亚洲黄色成人| www精品久久| 国产欧美综合在线观看第七页| 免费看av在线网站网址| 草草线在成年免费视频2| 伊在人亞洲香蕉精品區| 日本高清成本人视频一区| 91美女视频在线| 日本精品αv中文字幕| 国产精品爽爽va在线无码观看 | aⅴ免费在线观看| 亚洲精品少妇熟女| 一级一毛片a级毛片|