999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向電商數(shù)據(jù)的可視化查詢系統(tǒng)①

2016-06-15 03:50:49陳先灝雒江濤重慶郵電大學(xué)電子信息與網(wǎng)絡(luò)工程研究院重慶400065
關(guān)鍵詞:可視化

陳先灝,雒江濤(重慶郵電大學(xué) 電子信息與網(wǎng)絡(luò)工程研究院,重慶 400065)

?

面向電商數(shù)據(jù)的可視化查詢系統(tǒng)①

陳先灝,雒江濤
(重慶郵電大學(xué) 電子信息與網(wǎng)絡(luò)工程研究院,重慶 400065)

摘 要:目前電子商務(wù)已經(jīng)愈發(fā)成熟,如何有效分析客戶潛在價(jià)值成為不可忽視的問題.針對此問題,本文設(shè)計(jì)與實(shí)現(xiàn)了一種可視化查詢系統(tǒng),用于分析用戶購物消費(fèi)偏好,挖掘潛在價(jià)值.本系統(tǒng)基于SSH框架,前端采用Highcharts圖表展示工具予以數(shù)據(jù)可視化處理; 后臺(tái)利用DPI提取校園網(wǎng)流量中的電商數(shù)據(jù)建立用戶購物行為數(shù)據(jù)庫,同時(shí)利用網(wǎng)絡(luò)爬蟲建立電商產(chǎn)品信息庫.系統(tǒng)經(jīng)測試,能達(dá)到預(yù)期效果,對用戶購物偏好具有一定利用價(jià)值.

關(guān)鍵詞:可視化; 查詢系統(tǒng); SSH; Highcharts; DPI

電子商務(wù)作為新一代商業(yè)模式,為客戶提供了便捷、高質(zhì)量的服務(wù)體驗(yàn).目前電商業(yè)務(wù)已經(jīng)從傳統(tǒng)PC平臺(tái)向移動(dòng)平臺(tái)遷移,且愈發(fā)成熟.作為電商服務(wù)提供者迫切需要分析客戶購買偏好,隨時(shí)掌握市場動(dòng)態(tài).因此,如何有效分析大量電商數(shù)據(jù),具有非常重要的意義.

京東,淘寶等電商相繼建立數(shù)據(jù)挖掘品臺(tái),它們擁有相當(dāng)豐富并且完善的用戶交易數(shù)據(jù),可以做到精準(zhǔn)營銷,但對于新型電商而言,數(shù)據(jù)分析較為不易.

針對上述問題,本文在傳統(tǒng)的查詢系統(tǒng)的基礎(chǔ)上,闡述了利用網(wǎng)絡(luò)流量進(jìn)行數(shù)據(jù)存儲(chǔ)和分析,重點(diǎn)闡述電商數(shù)據(jù)前端與后端的信息傳遞方式和數(shù)據(jù)可視化,實(shí)現(xiàn)了面向電商數(shù)據(jù)的可視化查詢系統(tǒng).

1 系統(tǒng)分析

1.1基本思路

面向校園網(wǎng)流量的可視化查詢系統(tǒng)旨在通過解析用戶網(wǎng)絡(luò)流量,對用戶的購物事件進(jìn)行統(tǒng)計(jì)分析,能全面真實(shí)的反應(yīng)購物偏好.

本文主要關(guān)注學(xué)生網(wǎng)購行為,而用戶購物的一系列行為均在HTTP請求內(nèi)容中有所體現(xiàn).所以分析HTTP數(shù)據(jù)包中相關(guān)內(nèi)容,進(jìn)而得到用戶購物行為[1].

以一個(gè)數(shù)據(jù)包為例,可分析得知URL中有顯著的標(biāo)識(shí)字段以及商品ID字段,通過商品ID建立與商品數(shù)據(jù)庫的聯(lián)系,可以獲得用戶購物詳細(xì)數(shù)據(jù).

確定商品與ID的對應(yīng)關(guān)系是數(shù)據(jù)分析的關(guān)鍵.本文中采取的方案是利用網(wǎng)絡(luò)爬蟲構(gòu)建信息庫.

最后利用可視化思路,進(jìn)行電商數(shù)據(jù)可視化查詢.

1.2系統(tǒng)目標(biāo)

基于以上思路,系統(tǒng)的主要目標(biāo)是實(shí)現(xiàn)面向電商數(shù)據(jù)的可視化查詢系統(tǒng).系統(tǒng)利用DPI進(jìn)行用戶數(shù)據(jù)分析,建立用戶行為數(shù)據(jù)庫,并且利用爬蟲建立商品數(shù)據(jù)庫,然后通過SSH構(gòu)建前臺(tái)與后臺(tái)之間的數(shù)據(jù)傳輸通道,最后在瀏覽器中利用Highcharts呈現(xiàn)圖形化數(shù)據(jù).系統(tǒng)用戶可以通過本系統(tǒng)分析目前消費(fèi)者在各大主流電商網(wǎng)站上的消費(fèi)情況.

1.3可視化查詢過程模型

圖1給出了可視化查詢過程模型,包括4個(gè)主要過程,分別概述如下:

(1)數(shù)據(jù)采集: 包括兩方面,一方面采集校園網(wǎng)學(xué)生用戶數(shù)據(jù),為后續(xù)電商數(shù)據(jù)的提取以及購物分析提供原始數(shù)據(jù); 另一方面采集商品數(shù)據(jù)以便對應(yīng)學(xué)生購買的商品,獲得詳細(xì)信息;

(2)數(shù)據(jù)解析: 根據(jù)前文思路,基于學(xué)生購買商品事件,系統(tǒng)對原始數(shù)據(jù)流量進(jìn)行分析和重組,建立針對每一位學(xué)生的消費(fèi)事件表.消費(fèi)事件表結(jié)合商品信息庫,完成信息補(bǔ)充,獲得詳細(xì)數(shù)據(jù)表;

(3)數(shù)據(jù)表存儲(chǔ): 將數(shù)據(jù)表存入數(shù)據(jù)庫,對已經(jīng)解析完畢的原始流量予以刪除,緩解存儲(chǔ)壓力并提供日志記錄;

(4)數(shù)據(jù)提取以及可視化: 系統(tǒng)根據(jù)不同用戶,以及不同需求,查詢數(shù)據(jù)庫,獲得所需多維信息數(shù)據(jù),并返回客戶端,以各種圖形呈現(xiàn).

圖1 系統(tǒng)過程模型

2 系統(tǒng)總體設(shè)計(jì)

按照過程模型,系統(tǒng)總體架構(gòu)分為四層,從上至下依次為用戶層,應(yīng)用展示層,邏輯層,和數(shù)據(jù)層.系統(tǒng)總體框架結(jié)構(gòu)圖如2所示.

用戶層是本系統(tǒng)面向不同用戶所呈現(xiàn)的具體系統(tǒng)頁面.系統(tǒng)主要面向一般用戶以及管理員.

應(yīng)用層以瀏覽器為媒介,為用戶提供數(shù)據(jù)管理以及可視化展示分析,并且可以進(jìn)行圖形轉(zhuǎn)換處理.

數(shù)據(jù)管理主要包括系統(tǒng)定時(shí)采集網(wǎng)絡(luò)流量進(jìn)行兩部分?jǐn)?shù)據(jù)更新,并為用戶提供通知,同時(shí)系統(tǒng)用戶可以手動(dòng)選擇是否刪除以往數(shù)據(jù).

統(tǒng)計(jì)分析功能依靠前端提供的數(shù)據(jù)搜索功能查詢底層數(shù)據(jù)庫.

圖2 系統(tǒng)總體架構(gòu)圖

圖形處理依靠前端可視化工具針對同一份數(shù)據(jù)做多圖形展示,便于用戶選擇以及人工分析.

邏輯層的設(shè)計(jì)主要通過Struts2和Spring框架來完成.通過在項(xiàng)目中引入Spring框架,完成Service,Action,DAO及依賴關(guān)系的管理[2]; 邏輯層完成用戶在應(yīng)用層下達(dá)的指令收發(fā)(包括數(shù)據(jù)收發(fā),數(shù)據(jù)更新,以及數(shù)據(jù)傳遞).數(shù)據(jù)傳遞利用Hibernate完成.

Hibernate基于對象-關(guān)系映射,即可以將對象與關(guān)系數(shù)據(jù)庫進(jìn)行對應(yīng),生成相應(yīng)SQL查詢語句.系統(tǒng)利用SQL語句查詢相應(yīng)結(jié)果,并將獲得的數(shù)據(jù)轉(zhuǎn)為JSON格式,作為響應(yīng)提交給應(yīng)用層以及用戶層.

數(shù)據(jù)層提供數(shù)據(jù)采集,以及數(shù)據(jù)存儲(chǔ)等功能.數(shù)據(jù)層采集存儲(chǔ)結(jié)構(gòu)圖由圖3所示.

如圖所示,網(wǎng)絡(luò)爬蟲完成產(chǎn)品信息提取以及更新; DPI(Deep Packet Inspection)完成消費(fèi)者購物信息的提取.

圖3 數(shù)據(jù)采集存儲(chǔ)結(jié)構(gòu)圖

網(wǎng)絡(luò)爬蟲程序每次讀取一個(gè)URL,下載其對應(yīng)的網(wǎng)頁中的產(chǎn)品信息,并對其分析.若分析得到新的URL,則重復(fù)這一過程,直到滿足一定條件,方可停止.

本系統(tǒng)中,網(wǎng)絡(luò)爬蟲定向抓取電商網(wǎng)站中的資源,建立產(chǎn)品信息庫.信息庫主要包括商品、商品ID以及商品描述等,與DPI模塊相呼應(yīng).

DPI即深度包檢測技術(shù)是一種基于應(yīng)用層的控制技術(shù)和流量檢測技術(shù),能夠高效地識(shí)別出各種應(yīng)用.普通報(bào)文檢測通過端口號(hào)來鑒定應(yīng)用類型.而當(dāng)前網(wǎng)絡(luò)上的非法應(yīng)用會(huì)通過隱藏或假冒端口號(hào)的方式躲避.在這種情況下,L2~L4層的傳統(tǒng)檢測方法已然失效.不同于傳統(tǒng)方法,DPI通過對網(wǎng)絡(luò)流中的數(shù)據(jù)報(bào)文內(nèi)容進(jìn)行檢測,從而確定數(shù)據(jù)報(bào)文的真正應(yīng)用.

DPI作為流量分析工具,其作用是分析底層流量,并利用數(shù)據(jù)特征對每個(gè)用戶的流量進(jìn)行分流,統(tǒng)計(jì)相關(guān)事件.系統(tǒng)利用此信息與產(chǎn)品信息庫進(jìn)行匹配,進(jìn)而發(fā)現(xiàn)用戶瀏覽電商網(wǎng)站詳細(xì)行為,比如所瀏覽的產(chǎn)品,網(wǎng)站,時(shí)間等.

3 主要模塊實(shí)現(xiàn)

3.1數(shù)據(jù)表

網(wǎng)絡(luò)爬蟲按照URL將商品信息分網(wǎng)站,分類別,進(jìn)行爬取,獲得產(chǎn)品信息庫并予以存儲(chǔ).產(chǎn)品信息主要包括網(wǎng)站名稱,商品ID,商品描述,一級(jí)目錄,一級(jí)目錄描述,二級(jí)目錄,二級(jí)目錄描述,三級(jí)目錄,三級(jí)目錄描述.如圖4所示.

圖4 產(chǎn)品信息庫

DPI根據(jù)用戶流量數(shù)據(jù)包,解析出關(guān)鍵信息: 訪問時(shí)間,訪問網(wǎng)站,商品ID,源IP,目的IP,源端口以及目的端口,如圖5所示.源IP,可以用來確定屬于同一用戶的數(shù)據(jù)包,從而定位其整個(gè)會(huì)話過程的網(wǎng)站瀏覽情況.

當(dāng)數(shù)據(jù)庫系統(tǒng)接受到查詢指令,系統(tǒng)將用戶事件信息,與產(chǎn)品信息庫進(jìn)行關(guān)聯(lián),得到用戶在某段時(shí)間的具體瀏覽情況.

圖5 用戶瀏覽信息表

3.2后臺(tái)查詢模塊

本系統(tǒng)后臺(tái)查詢模塊主要完成數(shù)據(jù)查詢以及數(shù)據(jù)組裝.考慮到用戶有不同需求,數(shù)據(jù)組裝功能實(shí)現(xiàn)了靈活顯示部分字段、記錄.與此同時(shí),數(shù)據(jù)組裝功能也包括數(shù)據(jù)格式轉(zhuǎn)換.

后臺(tái)代碼根據(jù)前臺(tái)請求,查詢所需字段對應(yīng)的數(shù)據(jù).此過程為了簡化代碼設(shè)計(jì),可以在HTTP請求中將所查詢的參數(shù)按照SQL語句格式排列好后一并傳入后臺(tái),后臺(tái)只需讀取上述已整理好的參數(shù)語句即可.簡化代碼如下:

查詢模塊將查詢條件轉(zhuǎn)為標(biāo)準(zhǔn)SQL語句之后,系統(tǒng)執(zhí)行查找,得到所需數(shù)據(jù)并將其轉(zhuǎn)為JSON格式,以HTTP Response的形式返回客戶端.

3.3前端模塊

3.3.1JQuery

jQuery是一個(gè)優(yōu)秀的JavaScript框架,該框架實(shí)現(xiàn)了HTML、JavaScript、CSS三者分離.憑借其優(yōu)秀的頁面效果以及交互性,已經(jīng)被廣泛使用; 同時(shí)憑借其使用的簡潔性,對DOM強(qiáng)大的操控性和易擴(kuò)展性受到Web開發(fā)人員的喜愛[3].本系統(tǒng)JS代碼均有借助JQuery庫,方便Ajax交互技術(shù).

3.3.2頁面數(shù)據(jù)請求

前臺(tái)頁面完成輸入?yún)?shù)的組裝問題以及請求的提交,以下舉例說明: 根據(jù)3.1所述,商品屬性包括網(wǎng)站包含9個(gè)屬性,所以頁面上可供選擇的屬性有9個(gè),為了方便用戶選擇,所有屬性均有說明以及復(fù)選框,部分相關(guān)HTML代碼如下:

如上所示,每一個(gè)屬性的type均為checkbox(復(fù)選框),另外,name均設(shè)置為interest,這種設(shè)置為jQuery選擇器提供便利.

客戶端得到所需要查詢的字段,通過jQuery自帶的$.get(),即可以ajax的方式,異步請求數(shù)據(jù).

3.3.3Highcharts

數(shù)據(jù)可視化模塊采用的是Highcharts.Highcharts是一個(gè)用純Javascript圖表庫,能夠很便捷地在web網(wǎng)站或是web應(yīng)用程序中提供直觀,交互性的圖表[4].

Highcharts引入數(shù)據(jù)方法及其簡便,只需要將組裝好的數(shù)據(jù)賦予其data配置量即可.

3.3.4可視化展示

系統(tǒng)前端頁面利用jQuery異步請求得到的JSON數(shù)據(jù),經(jīng)解析后作為傳入highcharts的數(shù)據(jù).利用此方法以及javascript事件函數(shù),本系統(tǒng)完成了數(shù)據(jù)3層鉆取并畫圖,利于數(shù)據(jù)全面分析.關(guān)鍵代碼如下:

4 實(shí)驗(yàn)分析

4.1圖例分析

本文面向電商數(shù)據(jù),實(shí)現(xiàn)了基于時(shí)間段內(nèi)的用戶購物數(shù)據(jù)可視化分析.綜上所述,系統(tǒng)用戶可以清楚地分析出在某一時(shí)間段內(nèi)學(xué)生在不同電商品牌的購物情況.

本系統(tǒng)實(shí)現(xiàn)了以條形統(tǒng)計(jì)圖,餅圖,折線圖為主的數(shù)據(jù)顯示方式,并且所繪制圖形提供下載,保存,同時(shí)數(shù)據(jù)圖形本身提供對應(yīng)的excel表,方便系統(tǒng)用戶使用.

系統(tǒng)為了更加直觀地展示所有系列商品銷售情況,在上級(jí)視圖中,添加數(shù)據(jù)鉆取功能.以下舉例說明:

如圖6所示,系統(tǒng)針對某時(shí)段采集到的數(shù)據(jù),繪制出淘寶商城本時(shí)段內(nèi)銷售的商品種類.用戶通過圖形結(jié)果,可以較為直觀的看到服裝類基本占據(jù)了銷售的主導(dǎo)地位,其次為鞋包.基于以上結(jié)論,基本可以肯定學(xué)生顧客在基本穿著方面消費(fèi)較多.

不過基于以上結(jié)論,信息量并不足夠,用戶需要知道更加詳細(xì)的品牌信息以確定更加精確的銷售策略.

圖6 數(shù)據(jù)分布餅圖

圖7 男裝品牌分布餅圖

用戶可以通過點(diǎn)擊圖6中的服裝,展示出目前數(shù)據(jù)所采集到的相關(guān)男裝以及女裝品牌,并提供相應(yīng)視圖,如圖7所示.系統(tǒng)顯示出了男裝各大品牌的銷售情況,銷售商可以根據(jù)不同時(shí)段的不同數(shù)據(jù),緊跟當(dāng)下潮流,使用相應(yīng)的供貨手段,盡可能保持盈利.

4.2系統(tǒng)展示優(yōu)化策略

由于數(shù)據(jù)量大,系統(tǒng)采取以下措施,作為基本優(yōu)化策略:

采用ajax方式,即利用異步讀取方式.當(dāng)客戶需要更新頁面部分圖例,采取局部刷新的方式,減少用戶請求數(shù)據(jù)量.

SQL語句優(yōu)化,即盡可能減少表之間的連接,建立合理索引,以提高查詢速度; 同時(shí)采取數(shù)據(jù)分頁顯示,以緩解壓力.

5 結(jié)語

本文針對電商產(chǎn)品數(shù)據(jù)以及用戶購買行為,設(shè)計(jì)了一種基于SSH架構(gòu)的可視化查詢系統(tǒng).后臺(tái)通過網(wǎng)絡(luò)爬蟲以及DPI技術(shù)建立數(shù)據(jù)庫,具有數(shù)據(jù)覆蓋面全的特點(diǎn); 系統(tǒng)使用B/S架構(gòu),具有安裝,部署方便等特點(diǎn),每一層次都實(shí)現(xiàn)了靈活的接口,便于2次開發(fā).

系統(tǒng)將進(jìn)一步研究原始數(shù)據(jù)采集中的過濾模塊,減少原始數(shù)據(jù)存儲(chǔ)壓力,以加快定時(shí)更新頻率; 以及產(chǎn)品數(shù)據(jù)可視化的集成,嘗試實(shí)現(xiàn)系統(tǒng)調(diào)用外部數(shù)據(jù)集接口,實(shí)現(xiàn)數(shù)據(jù)靈活的特點(diǎn).

參考文獻(xiàn)

1楊軍超,雒江濤,申健,鄧生雄.基于MapReduce的校園網(wǎng)用戶網(wǎng)購偏好分析.計(jì)算機(jī)系統(tǒng)應(yīng)用,2015,24(10):222–226.

2張建軍,劉虎,倪芳英.基于SSH與Highcharts整合架構(gòu)的Web應(yīng)用研究.計(jì)算機(jī)技術(shù)與發(fā)展,2013,9:245–247,251.

3周玲余.基于jQuery框架的頁面前端特效的設(shè)計(jì)與實(shí)現(xiàn).計(jì)算機(jī)與現(xiàn)代化,2013,1:61–63.

4吳孟春,丁嵐.HighCharts組件在氣象業(yè)務(wù)中的開發(fā)和應(yīng)用.計(jì)算機(jī)與網(wǎng)絡(luò),2014,12:65–68.

Visual Query System for Electronic Commerce data

CHEN Xian-Hao,LUO Jiang-Tao
(Electronic Information and Networking Research Institute,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)

Abstract:How to analyse the potential value of a customer is a problem that cannot be neglected while the e-commerce is becoming more and more mature.Aiming at solving this problem,the paper designs and implements a visual query system,which is used for analysing customers’ preference and digging their potential value.Based on the SSH framework,this system uses Highcharts to do the data visualization at the front-end,while the database of products is established via the web parser and the database of user-expense behavior extracted from the campus’s traffic is established via DPI.This system reaches the expected target for data analysis and is good for shopping preference analysis after testing.

Key words:data visualization; query system; SSH; Highcharts; DPI

基金項(xiàng)目:①重慶市應(yīng)用開發(fā)計(jì)劃(cstc2013yykfA40006)

收稿時(shí)間:2015-09-22;收到修改稿時(shí)間:2015-11-27

猜你喜歡
可視化
無錫市“三項(xiàng)舉措”探索執(zhí)法可視化新路徑
基于CiteSpace的足三里穴研究可視化分析
自然資源可視化決策系統(tǒng)
北京測繪(2022年6期)2022-08-01 09:19:06
三維可視化信息管理系統(tǒng)在選煤生產(chǎn)中的應(yīng)用
思維可視化
師道·教研(2022年1期)2022-03-12 05:46:47
基于Power BI的油田注水運(yùn)行動(dòng)態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
自然資源可視化決策系統(tǒng)
北京測繪(2021年7期)2021-07-28 07:01:18
基于CGAL和OpenGL的海底地形三維可視化
可視化閱讀:新媒體語境下信息可視化新趨勢
“融評”:黨媒評論的可視化創(chuàng)新
傳媒評論(2019年4期)2019-07-13 05:49:14
主站蜘蛛池模板: 亚洲天堂2014| 色偷偷av男人的天堂不卡| 国产三区二区| 国产免费羞羞视频| 国产毛片片精品天天看视频| 亚洲综合天堂网| 国产专区综合另类日韩一区| 在线看片免费人成视久网下载| 欧美亚洲综合免费精品高清在线观看| 亚洲天堂免费观看| 久久久久青草大香线综合精品 | 热re99久久精品国99热| 午夜不卡视频| 欧美在线伊人| 亚洲一级毛片免费观看| 国产一级特黄aa级特黄裸毛片| 无码高潮喷水专区久久| 内射人妻无套中出无码| 成人av专区精品无码国产| 免费又黄又爽又猛大片午夜| 国产一区二区三区在线无码| 国产人成网线在线播放va| 99久久精品免费看国产电影| 日韩欧美中文字幕一本| 丝袜美女被出水视频一区| 亚洲综合久久一本伊一区| 亚洲天堂久久久| 国产中文一区二区苍井空| 国产三级韩国三级理| 欧美日本视频在线观看| 99国产在线视频| 日本亚洲欧美在线| 国产成人精品亚洲77美色| 国产精品一区在线麻豆| 乱码国产乱码精品精在线播放| 国产在线第二页| 国产农村1级毛片| 波多野结衣亚洲一区| 欧美色丁香| 欧美精品二区| 亚洲h视频在线| 国产黑丝视频在线观看| 久久永久视频| 久青草国产高清在线视频| 99这里只有精品在线| 国产精品99久久久| 国产在线精彩视频论坛| 影音先锋亚洲无码| 中文字幕首页系列人妻| 2021天堂在线亚洲精品专区| 亚洲精品爱草草视频在线| 福利小视频在线播放| 男女男精品视频| 无码日韩精品91超碰| 茄子视频毛片免费观看| 欧美一级黄片一区2区| 国产亚洲美日韩AV中文字幕无码成人 | 被公侵犯人妻少妇一区二区三区| 国产精品美女自慰喷水| P尤物久久99国产综合精品| 久久黄色影院| 国内丰满少妇猛烈精品播| 精品欧美日韩国产日漫一区不卡| 毛片网站在线播放| 久久熟女AV| 99视频全部免费| 在线国产毛片手机小视频| 曰韩人妻一区二区三区| 久久亚洲国产最新网站| 欧美综合激情| 中国成人在线视频| 国产男人天堂| 免费国产高清精品一区在线| 国产精品成人免费综合| 97综合久久| 国产久草视频| 亚洲天堂777| 亚洲日韩精品无码专区97| 亚洲黄色高清| 国产一级二级三级毛片| 国产极品粉嫩小泬免费看| 国产欧美日韩精品第二区|