999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據下基于Spark的電商智能推薦云平臺的研究

2018-01-09 09:54:50俞華鋒
科技視界 2018年26期
關鍵詞:云平臺大數據

【摘 要】本文在“互聯網+”背景下對基于Spark的電商智能推薦云平臺進行了研究。首先闡述了該平臺研究的意義、Spark技術的主要功能和系統架構,最后探討了基于Spark的電商智能推薦云平臺的設計。

【關鍵詞】大數據;Spark;智能推薦;云平臺

中圖分類號: TP391.3 文獻標識碼: A 文章編號: 2095-2457(2018)26-0105-002

DOI:10.19694/j.cnki.issn2095-2457.2018.26.045

0 引言

隨著“互聯網+”和“移動互聯網+”等新一代信息技術的飛速發展,消費者用智能終端(手機和平板電腦等)去電子商務網站、社交網絡、微博、微信上購物變得越來越方便。然而隨著電子商務規模的不斷擴大,商品種類和信息的不斷增長,消費者需要花費大量的時間、精力才能找到自己想買的商品。尤其在移動互聯網環境下,消費者在移動端顯得更沒有“耐心”,日益增長的商品信息和數據使用戶感到困惑與迷茫,因此,對于消費者來說,如何從龐大的商品中快速找到自己需要的商品成為亟待解決的問題。同時,對于互聯網企業和生產服務提供商而言,如何讓自身商品信息從海量數據中脫穎而出并得到消費者認可也是亟待解決的一個問題。而智能推薦云平臺可以較好地解決上述問題。電商和企業可以通過智能推薦云平臺精準的向消費者推薦自己的商品,從而快速、全面、準確的滿足消費者需求。

本項目利用Spark和大數據挖掘等新一代信息技術,構建電商智能推薦云平臺,通過各種信息渠道(即如何利用社交網絡、微博、電商網站上的消費者的綜合行為數據)收集消費行為的實時數據以及他們和品牌的互動行為,分析日志數據、用戶歷史行為、用戶屬性從而創建用戶興趣偏好模型,依據智慧推薦算法預測用戶對商品權重偏好并進行排序,向消費者智能推薦滿足需求與感興趣的商品列表,為用戶的消費決策提供一定的參考。對生產企業來說,管理者能夠通過該平臺得出的信息來預測消費者的潛在需求,打破了公司傳統的自頂而下的決策流程,全面轉向以消費者為中心的組織架構和業務流程,從而實現生產者與消費者的雙贏。

1 Spark關鍵技術

Spark是為處理大數據而開發的并行通用計算平臺,與Hadoop集群系統具有相似的特點。但兩者最大的區別是Spark處理的中間計算結果是保存在內存中,不需要讀寫分布式文件系統,因此Spark能更好地適用于大數據挖掘與機器學習等需要迭代計算的地方。

1.1 Spark主要功能模塊

Spark主要有Spark Core、Spark SQL、Spark Streaming、GraphX和MLlib模塊組成,主要功能如下:

Spark Core:是集群系統中最核心的功能,包括創建SparkContext對象、任務提交與執行、分布式部署任務與資源、分布式計算等。

Spark SQL:提供了對關系型數據庫的增、刪、查、改等的交互式操作,也可以對Hive和Json等數據格式的數據進行符合要求的處理。

Spark Streaming:主要功能是將流數據集聚為彈性分布式數據集RDD,然后再進行批量處理,提供大數據流式計算處理服務,其數據吞吐量較大。支持的數據源包括Kafka、Twitter、MQTT、Flume、ZeroMQ和簡單的TCP套接字等。

GraphX:主要功能是通過調用其中的API,解決基于分布式的內存圖形計算問題。在迭代計算次數較多的情況下,圖形計算和處理效率較高。

MLlib:通過調用其中的API接口,實現大量的機器學習有關的分類、統計、回歸等多種功能。方便了用戶,提高了效率,同時也大大降低了用戶的學習成本。

1.2 Spark系統架構

Spark應用程序從編寫到提交、執行、輸出的整個過程采用集群的協作計算模式進行,整個集群的系統架構如圖1所示。

Spark集群管理器Cluster Manager:負責資源的分配與管理。用戶使用SparkContext提供的API,編寫了Driver application程序后,Spark集群管理器將各個Worker機上的計算資源(包括內存和CPU)分配給應用程序,但是并不負責對Execoutor的資源分配。

Spark工作節點Worker:從節點。由Spark集群管理器分配任務后,再由Spark工作節點創建一個Executor進程,再將其資源和任務分配給Executor進程,同時將資源信息反饋給Spark集群管理器。

Executor:為用戶提交的Spark應用程序運行在Worker node上的一個進程,主要負責Worker工作節點分配的任務的處理,并且與Worker工作節點、Driver?App的交互與信息同步。

Driver App:客戶端應用程序,運行應用程序的主函數,將任務程序轉換為彈性分布式數據集RDD和有向無環圖DAG,并與Cluster Manager進行通信與調度。

2 基于Spark的電商智能推薦云平臺的設計

在大數據下基于Spark的電商智能推薦云平臺根據消費者的綜合行為數據(電商網站上的瀏覽、購買、反饋等行為)進行分析和統計,得出他們的個性偏好,并按照推斷的個性偏好建立消費者偏好數學模型,預判消費者的潛在需求??梢园延脩羝玫纳唐吠扑]給相應的用戶和消費者。同時也將預測的用戶潛在需求推送給企業,因此打破了公司傳統的決策流程,全面轉向以用戶為中心的服務流程,提高企業的經濟效益。主要包含信息收集和存儲模塊、信息處理和推薦模塊和輔助決策模塊等模塊。

2.1 信息收集和存儲模塊

信息收集和預處理模塊主要收集用戶和商品等信息,并進行整合和預處理操作,將其轉換為符合項目要求的數據集格式并進行存儲。

信息收集主要涉及到消費者、生產廠商和管理人員等的。該模塊從用戶表中收集的用戶信息包括他們的用戶編號、用戶類別、姓名、年齡、性別、職業、興趣、商品偏好、郵箱等基本信息;從歷史的銷售表中讀取用戶曾經購買過的商品編號和購買數量等;同時也可以根據用戶瀏覽網站的行為,記錄瀏覽了哪些商品、推薦了哪些商品和以及瀏覽和收藏次數等相關信息屬性;也可以從用戶對商品的反饋與評價表中獲取商品類別、用戶推薦類別用戶編號、用戶操作記錄、用戶評分與評價等信息。信息收集和存儲模塊將收集到的數據存儲到數據庫中,為用戶偏好的計算及商品的推薦提供基礎。

2.2 基于Spark的信息處理和推薦模塊

信息處理與推薦模塊主要任務是根據信息收集和存儲模塊收集到的用戶商品偏好與評分信息,將消費者偏好的商品作為依據,通過基于Spark的電商智能推薦云平臺智能分析與挖掘出潛在的用戶,并將偏好的商品信息推薦給用戶。該模塊主要由信息讀入、創建彈性分布式數據集RDD、智能挖掘和推薦、輔助決策模塊。

(1)信息讀入,創建彈性分布式數據集RDD:將信息收集和存儲模塊中收集的用戶商品偏好與評分信息作為數據集存儲在分布式文件系統中,通過腳本加載數據。由于偏好與評分數據集為矩陣,并且不同系統的不同用戶評分標準不統一,因此在信息的抽取、轉換和加載的預處理過程中對用戶偏好的商品用1表示,其他為0。最后將處理后的數據集加載生成數據集RDD對象,以便Spark能使用該數據集RDD對象實現并行化處理操作。

(2)基于Spark的智能挖掘和推薦模塊:該模塊負責接收用戶歷史數據、商品銷售信息、用戶偏好信息和商品評價信息等。該模塊根據用戶的各類偏好,統計消費者的各類偏好,并從用戶歷史數據和用戶屬性數據中提取到用戶的特征向量,再結合商品銷售信息、評價信息和用戶反饋信息進行過濾、排名、統計等處理得到智能挖掘和推薦的結果。

在信息處理和推薦模塊的Spark云平臺中,創建SparkContext類的對象sc,再通過對象sc的函數textFile讀取分布式文件系統上數據,創建RDD對象,最后通過函數parseUser讀取每行數據,并以userID為關鍵值填充到數組中。函數interAction則根據關鍵值建立商品信息表。

2.3 輔助決策模塊

輔助決策模塊負責將信息處理和推薦模塊中智能分析和挖掘到的大規模數據進行分析并預測消費者的潛在需求,并且將用戶偏好的商品信息、偏好數據、用戶對商品的意見和建議等分析結果提供給不同權限的工作人員查詢,工作人員可以根據自己的工作性質查詢自己所需的數據,來制定推薦、營銷和決策方案,如應對哪些商品進行促銷、如何定價、目標用戶群是哪些等,為商品的設計和企業的經營決策提供一定的參考。

2.4 結束語

本文針對電商不斷發展以及用戶不斷增長的趨勢,將大數據和Spark技術引入到電商智能云平臺的建設中。本文首先介紹了電商智能云平臺研究的意義、Spark技術的主要功能和系統架構,最后探討了基于Spark的電商智能推薦云平臺的設計,希望能對電商云平臺的研究提供一定的參考。當然本文只是提出了初步的設計,具體的實現有待進一步的研究與完善。

【參考文獻】

[1]http://www.cnblogs.com/.

[2]http://baike.baidu.Com.

[3]俞華鋒.網絡大數據挖掘云服務平臺的構建[J].科技視界.2013(18).

[4]俞華鋒.云計算下基于大數據的消費者偏好測量和決策系統的研究[J].科技視界.2015(33).

猜你喜歡
云平臺大數據
Docker技術在Web服務系統中的應用研究
高職院校開展基于云平臺網絡教學的探索與思考
中國市場(2016年36期)2016-10-19 04:43:09
企業云平臺建設研究
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
基于云平臺的微信互聯式教學法的探索與實踐
企業導報(2016年11期)2016-06-16 15:36:34
基于云平臺的高職院校開放性職業培訓工作體系建設研究
企業導報(2016年5期)2016-04-05 14:19:22
主站蜘蛛池模板: 欧美日韩另类在线| 亚洲国产日韩视频观看| 久久成人免费| 97超级碰碰碰碰精品| 成人在线亚洲| 欧洲一区二区三区无码| 国产91麻豆视频| 综合网天天| 亚洲精品国产日韩无码AV永久免费网 | 国产精品毛片一区| 国产成人精品在线| 欧美午夜理伦三级在线观看| 精品国产一二三区| 三上悠亚精品二区在线观看| 成人无码区免费视频网站蜜臀| 国产精品思思热在线| 天天摸夜夜操| 香蕉伊思人视频| 99成人在线观看| 天堂亚洲网| 成人国产免费| 波多野结衣一区二区三视频| 永久在线精品免费视频观看| 亚洲国产精品日韩欧美一区| 国产情侣一区| 国产一在线| 欧美日韩精品一区二区在线线| 亚洲成在线观看 | 日韩在线播放中文字幕| 中文字幕免费播放| 日本精品视频一区二区| 色综合天天娱乐综合网| 成人国产精品一级毛片天堂 | 久久精品亚洲热综合一区二区| 2021精品国产自在现线看| 亚洲人成人无码www| 91精品日韩人妻无码久久| 扒开粉嫩的小缝隙喷白浆视频| 3344在线观看无码| 91午夜福利在线观看精品| 成人午夜在线播放| 国产精品久久久久久久伊一| 婷婷六月色| 欧美日韩国产系列在线观看| 26uuu国产精品视频| 无码又爽又刺激的高潮视频| 91精品久久久久久无码人妻| 久久福利网| 香蕉伊思人视频| 国产国产人成免费视频77777| 人妻精品久久无码区| 亚洲人成高清| 欧美激情视频一区二区三区免费| 黄色网页在线播放| 国产美女视频黄a视频全免费网站| 国产95在线 | 91国内在线观看| JIZZ亚洲国产| 国产成人做受免费视频| 久久久久久尹人网香蕉| 国产经典在线观看一区| 亚洲女同欧美在线| 亚洲午夜福利精品无码| 久久成人国产精品免费软件| 日韩激情成人| 97超爽成人免费视频在线播放| 国产高清在线观看91精品| 亚洲v日韩v欧美在线观看| 成人精品免费视频| 亚洲va欧美va国产综合下载| 欧美精品三级在线| 伊人色综合久久天天| 67194成是人免费无码| 欧美区一区| 无码国产伊人| 婷婷99视频精品全部在线观看| 丝袜亚洲综合| 亚洲一区波多野结衣二区三区| 日韩欧美国产成人| 91网在线| 亚洲VA中文字幕| 91久久精品国产|