999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

構建大數據在線運行環境初探

2019-05-16 03:06:02劉永濤院志超
中文信息 2019年4期

劉永濤 院志超

摘 要:大數據分析和應用在高校得到廣泛的發展,在線運行平臺是其基礎,因此,本文運用開源軟件Apache Hadoop、Flume、Spark以及Kafka構建了一個大數據采集、計算、存儲平臺。

關鍵詞:Apache Hadoop Apache Flume Apache Spark Apache Kafka

中圖分類號:TP391文獻標識碼:A文章編號:1003-9082(2019)04-000-01

在進行大數據分析之前,需要構建一個支持數據在線采集、分析和存儲的運行環境。本文使用分布式日志收集系統Apache Flume、數據分發中間件Kafka、分布式實時計算框架Spark Streaming構建了一個在線數據平臺。通過使用該平臺,完成了數據信息的實時采集、計算和存儲。

一、大數據平臺整體設計

分布式大數據計算框架由6個節點構成,服務器集群中的服務器操作系統為Centos6.5,服務器集群軟件為Apache Hadoop。1臺服務器為數據采集平臺,運行分布式日志收集系統Apache Flume,1臺服務器為消息中間件,運行分布式的日志系統Kafka,一臺服務器為Apache Hadoop集群的NameNode,負責作業的調度和管理,剩余3臺服務器為數據處理服務器,運行分布式計算框架Spark,為大數據的采集、計算和存儲提供平臺支撐。

二、運行環境的安裝與配置

運行在Centos6.5中,在系統上線運行之前,需要安裝一系列的環境軟件來支撐其運行。環境運行支撐軟件有Java、Scala等,由于系統運行對軟件的運行版本有一定的要求,因此,在選擇正確的軟件版本后進行安裝。

1.Java的安裝和配置

由于Spark streaming僅僅支持Java8以上的版本,因此,使用wget命令從Oracle的官方網站上下載Java SE Development Kit 9.0.1并保存在源碼文件夾下。使用解壓命令tar zxvf jdk-9.0.1_linux-x64_bin.tar.gz-C/home/用戶名/application,將Java的tar文件解壓至目錄/home/用戶名/application。然后使用vi命令編輯./bash_profile文件,添加Java的環境變量以及將java的運行路徑進行映射,配置后使用source ./bash_profile命令啟用環境變量。

2.Scala的安裝與配置

由于Spark2.2.0版本對Scala的版本要求是2.11,因此,使用wget命令從Scala的官方網站上下載scala-2.11.tgz并保存在源碼文件夾下。使用解壓命令tar zxvf scala-2.11.tgz-C /home/用戶名/application,將Scala的tar文件解壓至目錄/home/用戶名/application。然后使用vi命令編輯./bash_profile文件,添加Scala的環境變量以及將Scala的運行路徑進行映射,配置后使用source ./bash_profile命令啟用環境變量。

三、數據流量的采集

網絡數據的采集使用Apache Flume,通過使用端口鏡像技術將數據流截獲并發送到Apach Flume所在的服務器41414端口上,從而實現數據流量的準實時獲取,從而為后續的數據處理提供數據消費源。Apache Flume會啟動Flume Agent監控上網日志采集服務器41414端口從而獲取數據信息。該數據信息被Flume Agent發送到消息隊列Channel中,消息隊列Channel中的數據信息被Kafka作為數據源進行消費,在這種情況下,kafka就是Apache Flume的sink。而Kafaka的數據作為spark streaming應用程序的數據源,被其進行業務邏輯處理。

四、Apache Flume的編譯、安裝與設置

由于默認的Apache Flume在接收數據時,會對接收的數據進行自動裁剪,其source端單event的body數據部分只會留下16字節的信息,為了使其接收的數據不被自動裁剪,就需要修改源碼并對源碼進行編譯,編譯后進行安裝使用。通過對EventHelper.java以及LogerSink.java源文件的閱讀,發現該文件定義了一個靜態私有整數型變量DEFAULT_MAX_BYTES來進行body數據信息的大小,因此,需要對該文件中的變量進行修改,修改完成后使用maven insatll-DskipTests-Dtar來對源碼包進行編譯處理。

編譯成功后,有一個編譯完成后的壓縮包apache-flume-1.8.0-bin.tar.gz。使用解壓命令tar zxvf apache-flume-1.8.0-bin.tar.gz-C /home/用戶名/application,將Apache Flume的tar文件解壓至目錄/home/用戶名/application。然后使用vi命令編輯./bash_profile文件,添加Apache Flume的環境變量以及將Apache Flume的運行路徑進行映射,配置后使用source ./bash_profile命令啟用環境變量。

由于Apache Flume使用代理Agent作為部署的基本單元,因此,在使用時需要定義一個或者更多的Agent。又由于Source組件(源)、Channel組件(通道)以及Sink組件(接收器)構成了一個Flume Agent,因此,在配置文件中既要定義Agent又要定義這些組件。在配置文件中,一個Flume Agent的三個構成部分必須唯一。

五、Kafka的安裝和配置

使用wget命令從Zookeeper的官方網站中下載Zookeeper的壓縮文件并保存在源碼文件夾下。使用解壓命令tar zxvf zookeeper-3.4.10.tar.gz-C/home/用戶名/application,將Zookeeper的壓縮文件解壓至目錄/home/用戶名/application。然后使用vi命令編輯./bash_profile文件,添加Zookeeper的環境變量以及將Zookeeper的運行路徑進行映射,配置后使用source ./bash_profile命令啟用環境變量。

Apache Hadoop和Apache Spark的安裝過程和Apache Flume雷同,在此不在贅述。通過使用開源軟件Apache Hadoop、Flume、Kafka和Spark搭建一個實時數據采集、計算和存儲平臺,為大數據后續的分析提供基本的運行環境支持。

主站蜘蛛池模板: 久久综合丝袜长腿丝袜| 99re热精品视频国产免费| 广东一级毛片| 欧美综合区自拍亚洲综合天堂| 老色鬼欧美精品| 午夜天堂视频| 国产农村妇女精品一二区| 国产H片无码不卡在线视频| 久久国产精品影院| 欧美一级高清免费a| 国产啪在线91| 国产女人综合久久精品视| 国产精品无码作爱| 国产一级在线观看www色| 中文字幕在线一区二区在线| 久一在线视频| 91香蕉视频下载网站| 国产jizzjizz视频| 国产黄色片在线看| 中文字幕色在线| 久久99这里精品8国产| 精品久久国产综合精麻豆| 精品国产美女福到在线不卡f| 3p叠罗汉国产精品久久| 亚洲国产成人无码AV在线影院L | 91在线中文| 男女男精品视频| 无码精品福利一区二区三区| 亚洲 欧美 日韩综合一区| 亚亚洲乱码一二三四区| 亚洲av日韩av制服丝袜| 国产91全国探花系列在线播放| 亚洲精品不卡午夜精品| 久久亚洲日本不卡一区二区| 国产一区二区色淫影院| 色天天综合| 亚洲精品第五页| vvvv98国产成人综合青青| 美女免费精品高清毛片在线视| 456亚洲人成高清在线| 亚洲国产亚综合在线区| 九九精品在线观看| 久久青草精品一区二区三区| 在线国产91| 国产在线日本| 精品福利网| 成人综合网址| 精品久久人人爽人人玩人人妻| 蝌蚪国产精品视频第一页| 任我操在线视频| 99热最新网址| 国产乱子精品一区二区在线观看| 亚洲最大福利网站| 亚洲精品视频在线观看视频| 在线精品亚洲一区二区古装| 伊人久久精品亚洲午夜| 狠狠色婷婷丁香综合久久韩国| 久久久久久久久亚洲精品| 男人天堂亚洲天堂| 日韩福利在线观看| 国产亚洲美日韩AV中文字幕无码成人| 亚洲综合色区在线播放2019| 国产亚洲欧美日韩在线观看一区二区| 永久免费精品视频| 国产Av无码精品色午夜| 日韩午夜伦| 四虎国产成人免费观看| 91精品最新国内在线播放| 精品亚洲国产成人AV| 美女潮喷出白浆在线观看视频| 亚洲欧洲AV一区二区三区| 欧美亚洲日韩中文| 再看日本中文字幕在线观看| 国产人成乱码视频免费观看| 日韩欧美成人高清在线观看| 欧美精品aⅴ在线视频| 欧美性猛交xxxx乱大交极品| 伊人无码视屏| 国产乱子伦精品视频| 黄色国产在线| 国产精品亚洲一区二区在线观看| 波多野结衣无码AV在线|