999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Ambari快速部署Hadoop大數據集群環境研究

2021-05-20 07:03:08胡必波劉曉娟廣州工商學院
江蘇通信 2021年2期
關鍵詞:進程界面數據庫

胡必波 彭 梅 劉曉娟廣州工商學院

0 引言

大數據實驗環境的搭建涉及Linux系統、虛擬機軟件、JDK、Hadoop、Spark、HBase、Hive等多種開源軟件的安裝,安裝過程涉及大量配置,不易快速集成和維護,給Hadoop平臺的實踐課程教學帶來了很大的挑戰。廣州工商學院雖然引入了青軟QST大數據“云桌面”解決方案,學生在本地終端通過校園網連接到QST大數據服務器,中央服務器為其分配一個虛擬機,學生在虛擬機上完成各種實驗操作。但這種方案受限于校園局域網絡,而且機房統一上機的時間相對有限,不能很好地滿足教師和學生課后學習實踐大數據時的需求,仍然需要構建單機實驗環境進行線下輔助教學。本文通過實踐探索,利用Ambari快速部署Hadoop集群環境,簡化了集群供應,只需要一臺物理計算機就可以開展集群部署、監控和管理等實驗,既方便教學,又貼近實際生產應用環境。

1 VMware與Ambari

虛擬化技術是指通過虛擬化軟件VMM在一臺計算機上模擬出一個或多個虛擬化環境。虛擬化常見的類型有:系統虛擬化、服務器虛擬化、桌面虛擬化、存儲虛擬化、網絡虛擬化以及應用虛擬化等,其中,系統虛擬化是指使用VMware Workstation等虛擬化軟件在物理計算機上虛擬出一個邏輯操作系統(虛擬機)來安裝和使用另一個操作系統及其應用程序,互不影響使用。

Apache Ambari是一種基于Web的工具,支持Apache Hadoop集群的安裝、部署、配置和管理,支持包括HDFS、MapReduce、Hive、Pig、HBase、Zookeeper、Sqoop等大多數Hadoop組件。Ambari從集群節點和服務收集大量信息,并將其表現為容易使用的、集中化的接口,如Ambari Web、Restful API等;Ambari Web顯示諸如服務特定的摘要、圖表以及警報信息。可通過Ambari Web對Hadoop集群進行創建、管理、監視、添加主機、更新服務配置等;也可以利用Ambari Web執行集群管理任務,例如,啟用Kerberos安全以及執行Stack升級。任何用戶都可以查看Ambari Web特性。擁有administrator角色的用戶比operator或view-only的用戶能訪問的選項更多。例如,Ambari administrator可以管理集群安全,一個operator用戶可以監控集群,而view-only用戶只能訪問系統管理員已授予的必要權限。

Ambari自身也是一個分布式架構的軟件,主要由兩部分組成:Ambari Server和Ambari Agent。Ambari Server從整個集群中收集信息。每個主機上都有Ambari Agent,Ambari Server通過Ambari Agent控制每個主機。簡單來說,用戶通過Ambari Server通知Ambari Agent安裝對應的軟件;Agent會定時發送各個機器中每個軟件模塊的狀態給Ambari Server,最終這些狀態信息會呈現在Ambari的GUI,方便用戶了解到集群的各種狀態,并進行相應的維護。Ambari Server架構如圖1所示。

圖1 Ambari Server架構

2 Hadoop集群部署

2.1 部署節點規劃

本文以4臺節點為例,來組建Hadoop分布式集群,系統版本采用的是Linux發行版 CentOS7(64位)。根據如表1所示的資源配置來組建大數據基礎平臺。

表1 Hadoop集群主機規劃

2.2 環境準備

(1)下載安裝包。通過ambari安裝需要下載下面的5個主要包:ambari-2.6.1.5+HDP-2.6.4.0+HDP-UTILS-1.1.0.22+HDPGPL-2.6.4.0+JDK1.8+MySQL5.6,所有的安裝包加起來共約9 G,建議從官網下載軟件包,然后上傳到服務器,通過配置本地源的方式來實現離線安裝。HDP是hortonworks的軟件棧,包含了hadoop生態系統的所有軟件項目,比如HBase、Zookeeper、Hive、Pig等,HDP-UTILS是工具類庫。

(2)關閉服務。為了方便集群節點的互相通信,應先關閉各節點的firewalld、iptables、selinux等服務。此外,還應關閉THP,否則Hadoop的系統CPU使用率很高。操作系統后臺的khugepaged進程會一直掃描所有進程占用的內存,在可能的情況下,會把4k page交換為Huge Pages。在該過程中,對于操作中內存的各種分配活動都需要各種內存鎖,直接影響程序的內存訪問性能,且該過程對于應用是透明的,在應用層面不可控制,對于專門為4k page優化的程序來說,可能會造成隨機性能下降。同時,建議最大打開文件描述符數為10000或更多。

(3)配置同步時鐘。集群中的各節點需要安裝并啟動ntp服務,以保證集群時間的一致。在各節點安裝ntp服務后,設置master為主服務器開啟nptd服務,各子節點slave1、slave2、slave3設置同步。在master開啟ntp服務器以后,其余子節點就不需要開啟,如果發現NTP啟動之后時間并不同步,可直接使用定時手動同步的方式。

(4)配置SSH無密碼登陸。由于部署過程中,配置master節點無密碼登錄到其他節點,可通過復制master節點.ssh/id_rsa.pub至其他節點的.ssh/authorized _ keys文件中實現。在通過測試是否實現了無密碼登錄后,可將創建的秘鑰拷貝出來,因為后面ambari安裝時需要上傳該秘鑰。創建秘鑰是在隱藏文件夾/root/.ssh/下面的,所以,需要先把秘鑰拷貝到可見區域,然后拷貝到電腦上。只需保證master免密到其他節點(包含自身),不需要互通。

(5)制作本地源。在master需要先安裝httpd服務并設置為開機啟動,然后在/var/www/html根目錄下新建ambari目錄,開啟FTP服務后,將前面下載的ambari 2.6.0+ HDP 2.6.3+ HDP-UTILS 1.1.0這3個包拷貝到該目錄下,再進行解壓縮操作,并通過http∶//192.168.137.140/ambari/查看訪問master是否能成功訪問。在master安裝本地源制作相關工具后,修改文件里面的源地址,將其拷貝到/etc/yum.repos.d/,最后拷貝分發到各子節點slave1、slave2、slave3。

(6)安裝ambari-server。執行相關命令完成ambari -Server、ambari-agent安裝。ambari -Server有兩種安裝模式可供選擇,一種是默認postgresql數據庫的安裝方式,但不推薦在生產環境中使用;還有一種方式是使用MySQL等第三方數據庫安裝方式。若采用第三方數據庫形式,需要在master主機先安裝配置好MySQL。MySQL安裝成功后,需要通過mysql-connection-java.jar包建立MySQL與ambari-server的連接,并在MySQL數據庫創建ambari數據庫及數據庫的用戶名和密碼、創建hive數據庫及hive庫的用戶名和密碼、創建oozie數據庫及oozie庫的用戶名和密碼。

3 部署與管理Hadoop集群

3.1 部署Hadoop集群

執 行“ambari-server start” 命 令, 登 錄http∶//192.168.137.140/8080,在“用戶名”的文本框中輸入“admin”,在“密碼”的文本框中輸入“admin”,可進入Ambari管理界面。

在“選擇安裝棧”時,指定安裝源HDP和HDP -UTILS的位置。指定相應的目標主機并選擇手動注冊主機,選擇所需要安裝的服務。本文需要安裝HDFS、YARN+MapReduce2、Zookeeper、Ambari Metrics、Hive、HBase、Mahout、Sqoop、Spark等服務。在整個過程需要設置Grafana Admin和Hive的密碼。

3.2 管理Hadoop 集群

單擊頁面導航欄的“主界面”按鈕,在主界面可以查看集群狀態和監控信息;單擊頁面導航欄的“主界面”按鈕,在主界面可以查看集群狀態和監控信息,如圖2所示。至此,大數據基礎平臺已經部署完畢了。

圖2 Ambari平臺主界面

Ambari的用戶圖形界面非常有助于平臺管理員去管理維護和監控Hadoop集群。在Hadoop集群部署完成后,打開部署Ambari Server主機的8080端口。默認的管理員用戶名為admin,密碼為admin。登錄后進入Ambari管理的Hadoop集群主界面。該界面形象展示了集群服務的運行狀態、資源使用狀況、配置參數以及錯誤告警等。

(1)服務管理。在頁面左側的服務列表中,可以選中任何一個想要操作的服務。以HDFS為例,選擇HDFS的“概要”選項卡,顯示HDFS運行的進程信息,包括運行狀態、資源使用情況以及監控信息。

(2)主機管理。單擊頁面導航欄中“主機”按鈕,打開Ambari所管理的主機列表。進入其中一臺主機中(如master),可以看到,該主機中所有進程的運行狀態、主機資源使用情況、主機的IP地址、資源械等信息。

(3)進程管理。每個服務都由相應的進程組成,如HDFS服務,包含了NameNode、SNameNode、DateNode等進程。進入master節點中,找到需要進行管理的進程,如NameNode,該進程后面有個“Started”按鈕,表示該進程正在運行中,單擊該按鈕可以改變進程的運行狀態,如“重啟”“停止”“移動”“打開維護模式”“均衡HDFS”等。如圖3所示。

(4)配置管理。Ambari管理工具可以很方便地修改配置文件,并應用到集群的每一臺主機中,尤其是當集群中主機的數量非常多時。例如,需要修改集群HDFS文件系統,Block的復制因子(Block replication)為2,手動部署集群的情況下,則要修改每一臺主機的hdfs-site.xml配置文件。如果一個集群有幾十臺或者幾百臺主機,工作量將非常大。而Ambari集群管理工具則可以很好地應對,由集群中的Ambari Server向每臺主機中的Ambari Agent發送相關的心跳信息,由此更新每臺主機中的配置文件。如圖4所示。

圖3 主機管理界面

圖4 配置管理界面

4 結束語

傳統的手動安裝、修改配置文件搭建hadoop平臺的方法,雖然能大致了解hadoop基本的部署過程,但是實際生產過程中不可能采用這種全手工的方法,后續還涉及安裝HBase/Hive/Spark/Storm之類的上層應用,以及管理監控平臺,過程相對繁瑣。本文利用優秀的分布式集群管理工具Ambari部署工具來構建大數據平臺并對集群進行管理的方法,實現了自動化部署+管理監控,大大提高部署Hadoop集群的效率及成功率,適用于在高校教學環境以及大規模Hadoop節點部署場景中使用,但也存在穩定性差、部署的宿主機內存要求較高、屏蔽很多細節、難以對Hadoop生態圈各組件的深入理解等缺點。因此,也不能完全摒棄傳統方法,而是將其作為自動化方法的補充,讀者可以根據實際情況選用。

猜你喜歡
進程界面數據庫
國企黨委前置研究的“四個界面”
當代陜西(2020年13期)2020-08-24 08:22:02
債券市場對外開放的進程與展望
中國外匯(2019年20期)2019-11-25 09:54:58
基于FANUC PICTURE的虛擬軸坐標顯示界面開發方法研究
數據庫
財經(2017年2期)2017-03-10 14:35:35
人機交互界面發展趨勢研究
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
手機界面中圖形符號的發展趨向
新聞傳播(2015年11期)2015-07-18 11:15:04
社會進程中的新聞學探尋
民主與科學(2014年3期)2014-02-28 11:23:03
主站蜘蛛池模板: 国产网站在线看| 真人免费一级毛片一区二区| 欧美、日韩、国产综合一区| 97国产在线观看| 久久久久久尹人网香蕉| 蜜臀AV在线播放| 欧美在线天堂| 久久国产成人精品国产成人亚洲| 日韩欧美国产综合| 精品国产成人国产在线| 久久国产亚洲偷自| 久久五月天综合| 色成人亚洲| 国产美女精品人人做人人爽| 亚洲欧美综合另类图片小说区| 欧美日韩导航| 久久毛片网| 国产va在线观看免费| 亚洲中文字幕久久精品无码一区| 欧美精品v欧洲精品| 在线日韩日本国产亚洲| 免费午夜无码18禁无码影院| 欧美中文一区| 一本久道热中字伊人| 国产91蝌蚪窝| 日韩高清在线观看不卡一区二区| 国产高清色视频免费看的网址| 国产色伊人| 欧美一级黄色影院| 久久永久免费人妻精品| 日韩无码白| 性视频久久| 国产第一福利影院| 免费va国产在线观看| 亚洲日韩精品伊甸| 免费高清a毛片| 九九九国产| 九九久久精品免费观看| 亚洲成aⅴ人在线观看| 欧美区一区| 一本大道无码日韩精品影视| 久久综合AV免费观看| 日韩最新中文字幕| 亚洲一级毛片免费观看| 97国产精品视频人人做人人爱| 污网站免费在线观看| 波多野结衣AV无码久久一区| 99re视频在线| 欧美日韩国产精品va| 5555国产在线观看| 九九热视频精品在线| 久久黄色小视频| 国产精品伦视频观看免费| 日韩精品亚洲精品第一页| 日本91视频| 欧美色视频日本| 免费高清毛片| 一级做a爰片久久免费| 91青青在线视频| 人妻精品久久无码区| 久久频这里精品99香蕉久网址| 幺女国产一级毛片| 国产午夜福利亚洲第一| 91色在线观看| 波多野结衣无码AV在线| 国产女人爽到高潮的免费视频| 亚洲成a人片| 国产在线麻豆波多野结衣| 亚洲va在线观看| 亚洲精品国偷自产在线91正片| AV片亚洲国产男人的天堂| 激情無極限的亚洲一区免费| 亚洲区第一页| 欧美在线天堂| 国产欧美精品一区二区| av一区二区三区在线观看| a亚洲天堂| 蜜桃视频一区| 伊人福利视频| 18禁高潮出水呻吟娇喘蜜芽| 狂欢视频在线观看不卡| 久久人人97超碰人人澡爱香蕉|