天天看點

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

一、Cloudera Manager/CDH5

1、關于cloudera manager和CDH是什麼,這裡不做詳細介紹了。有官網和百科介紹。

附上官網位址:cloudera manager

2、官網的安裝指南

官方文檔提供了三種安裝方式:線上自動安裝/手動安裝包安裝/手動使用cloudera manager管理安裝

此處使用第三種方式安裝hadoop叢集。

二、環境規劃

1、系統:CentOS 6.4_x86

 master:4G記憶體,硬碟盡量大容量

 slave1:2G記憶體,硬碟盡量大容量

 slave2:2G記憶體,硬碟盡量大容量

2、Cloudera Manager 5.3.3

3、CDH 5.3.3

安裝包下載下傳:

  • Cloudera Manager 5.3.3:http://archive-primary.cloudera.com/cm5/cm/5/
  • CDH 5.5.5:http://archive-primary.cloudera.com/cdh5/parcels/5.3.3/

下載下傳軟體包:

  1. CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel
  2. CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha1
  3. manifest.json

三、系統環境準備工作

  • 此次執行權限均為root使用者
  • 所有的機器都必須ssh互信模式
  • 修改主機名使用hosts檔案或者DNS伺服器
  • 關閉iptables和selinux
  • 解除安裝系統自帶的openjdk,安裝oracle的jdk
  • master節點安裝mysql
  • 所有節點的時間必須同步(ntp伺服器或其他方法)
  • 修改所有節點的核心參數

    i. echo 0 > /proc/sys/vm/swappiness

    ii.echo never > /sys/kernel/mm/redhat_transparent_hugepage/defrag

四、正式開始安裝

1、cloudera manager預設的目錄是在/opt下,解壓到/opt目錄下。

# tar xf cloudera-manager-el6-cm5.3.3_x86_64.tar.gz -C /opt/
# ls /opt/
cloudera  cm-5.3.3
#
# 安裝mysql-connector-java
# yum -y install mysql-connector-java      

2、初始化資料庫

# /opt/cm-5.3.3/share/cmf/schema/scm_prepare_database.sh mysql cm -hlocalhost -uroot -p123456 --scm-host localhost scm scm scm
# mysql -uroot -p123456 -e "show databases;"    檢視下cm資料庫是否建立成功      

3、複制資料到其他節點

# 修改配置檔案server_host為master節點的主機名
# grep server_host /opt/cm-5.3.3/etc/cloudera-scm-agent/config.ini
    server_host=master
# scp -rp /opt/cm-5.3.3 slave1:/opt/
# scp -rp /opt/cm-5.3.3 slave2:/opt/
#
# 每個節點建立系統使用者
# useradd --system --home=/opt/cm-5.3.3/run/cloudera-scm-server --no-create-home --shell=/bin/false --comment "cloudera scm user" cloudera-scm      

4、資料庫的配置

# hive
# create database hive DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
# active monitor
# create database amon DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
# 授權master主機
# grant all on *.* to 'root'@'master' identified by 'PASSWD';      

5、準備parcels安裝包到/opt/cloudera/parcel-repo/

# ls /opt/cloudera/parcel-repo/
CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel  CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha  manifest.json
# 注意:CDH-5.3.3-1.cdh5.3.3.p0.5-el6.parcel.sha下載下傳後的檔案重命名的
#
# 啟動master節點的server和agent腳本
# /opt/cm-5.3.3/etc/init.d/cloudera-scm-agent start
# /opt/cm-5.3.3/etc/init.d/cloudera-scm-server start
# server端口啟動較慢
#
# 啟動其他所有節點的agent腳本
# /opt/cm-5.3.3/etc/init.d/cloudera-scm-agent start      

五、CDH 5安裝配置

1、通路http://master-ip:7180端口開始安裝

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

登陸名:admin 密碼:admin

2、選擇一個版本進行安裝,此處選擇第一個免費版。然後下一步-->下一步

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

3、選中所有主機:

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

4、如果配置正确,會出現如下界面

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

5、然後繼續下一步,由于我們已經下載下傳了離線包,是以下載下傳是很快就能完成的

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

6、主機檢測,檢測主機是否符合安裝要求,符合要求後會全部通過,否則請按照要求設定

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

7、然後選擇需要安裝的軟體包,可以全選或自定義,也可以選擇內建了某一個元件功能的軟體包來安裝

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

8、角色配置設定,此處預設,可以按需調整

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

9、資料庫測試:

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

10、稽核更改參數,可以使用預設,也可以按需更改

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

11、啟動正常的安裝配置了,等待安裝完成後再次通路首頁即可。

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

12、完成後的登陸界面

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

由于主機性能較低,資料延遲很大,查詢經常無法顯示。而且由于此處的磁盤空間不足,是以有很多警告資訊。到此安裝已全部完成。

六、其他問題說明

oozie的web界面的開啟:

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

cloudera的文檔中有說明配置oozie:

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

安裝這個操作即可:

# mv ext-2.2.zip /var/lib/oozie/
# cd /var/lib/oozie
# unzip ext-2.2.zip      

重新整理界面:

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

hadoop2.x版本更新了一些新功能,支援HDFS的高可用等。cloudera manager管理界面可以直接操作等這一系列的功能,還是很友善的。

在叢集裡的HDFS界面的右上角有操作選項欄:

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

點選後根據提示就能正常的配置了。管理界面添加移除叢集中的主機也是非常友善的,具體的操作就不一一示範了。

七、Hadoop測試程式

# 計算pi值
# sudo -u hdfs hadoop jar /opt/cloudera/parcels/CDH/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar pi 10 100
...
Job Finished in 126.439 seconds
Estimated value of Pi is 3.14800000000000000000
# 可以看到執行結果      

可以在YARN的web界面看到詳細job的資訊

基于Cloudera Manager 5和CDH5(版本5.3.3)的Hadoop叢集安裝

還有很多測試程式可以運作測試。這裡就不一一示範了。

另外,這種安裝方式雖然快捷友善,但是不利于對整體的了解,建議還是使用下載下傳安裝包的方式安裝,配置檔案等都是需要手動編寫的,對于了解比較深刻。

繼續閱讀