激情久久久_欧美视频区_成人av免费_不卡视频一二三区_欧美精品在欧美一区二区少妇_欧美一区二区三区的

服務器之家:專注于服務器技術及軟件下載分享
分類導航

Linux|Centos|Ubuntu|系統(tǒng)進程|Fedora|注冊表|Bios|Solaris|Windows7|Windows10|Windows11|windows server|

服務器之家 - 服務器系統(tǒng) - Centos - 在CentOS中搭建Hadoop的詳細步驟

在CentOS中搭建Hadoop的詳細步驟

2022-03-05 20:08德維恩魏 Centos

這篇文章主要介紹了在CentOS中搭建Hadoop的詳細步驟,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧

搭建說明:第一次搭建 hadoop 的小伙伴,請嚴格按照文章中的軟件環(huán)境和步驟搭建,不一樣的版本都可能會導致問題。

軟件環(huán)境:

虛擬機:vmware pro14

linux:centos-6.4(下載dvd版本即可)

jdk:openjdk1.8.0 (強力建議不要使用 oracle 公司的 linux 版本的 jdk)

hadoop:2.6.5(下載地址

虛擬機的安裝和linux系統(tǒng)的安裝這里就省略了,可以參照網(wǎng)上的教程安裝,一般沒什么大問題,需要注意的是記住這里你輸入的用戶密碼,下面還要用,如下圖所示。

在CentOS中搭建Hadoop的詳細步驟

設置用戶密碼.jpg

用戶選擇

使用虛擬機安裝好系統(tǒng)后,可以看到登錄界面,如下圖所示。

在CentOS中搭建Hadoop的詳細步驟

選擇 other ,在 username 輸入框中輸入 root ,回車,再在 password 輸入框中輸入你創(chuàng)建用戶時密碼。root 用戶是安裝 centos 自動創(chuàng)建的超級用戶,但密碼和你安裝系統(tǒng)時創(chuàng)建的普通用戶密碼是一樣的。

平時在使用 centos 時,并不推薦使用 root 用戶,因為該用戶具有整個系統(tǒng)的最高權限,使用該用戶可能會導致嚴重的后果,但前提是你對 linux 很熟,才會誤操作。搭建 hadoop 的大數(shù)據(jù)平臺,使用普通用戶,很多命令需要 sudo 命令來獲取 root 用戶的權限,比較麻煩,所以索性直接使用 root 用戶。

安裝ssh

集群、單節(jié)點模式都需要用到 ssh 登陸(類似于遠程登陸,你可以登錄某臺 linux 主機,并且在上面運行命令)。

首先確保你的 centos 系統(tǒng)可以正常的上網(wǎng),你可以查看桌面右上角的網(wǎng)絡圖標,若顯示紅叉則表明未聯(lián)網(wǎng),可點擊選擇可用網(wǎng)絡,也可以使用桌面左上角的火狐瀏覽器輸入網(wǎng)址驗證是否網(wǎng)絡連接正常。如果還是無法上網(wǎng),檢查虛擬機的設置,選用 nat 模式,或者上網(wǎng)百度解決。

在CentOS中搭建Hadoop的詳細步驟

檢查網(wǎng)絡狀況.jpg

確定網(wǎng)絡連接正常后,打開 centos 的終端,可在 centos 的桌面點擊鼠標右鍵,選擇 open in terminal ,如下圖所示。

在CentOS中搭建Hadoop的詳細步驟

打開終端.jpg

一般情況下,centos 默認已安裝了 ssh client、ssh server,可打開終端執(zhí)行如下命令進行檢驗:

?
1
rpm -qa | grep ssh

如果返回的結果如下圖所示,包含了 ssh client 跟 ssh server,則不需要再安裝。

在CentOS中搭建Hadoop的詳細步驟

查看ssh是否已安裝.jpg

如果需要安裝,則可以通過 yum 這個包管理器進行安裝。(安裝過程中會讓你輸入 [y/n],輸入 y 即可)

注意:命令是單條執(zhí)行的,不是直接把兩條命令粘貼過去。

終端中的粘貼可通過鼠標點擊右鍵選擇 paste 粘貼,也可通過快捷鍵 【shift + insert】粘貼。

?
1
2
yum install openssh-clients
yum install openssh-server

ssh安裝完成后,執(zhí)行如下命令測試一下 ssh 是否可用(ssh首次登陸提示 yes/no 信息,輸入 yes 即可,然后按照提示輸入 root 用戶的密碼,這樣就登錄到本機了),如下圖所示。

在CentOS中搭建Hadoop的詳細步驟

首次登錄ssh.jpg

但這樣登陸需要每次都輸入密碼,我們需要配置成ssh無密碼登陸比較方便。

首先輸入 exit 退出剛才的 ssh,就回到了我們原先的終端窗口,然后利用 ssh-keygen 生成密鑰,并將密鑰加入到授權中。

?
1
2
3
4
5
exit       # 退出剛才的 ssh localhost
cd ~/.ssh/      # 若提示沒有該目錄,請先執(zhí)行一次ssh localhost
ssh-keygen -t rsa    # 會有提示,都按回車即可
cat id_rsa.pub >> authorized_keys # 加入授權
chmod 600 ./authorized_keys # 修改文件權限

此時再用 ssh localhost 命令,無需輸入密碼就可以直接登陸了,如下圖所示。

在CentOS中搭建Hadoop的詳細步驟

再次登錄ssh.jpg

安裝 java 環(huán)境

java 環(huán)境可選擇 oracle 的 jdk,或是 openjdk(可看作 jdk 的開源版本),現(xiàn)在一般 linux 系統(tǒng)默認安裝的基本是 openjdk,這里安裝的是 openjdk1.8.0版本的。

有的 centos 6.4 默認安裝了 openjdk 1.7,這里我們可以使用命令檢查一下,和 windows 下的命令一樣,還可以查看 java_home 這個環(huán)境變量的值。

?
1
2
3
java -version     # 查看 java 的版本
javac -version    # 查看編譯命令 javac 的版本
echo $java_home    # 查看 $java_home 這個環(huán)境變量的值

如果系統(tǒng)沒有安裝 openjdk,我們可以通過 yum 包管理器來安裝。(安裝過程中會讓輸入 [y/n],輸入 y 即可)

 

復制代碼 代碼如下:

yum install java-1.8.0-openjdk  java-1.8.0-openjdk-devel  #安裝 openjdk1.8.0

 

通過上述命令安裝 openjdk,默認安裝位置為 /usr/lib/jvm/java-1.8.0,下面配置 java_home 時就使用這個位置。

接著需要配置一下 java_home 環(huán)境變量,為了方便,直接在 ~/.bashrc 中進行設置,相當于配置的是 windows 的用戶環(huán)境變量,只對單個用戶生效,當用戶登錄后,每次打開 shell 終端,.bashrc 文件都會被讀取。

修改文件,可以直接使用 vim 編輯器打開文件,也可以使用類似于 windows 記事本的 gedit 文本編輯器。

下面命令任選其一。

?
1
2
vim ~/.bashrc    # 使用 vim 編輯器在終端中打開 .bashrc 文件
gedit ~/.bashrc    # 使用 gedit 文本編輯器打開 .bashrc 文件

在文件最后面添加如下單獨一行(指向 jdk 的安裝位置),并 保存

在CentOS中搭建Hadoop的詳細步驟

配置java_home環(huán)境變量.jpg

接著還需要讓該環(huán)境變量生效,執(zhí)行如下命令。

?
1
source ~/.bashrc    # 使變量設置生效

設置好后我們來檢驗一下是否設置正確,如下圖所示。

?
1
2
3
4
echo $java_home  # 檢驗變量值
java -version
javac -version
$java_home/bin/java -version # 與直接執(zhí)行 java -version 一樣

在CentOS中搭建Hadoop的詳細步驟

檢查java_home環(huán)境變量是否配置正確.jpg

這樣,hadoop 所需的 java 運行環(huán)境就安裝好了。

安裝 hadoop

在前面 軟件環(huán)境 已經(jīng)給出了 hadoop2.6.5 的下載地址,可以直接通過火狐瀏覽器打開下載,默認下載位置是在用戶的 home 中的 downloads 文件夾下,如下圖所示。

在CentOS中搭建Hadoop的詳細步驟

下載hadoop.jpg

下載完成后,我們將 hadoop 解壓到 /usr/local/ 中。

?
1
2
3
4
tar -zxf ~/下載/hadoop-2.6.5.tar.gz -c /usr/local # 解壓到/usr/local目錄中
cd /usr/local/       # 切換當前目錄為 /usr/local 目錄
mv ./hadoop-2.6.5/ ./hadoop   # 將文件夾名改為hadoop
chown -r root:root ./hadoop   # 修改文件權限,root 是當前用戶名

hadoop 解壓后即可使用,輸入如下命令來檢查 hadoop 是否可用,成功則會顯示 hadoop 版本信息。

?
1
2
cd /usr/local/hadoop     # 切換當前目錄為 /usr/local/hadoop 目錄
./bin/hadoop version     # 查看 hadoop 的版本信息

或者直接輸入 hadoop version 命令也可以查看。

?
1
hadoop version       # 查看 hadoop 的版本信息

在CentOS中搭建Hadoop的詳細步驟

查看hadoop版本信息.jpg

hadoop 安裝方式有三種,分別是單機模式,偽分布式模式,分布式模式。

單機模式:hadoop 默認模式為非分布式模式(本地模式),無需進行其他配置即可運行。非分布式即單 java 進程,方便進行調試。

偽分布式模式:hadoop 可以在單節(jié)點上以偽分布式的方式運行,hadoop 進程以分離的 java 進程來運行,節(jié)點既作為 namenode 也作為 datanode,同時,讀取的是 hdfs 中的文件。

分布式模式:使用多個節(jié)點構成集群環(huán)境來運行hadoop,需要多臺主機,也可以是虛擬主機。

hadoop 偽分布式配置

現(xiàn)在我們就可以來使用 hadoop 運行一些例子,hadoop 附帶了很多的例子,可以運行 hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.5.jar 看到所有的例子。

我們這里來運行一個查詢的例子,將 input 文件夾作為輸入文件夾,篩選當中符合正則表達式 dfs[a-z.]+ 的單詞,統(tǒng)計它的次數(shù),將篩選結果輸出到 output 文件夾中。

?
1
2
3
4
5
cd /usr/local/hadoop  # 切換當前目錄為 /usr/local/hadoop 目錄
mkdir ./input    # 在當前目錄下創(chuàng)建 input 文件夾
cp ./etc/hadoop/*.xml ./input # 將 hadoop 的配置文件復制到新建的輸入文件夾 input 中
./bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep ./input ./output 'dfs[a-z.]+'
cat ./output/*    # 查看輸出結果

通過命令 cat ./output/* 查看結果,符合正則的單詞 dfsadmin 出現(xiàn)了 1次。

在CentOS中搭建Hadoop的詳細步驟

運行測試hadoop例子.jpg

若運行出錯,如出現(xiàn)如下圖提示。

在CentOS中搭建Hadoop的詳細步驟

運行hadoop例子出錯.jpg

若出現(xiàn)提示 “warn util.nativecodeloader: unable to load native-hadoop library for your platform… using builtin-java classes where applicable”,該 warn 提示可以忽略,不影響 hadoop 正常運行。

注意:hadoop 默認不會覆蓋結果文件,因此再次運行上面實例會提示出錯,需要先將 output 文件夾刪除。

?
1
rm -rf ./output  # 在 /usr/local/hadoop 目錄下執(zhí)行

測試我們的 hadoop 安裝沒有問題,我們可以開始設置 hadoop 的環(huán)境變量,同樣在 ~/.bashrc 文件中配置。

?
1
gedit ~/.bashrc # 使用 gedit 文本編輯器打開 .bashrc 文件

在 .bashrc 文件最后面增加如下內容,注意 hadoop_home 的位置對不對,如果都是按照前面的配置,這部分可照抄。

?
1
2
3
4
5
6
7
8
9
# hadoop environment variables
export hadoop_home=/usr/local/hadoop
export hadoop_install=$hadoop_home
export hadoop_mapred_home=$hadoop_home
export hadoop_common_home=$hadoop_home
export hadoop_hdfs_home=$hadoop_home
export yarn_home=$hadoop_home
export hadoop_common_lib_native_dir=$hadoop_home/lib/native
export path=$path:$hadoop_home/sbin:$hadoop_home/bin

在CentOS中搭建Hadoop的詳細步驟

hadoop環(huán)境變量的配置.jpg

保存后記得關掉 gedit 程序,否則會占用終端,無法執(zhí)行下面的命令,可以按 【ctrl + c】鍵終止該程序。

保存后,不要忘記執(zhí)行如下命令使配置生效。

?
1
source ~/.bashrc

hadoop 的配置文件位于 /usr/local/hadoop/etc/hadoop/ 下,偽分布式需要修改2個配置文件 core-site.xmlhdfs-site.xml 。hadoop的配置文件是 xml 格式,每個配置以聲明 property 的 name 和 value 的方式來實現(xiàn)。

修改配置文件 core-site.xml (通過 gedit 編輯會比較方便,輸入命令, gedit ./etc/hadoop/core-site.xml )。

<configuration></configuration> 中間插入如下的代碼。

?
1
2
3
4
5
6
7
8
9
10
11
<configuration>
 <property>
 <name>hadoop.tmp.dir</name>
 <value>file:/usr/local/hadoop/tmp</value>
 <description>abase for other temporary directories.</description>
 </property>
 <property>
 <name>fs.defaultfs</name>
 <value>hdfs://localhost:9000</value>
 </property>
</configuration>

同樣的,修改配置文件 hdfs-site.xml , gedit ./etc/hadoop/hdfs-site.xml

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
<configuration>
 <property>
 <name>dfs.replication</name>
 <value>1</value>
 </property>
 <property>
 <name>dfs.namenode.name.dir</name>
 <value>file:/usr/local/hadoop/tmp/dfs/name</value>
 </property>
 <property>
 <name>dfs.datanode.data.dir</name>
 <value>file:/usr/local/hadoop/tmp/dfs/data</value>
 </property>
</configuration>

配置完成后,執(zhí)行 namenode 的格式化。(hadoop 首次啟動需要該命令)

?
1
hdfs namenode -format

成功的話,會看到 “successfully formatted” 和 “exitting with status 0” 的提示,若為 “exitting with status 1” 則是出錯。

在CentOS中搭建Hadoop的詳細步驟

namenode格式化.jpg

接下來啟動 hadoop。

?
1
start-dfs.sh  # 開啟 namenode 和 datanode 進程

若出現(xiàn)如下 ssh 的提示 “are you sure you want to continue connecting”,輸入 yes 即可。

在CentOS中搭建Hadoop的詳細步驟

啟動hadoop注意事項.jpg

啟動完成后,可以通過命令 jps 來判斷是否成功啟動,若出現(xiàn)下面 namenode、datanode、secondarynamenode、jps 四個進程,則 hadoop 啟動成功。

?
1
jps  # 查看進程判斷 hadoop 是否啟動成功

在CentOS中搭建Hadoop的詳細步驟

判斷hadoop是否啟動成功.jpg

成功啟動后,也可以訪問 web 界面 http://localhost:50070 查看 namenode 和 datanode 信息,還可以在線查看 hdfs 中的文件。

在CentOS中搭建Hadoop的詳細步驟

hadoop正常啟動web界面.jpg

啟動yarn

yarn 是從 mapreduce 中分離出來的,負責資源管理與任務調度。yarn 運行于 mapreduce 之上,提供了高可用性、高擴展性。(偽分布式不啟動 yarn 也可以,一般不會影響程序執(zhí)行)

上述通過 start-dfs.sh 命令啟動 hadoop,僅僅是啟動了 mapreduce 環(huán)境,我們可以啟動 yarn ,讓 yarn 來負責資源管理與任務調度。

首先修改配置文件 mapred-site.xml ,需要先將 mapred-site.xml.template 文件的重命名為 mapred-site.xml。

?
1
2
mv ./etc/hadoop/mapred-site.xml.template ./etc/hadoop/mapred-site.xml # 文件重命名
gedit ./etc/hadoop/mapred-site.xml         # 用gedit 文本編輯器打開
?
1
2
3
4
5
6
<configuration>
 <property>
 <name>mapreduce.framework.name</name>
 <value>yarn</value>
 </property>
</configuration>

接著修改配置文件 yarn-site.xml 。

?
1
gedit ./etc/hadoop/yarn-site.xml # 用gedit 文本編輯器打開
?
1
2
3
4
5
6
<configuration>
 <property>
 <name>yarn.nodemanager.aux-services</name>
 <value>mapreduce_shuffle</value>
 </property>
</configuration>

然后就可以啟動 yarn 了,執(zhí)行 start-yarn.sh 命令。

注意:在啟動 yarn 之前,要確保 dfs hadoop 已經(jīng)啟動,也就是執(zhí)行過 start-dfs.sh

?
1
2
start-yarn.sh   # 啟動yarn
mr-jobhistory-daemon.sh start historyserver # 開啟歷史服務器,才能在web中查看任務運行情況

開啟后通過 jps 查看,可以看到多了 nodemanager 和 resourcemanager 兩個進程,如下圖所示。

在CentOS中搭建Hadoop的詳細步驟

啟動yarn.jpg

啟動 yarn 之后,運行實例的方法還是一樣的,僅僅是資源管理方式、任務調度不同。啟動 yarn 有個好處是可以通過 web 界面查看任務的運行情況: http://localhost:8088/cluster 如下圖所示。

在CentOS中搭建Hadoop的詳細步驟

yarn的web界面.jpg

yarn 主要是為集群提供更好的資源管理與任務調度,如果不想啟動 yarn,務必把配置文件 mapred-site.xml 重命名,改成 mapred-site.xml.template,需要用時改回來就行。否則在該配置文件存在,而未開啟 yarn 的情況下,運行程序會提示 “retrying connect to server: 0.0.0.0/0.0.0.0:8032” 的錯誤,這也是為何該配置文件初始文件名為 mapred-site.xml.template。

關閉 yarn 的命令如下,開啟是 start,關閉是 stop。

?
1
2
stop-yarn.sh
mr-jobhistory-daemon.sh stop historyserver

在平時的學習中,我們使用偽分布式就足夠了。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持服務器之家。

原文鏈接:https://www.jianshu.com/p/2627e2e1774f

延伸 · 閱讀

精彩推薦
  • CentosCentOS7設置日期和時間方法以及基本概念介紹

    CentOS7設置日期和時間方法以及基本概念介紹

    這篇文章主要介紹了CentOS7設置日期和時間方法以及基本概念介紹,本文講解使用CentOS7中的新命令timedatectl設置日期時間方法,需要的朋友可以參考下 ...

    CentOS之家6522019-09-19
  • Centoscentos 安裝與操作方法

    centos 安裝與操作方法

    這篇文章主要介紹了centos 安裝與操作方法,需要的朋友可以參考下...

    centos之家5272019-07-11
  • Centoscentos不小心刪除/root目錄該如何解決?

    centos不小心刪除/root目錄該如何解決?

    一些朋友最近在問小編centos不小心刪除/root目錄該如何解決?今天小編就為大家分享centos不小心刪除/root目錄解決辦法;希望對大家會有幫助,有需要的朋友...

    腳本之家8022019-05-29
  • CentosCentOS下Uptime命令詳解

    CentOS下Uptime命令詳解

    在Linux下,我們可以使用uptime命令,而且此命令不必使用root權限。uptime命令在系統(tǒng)中已經(jīng)默認安裝了。今天小編為大家?guī)淼氖荂entOS下Uptime命令詳解;希望...

    CentOS之家11482019-06-19
  • CentosCentos 7開啟網(wǎng)卡自動獲取IP的詳細方法

    Centos 7開啟網(wǎng)卡自動獲取IP的詳細方法

    本篇文章主要介紹了Centos 7開啟網(wǎng)卡自動獲取IP的詳細方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧...

    凌鋒8972021-12-29
  • CentosCentos7運用/dev/shm進行網(wǎng)站優(yōu)化

    Centos7運用/dev/shm進行網(wǎng)站優(yōu)化

    這篇文章主要介紹了LINUX中Centos7運用/dev/shm進行網(wǎng)站優(yōu)化相關知識點,對此有興趣的朋友參考學習下。...

    彬菌9912022-03-02
  • CentosCentOS6.5下Redis安裝與配置詳細步驟

    CentOS6.5下Redis安裝與配置詳細步驟

    本篇文章主要介紹了CentOS6.5下Redis安裝與配置詳細步驟,詳細介紹redis單機單實例安裝與配置,服務及開機自啟動。有興趣的可以了解一下。...

    飛流11452021-12-24
  • CentosCentOS 6.6實現(xiàn)永久修改DNS地址的方法

    CentOS 6.6實現(xiàn)永久修改DNS地址的方法

    這篇文章主要介紹了CentOS 6.6實現(xiàn)永久修改DNS地址的方法,涉及針對CentOS配置文件的相關設置技巧,具有一定參考借鑒價值,需要的朋友可以參考下 ...

    Linux社區(qū)4472020-08-21
主站蜘蛛池模板: 国产在线精品区 | 欧美日韩综合视频 | 叶子楣成人爽a毛片免费啪啪 | 精品亚洲综合 | 成年片在线观看 | 久久国产亚洲视频 | 国产精品999在线观看 | 久久精品中文字幕一区二区三区 | 美国人成人在线视频 | 视频在线91| 久久久久国 | 高清国产午夜精品久久久久久 | 国产麻豆交换夫妇 | 国产精品一二三区在线观看 | 91短视频在线观看视频 | 黄色毛片视频在线观看 | 视频一区国产精品 | h视频在线观看免费 | 久久久国产精品网站 | 日韩高清电影 | 日本黄色大片免费观看 | a级欧美 | 高清做爰免费无遮网站挡 | 国产一区二区三区四区精 | 国产精品一区二区三区在线 | 亚洲人成中文字幕在线观看 | 国产亚洲精品久久久久久久久久 | 男女污视频在线观看 | 精精国产xxxx视频在线播放7 | 在线亚洲综合 | 久久亚洲精品国产一区 | 日本aⅴ在线 | 欧美a视频在线观看 | 国产噜噜噜噜久久久久久久久 | 深夜视频福利 | 女人叉开腿让男人桶 | 黄色片网站免费观看 | 免费毛片视频 | 欧美91看片特黄aaaa | 国产精品一二三区在线观看 | 亚洲嫩草av |