个人随笔
目录
最小化CentOS7系统安装伪分布式hadoop-2.8.5
2019-10-15 23:13:39

这里介绍如何安装Hadoop的伪分布式,步骤如下:

一、准备工作

参考我的博文 安装VMware15CentOS7镜像官网下载VMWare安装CentOS7超全图解最小系统Centos7进行网络配置以及 ifconfig和vim的安装等博文安装好虚拟机,以及用远程连接工具S额cureCRT可以连接到虚拟机上传下载文件。

1、安装java

可以选择上jdk官网下载jdk包,解压后将路径加入环境变量,这里直接用如下命令安装。

  1. yum install -y java-1.8.0-openjdk.x86_64
2、添加环境变量
  1. echo 'export JAVA_HOME=/usr/lib/jvm/jre
  2. export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/tools.jar' >> /etc/profile
  3. source /etc/profile
3、关闭防火墙
  1. systemctl stop firewalld.service #停止firewall
  2. systemctl disable firewalld.service #禁止firewall开机启动
4、关闭selinux

打开 /etc/sysconfig/selinux 文件把 SELINUX=enforcing 改为:SELINUX=disabled。

5、设置Hostname

我把机器的Hostname设置为worker1,并在/etc/hosts里添加Hostname指向内网IP。

  1. hostnamectl set-hostname worker1
  2. echo '192.168.157.3 worker1' > /etc/hosts

二、搭建hadoop-2.8.5伪分布式环境

1、创建hadoop用户
  1. useradd hadoop
  2. passwd hadoop
2、设置hadoop用户免密登录

hadoop用户登录

  1. cd /home/hadoop
  2. ssh-keygen

cat命令输出Key,写入到/home/hadoop/.ssh/authorized_keys中,并设置权限,用于机器自己登录自己:

  1. cat /home/hadoop/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
  2. chmod 600 ~/.ssh/authorized_keys

测试登录

  1. ssh worker1
  2. yes
  3. exit # 退出刚登录的hadoop会话
3、下载hadoop-2.8.5并上传到hadoop用户根目录

hadoop用户根目录这里是/home/hadoop

去Hadoop的官方网站上选择安装包:https://hadoop.apache.org/releases.html

上传的话这里借助WinSCP工具,本人觉得贼好用。

4、解压并配置环境变量

切换到hadoop用户(su hadoop)

  1. cd ~
  2. tar -zxvf hadoop-2.8.5.tar.gz

切换回root,配置环境变量

  1. exit
  2. echo '
  3. export HADOOP_HOME="/home/hadoop/hadoop-2.8.5"
  4. export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
  5. ' >> /etc/profile
  6. source /etc/profile
5、hadoop配置文件添加JAVA_HOME环境变量

切换到hadoop用户

  1. su hadoop

在如下两个文件第一行添加JAVA_HOME=/usr/lib/jvm/jre

  1. ${HADOOP_HOME}/etc/hadoop/hadoop-env.sh
  2. ${HADOOP_HOME}/etc/hadoop/mapred-env.sh
6、修改core-site.xml、hdfs-site.xml 配置文件
  1. # core-site.xml
  2. echo '<?xml version="1.0" encoding="UTF-8"?>
  3. <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
  4. <configuration>
  5. <property>
  6. <name>fs.defaultFS</name>
  7. <value>hdfs://worker1:9000</value>
  8.      <description>设定namenode的主机名及端口</description>
  9. </property>
  10. <property>
  11. <name>io.file.buffer.size</name>
  12. <value>131072</value>
  13. <description> 设置缓存大小 </description>
  14. </property>
  15. <property>
  16. <name>hadoop.tmp.dir</name>
  17. <value>/home/hadoop/hadoop-2.8.5/tmp</value>
  18. <description> 存放临时文件的目录 </description>
  19. </property>
  20. <property>
  21. <name>fs.checkpoint.period</name>
  22. <value>3600</value>
  23. <description> 检查点备份日志最长时间 </description>
  24. </property>
  25. <property>
  26. <name>hadoop.security.authorization</name>
  27. <value>false</value>
  28. </property>
  29. </configuration>' > ${HADOOP_HOME}/etc/hadoop/core-site.xml
  30. # hdfs-site.xml
  31. echo '<?xml version="1.0" encoding="UTF-8"?>
  32. <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
  33. <configuration>
  34. <property>
  35. <name>dfs.replication</name>
  36. <value>1</value>
  37. <description>分片数量</description>
  38. </property>
  39. <property>
  40. <name>dfs.namenode.name.dir</name>
  41. <value>file://${hadoop.tmp.dir}/name</value>
  42. <description>命名空间和事务在本地文件系统永久存储的路径</description>
  43. </property>
  44. <property>
  45. <name>dfs.blocksize</name>
  46. <value>134217728</value>
  47. <description>HDFS块大小128M,如果你只有普通网线,就别64M了,没什么用</description>
  48. </property>
  49. <property>
  50. <name>dfs.datanode.data.dir</name>
  51. <value>file://${hadoop.tmp.dir}/data</value>
  52. <description>DataNode在本地文件系统中存放块的路径</description>
  53. </property>
  54. </configuration>
  55. ' > ${HADOOP_HOME}/etc/hadoop/hdfs-site.xml
  56. # slaves
  57. echo 'worker1' > ${HADOOP_HOME}/etc/hadoop/slaves

上面分片数量是1,是因为我们是伪分布式只有一个节点,如果是有多个节点那么最好配置为3,这样的话会更高可用。

三、格式化

  1. mkdir -p ${HADOOP_HOME}/tmp
  2. hdfs namenode -format

四、启动测试

  1. start-dfs.sh
  2. start-yarn.sh # 可选,暂时不启动没问题

浏览器访问:http://192.168.157.3:50070

上传文件

  1. mkdir text.txt
  2. hdfs -put text.txt /

浏览器访问http://192.168.157.3:50070 点击Utilities->Browse the file system 可以看到已经上传了一个文件:

到此,伪分布式环境搭建成功。

 230

啊!这个可能是世界上最丑的留言输入框功能~


当然,也是最丑的留言列表

有疑问发邮件到 : suibibk@qq.com 侵权立删
Copyright : 个人随笔   备案号 : 粤ICP备18099399号-2