百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

大数据开发前要做什么准备?8台Hadoop服务器进行集群规划前配置

nanshan 2024-10-16 10:51 18 浏览 0 评论


前期准备

安装好CentOS Linux 8 并升级完内核和软件包之后再进行Hadoop的安装。

参考文章:

1、知道Linux是怎么安装的吗?安装个CentOS Linux 8开始大数据开发

2、Linux内核怎么升级?升级有什么好处?CentOS8升级内核并开启BBR


手里有一台3年前的服务器Dell R620,上面安装了两路CPU型号是Xeon E5-2603 V2 1.8GHz,内存没有插满只有64GB,8个硬盘位插满共8块SAS硬盘。为了后续的测试方便,8块硬盘没有组RAID,在每块硬盘上放一个VMWare的CentOS Linux 8虚拟机。后续的所有的大数据相关的测试都是在这台服务器上进行。服务器配置不高,但是足够咱们在上面折腾各种服务了。

通过VMware将虚拟机分布在这8块硬盘上,模拟在一个机架上的8台服务器:

编号:/BJ0/LG0/hadoop221-228

其中:221-222:NameNode,223-228:DataNode

集群规划

集群规划如下:(服务器编号为hadoop221-hadoop228)

注:

1、NameNodes和zkfc一一对应;

2、DataNode和NodeManager都是works文件配置;

3、Zookeeper至少3个,必须奇数台;

4、journalnode至少3个,必须奇数;

5、NameNodes一个active另一个Standby;

6、ResourceManager一个active另一个Standby;

7、zkfc :DFSZKFailoverControlle作为一个ZK集群的客户端,用来监控NN的状态信息。

特别提示

我们以下所有操作都可以先在一台服务器上操作,完毕以后再将这个虚拟服务器复制成出来7份,完成最终的部署。

安装时间同步软件chrony

根据上面的集群规划,在221-228这8台服务器上安装chrony。从CentOS7开始已经默认使用chrony作为网络时间同步软件了,ntpd作为过时的产品,我们也就不在研究使用了。

若要安装使用Chrony,参考下面这篇文章:如何保证大数据开发的服务器时间同步?chrony服务安装与配置

配置时我们把服务端server都配置成192.168.1.222,这样后面复制出来的其它服务器就能直接在222服务器上获取时间了。


防火墙和SELINUX设置

因为Hadoop需要开启的端口很多,而且牵涉到很多的权限,所以我们在测试时将防火墙和SELINUX都关掉。

在生产环境中,需要针对不同的开放端口做针对性的设置。

关闭防火墙

运行以下命令,关闭防火墙

systemctl stop firewalld #临时关闭防火墙

systemctl disable firewalld #禁止开机启动防火墙

systemctl status firewalld #查看防火墙状态。

关闭SELINUX

运行以下命令:

vi /etc/selinux/config #SELINUX配置文件

相关参数修改如下:

#SELINUX=enforcing

SELINUX=disabled

重启服务器,然后查看SELINUX状态:

reboot #重启

getenforce #查询SELinux的运行模式,permissive(宽容模式);enforcing(强制模式);

/usr/sbin/sestatus -v #查看SELINUX的状态

显示如下内容,则说明SELINUX已经关闭了

hostname相关设置

运行下面的命令,修改本机的hostname:

hostnamectl set-hostname hadoop221 #修改hostname

运行下面的命令查看设置好的hostname:

cat /etc/hostname

如果显示如下的内容,则说明修改成功

222-228服务器上的hostname修改,等服务器安装完毕以后统一操作。


hosts相关设置

由于后续的管理需要一次次的录入IP地址,不利于管理,我们在hosts里面把服务器的hostname跟IP地址对应起来,输入下面的命令开始操作:

vi /etc/hosts

内容设置成如下所示:

127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4

::1 localhost localhost.localdomain localhost6 localhost6.localdomain6

192.168.1.221 hadoop221

192.168.1.222 hadoop222

192.168.1.223 hadoop223

192.168.1.224 hadoop224

192.168.1.225 hadoop225

192.168.1.226 hadoop226

192.168.1.227 hadoop227

192.168.1.228 hadoop228

192.168.1.229 hadoop229

192.168.1.230 hadoop230

添加Hadoop用户

添加hadoop用户,我们默认登录的是Tristone用户,需要切换到root用户执行以下命令:

#useradd hadoop

录入一遍"jiqun996"回车,再录入一遍"jiqun996"回车后将hadoop用户密码设置为"jiqun996"

#passwd hadoop

大数据开发钱的准备工作就做完了,后面就可以开始安装Zookeeper、Hadoop、HBase、Python和PHP等软件了。

相关推荐

MongoDB 从入门到实战:.NET 平台完整指南

一、什么是MongoDBMongoDB是一种功能强大且灵活的NoSQL数据库,适用于处理大规模的半结构化数据和高并发场景。它不依赖于固定的表结构和关系模型,而是以文档的形式存储数据,每个文档可...

NET Framework安装失败的原因及解决方法

大家好我是艾西,一个做服务器租用的游戏爱好者兼网络架构系统环境问题网络工具人。在我们平时使用PC安装某些程序会出现.NETFramework缺失的提示,那么也会有很多的小伙伴搞不懂什么原因导致的,这...

这可是全网eNSP安装最完整,最详细的图解,没有之一(常见问题)

eNSP安装大纲eNSP安装详细图解篇幅较长,会分三篇更完。急需安装的朋友可以在文末获取图解文档和所需软件工具。ENSP安装常见问题和解决方案Vbox安装错误eNSP在安装的过程当中,经常会出现一...

如何在windows 2012安装.NET Framework3.5

Windowsserver2012R2,自带的是.NETFramework4.5,如果想装SQLserver2008或者SQLserver2012需要安装.ENTFramework...

3款国内可用的「Chrome」扩展下载网站

身为程序员,有几个不使用Chrome浏览器提升下编码效率呢?Chrome拥有众多丰富强大的扩展程序,今天给大家分享三个国内可用的Chrome扩展下载网站,收藏一下吧,不然下次就找不到我咯!C...

下载 Windows 10 应用商店程序离线包方法

有厂商为了图方便,会把Windows10应用商店里面的UMP应用改成EXE程序版本。例如之前「网易云音乐」UMP版本简洁清爽,获得不少用户推荐,后来官方懒得更新了,直接把UMP版本...

极速安装!NET Framework 3.5零距离指南!

.NETFramework3.5是一款由微软开发的应用程序框架,它为许多Windows应用程序提供了基础支持。它的新版本带来了许多令人兴奋的功能和改进,比如增强的XML和JSON处理能力以及强大的...

Microsoft.NET离线运行库合集发布 2021

软件介绍.NET是微软具有战略意义的框架,也是装机必不可少的框架,想要一个一个安装略显繁琐,再加上很多电脑小白不知道怎么下载,不小心就下载到某某高速加载器,这个运行库极大解决了这个问题,采用微软官方....

缺少.net framework 3.5怎么办?(缺少.net4.5.1或以上环境)

很多电脑用户在玩某些程序游戏时都会遇到一个头痛的问题,弹出缺少“NETFramework3.5”的提示。微软从Windows8开始默认屏蔽了“.NET3.5”,如果用户有需要就必须选择在线安装...

Windows11无法正常安装.net 3.5组件的解决方法

最近因公司部分电脑升级至Windows11之后,重新安装某些需要加载.net3.5组件的应用软件时,都提示无法完成加载或安装.net3.5而导致无法完成安装。使用离线安装包亦一样无法完成安装。一...

离线安装.Net Framework 3.5(离线安装.net framework 4.0)

前言.Net3.5已经越来越少用到了,但是偶尔还是会遇到一些老软件需要。而Win10、Win11的系统,直接在控制面板的里添加,经常会添加失败!解决方法首先需要一个系统的ISO镜像来提取sxs文件夹:...

Jenkins 11个使用技巧,90%以上的人没用过

一、Performance插件兼容性问题自由风格项目中,有使用Performance插件收集构建产物,但是截至到目前最新版本(Jenkinsv2.298,Performance:v3.19),此...

6款Linux常用远程连接工具,你最中意哪一款?

点击上方头像关注我,每周上午09:00准时推送,每月不定期赠送技术书籍。本文2106字,阅读约需6分钟Hi,大家好。远程连接的实现方法有很多,概括地说有两种,一种是用系统自带的远程连接,另外一种是用...

Linux常用远程连接工具介绍,总有一款适合你

作为运维或者网工最常用就是ssh远程和远程桌面工具,本文就介绍几个常用的远程连接工具,你在用哪一款呢SecureCRT介绍:我觉得这个是最好的SSH工具,没有之一。SecureCRT支持SSH,同时支...

终极软路由网络设置,ESXi虚拟机安装iKuai+openWrt双路由系统

本内容来源于@什么值得买APP,观点仅代表作者本人|作者:BigBubbleGum本文是软路由系列的第五篇,也是折腾时间最长的一篇,在ESXi下分别独立安装和使用iKuai和openWrt...

取消回复欢迎 发表评论: