Ubuntu20.04下的HPL集群3节点搭建
nanshan 2025-01-06 14:38 12 浏览 0 评论
1.首先安装Ubuntu20.04 amd64,安装过程比较简单,在此不做叙述了。下面出场的就是硬件们了~~~龙芯3C5000来了我也搭!目前只能用下E5 2682 V4了,主频也是2.5G,不过集成了16个核心,支持HT~
2.链接网络,更新系统:
①执行更新
# apt-get update
②安装ssh工具和net工具,方便远程操作及熟悉的ifconfig指令
#apt-get install ssh
# apt-get install net-tools
③安装samba,建立同Windows之间的文件传递
#apt-get install samba samba-common
安装完成后配置samba,步骤如下:
a.新建Ubuntu端共享文件夹
# mkdir –p /home/share
b.修改samba配置文件
# vi /etc/samba/smb.conf
c.在配置文件最后添加:
[node01]
comment = node01 share
path = /home/share #此处为Ubuntu端需要共享的文件夹绝对路径
browseable = yes
writable = yes
available = yes
valid users = node01 #此处为登陆samba的用户,必须在Ubuntu中存在
d.修改共享文件夹权限使得Windows访问后可以读写,#chmod 777 /home/share
e.设置samba访问用户密码,为了方便可以直接设置用户登陆密码:
# smbpasswd -a node01
需要输入2次,输完按一次回车。
root@node01:/home/node01# smbpasswd -a node01
New SMB password:
Retype new SMB password:
Added user node01.
f.重新启动samba服务,# service smbd restart
g.回到Windows端,运行输入:\\192.168.199.200,可以看到文件夹node01,双击输入用户名密码(即之前e步骤所指)
h.然后就可以方便的交互文件了,这是笔者最喜欢的方式,当然是同一网络网段内方便,比ftp好玩。
接下来就是给系统减负,不启动桌面直接进命令行模式。
a.# vi /etc/default/grub
将:GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"
改为:GRUB_CMDLINE_LINUX_DEFAULT="text"
b.# update-grub
c.# systemctl set-default multi-user.target
d.# reboot
至此可以安心开始HPL测试环境的搭建了:
Ⅰ.安装gcc、gfortran、make等必要工具
# apt-get install gcc
# apt-get install g++
# apt-get install gfortran
# apt-get install make
Ⅱ.将hpl-2.3.tar.gz、mpich-3.3.2.tar.gz和OpenBLAS-0.3.17.tar.gz拷贝到samba共享文件夹(本文为/home/share/HPL文件夹下):
a.解压mpich-3.3.2.tar.gz并进入源码文件夹
# tar zxvf mpich-3.3.2.tar.gz
# cd mpich-3.3.2
配置mpich和安装:
# ./configure --prefix=/usr/local/mpich3.3.2
# make
# make install
设置环境变量脚本
# cd /home/share/HPL
# touch env.sh
# vi env.sh
添加如下内容:
export PATH=$PATH:/usr/local/mpich3.3.2/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/mpich3.3.2/lib
# chmod 777 env.sh
b.解压OpenBLAS-0.3.17.tar.gz并进入源码文件夹
# tar zxvf OpenBLAS-0.3.17.tar.gz
# cd OpenBLAS-0.3.17
# make
# make PREFIX=/usr/local/openblas install
c. 解压hpl-2.3.tar.gz并进入源码文件夹
# tar zxvf hpl-2.3.tar.gz
# cd hpl-2.3
接下来配置Makefile文件,在setup文件夹下有很多模板,此处使用Make.Linux_PII_FBLAS
# cp setup/Make.Linux_PII_FBLAS .
# mv Make.Linux_PII_FBLAS Make.E5x2
上门的E5x2就是这个Make的体系结构名称,后续需要用到,因为我的主板是双路E5,名称随意取即可
修改:
ARCH = E5x2
TOPdir = /home/share/HPL/hpl-2.3
MPdir = /usr/local/mpich3.3.2
MPlib = $(MPdir)/lib/libmpi.so
LAlib = $(LAdir)/lib/libopenblas.a
CC = /usr/local/mpich3.3.2/bin/mpicc
CCFLAGS = $(HPL_DEFS) -pthread -fomit-frame-pointer -fomit-frame-pointer -O3 -funroll-loops -W -Wall
LINKER = /usr/local/mpich3.3.2/bin/mpif77
保存后关闭,开始编译
# make arch=E5x2
完成后会在顶层目录下生成bin文件夹
# cd /home/share/HPL/hpl-2.3/bin/E5x2
里面有2个文件,分别是:HPL.dat和xhpl,前一个是配置测试用的参数,通常调参数就是指的改它内容。接下来测试运行:
# mpirun -np 4 ./xhpl
其中4表示使用4个进程运行,建议和cpu的物理核心数量一致(注意区分是否开启了HT,满载测试HT会减低效率)
另外推荐一个HPL建议网站:http://hpl-calculator.sourceforge.net/
多节点MPICH-HPL测试
上面讲述了单节点的配置和运行测试,一般使用环境都是多节点并行集群计算形式,因此多节点测试十分必要,也很有意思。
a.首先需要配置ssh无密码互访,建立节点间的网络传递
# ssh-keygen -t rsa
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa): Created directory '/root/.ssh'.
Enter passphrase (empty for no passphrase):
Enter same passphrase again:
Your identification has been saved in /root/.ssh/id_rsa
Your public key has been saved in /root/.ssh/id_rsa.pub
The key fingerprint is:
SHA256:nszzwk6rQGp6How2xkbK8mYwZUpoM6eYqNVNg8tWA9w root@node01
The key's randomart image is:
+---[RSA 3072]----+
| . . |
| o E |
|. o |
|.=o.. = |
|=*=o.= oS |
|%+.o= .+ . |
|=@=.. .B |
|*+=. . .o+ |
|.=o .oo.. |
+----[SHA256]-----+
然后分别在3台机器上运行该命令生产公钥
# cd ~/.ssh
# touch authorized_keys
在三台机器上分别添加另外2台机器信息
# vi /etc/hosts
笔者设置的内容如下:
root@node01:~/.ssh# cat /etc/hosts
127.0.0.1 localhost
#127.0.1.1 node01 #需要注释掉
192.168.199.204 node03
192.168.199.203 node02
192.168.199.205 node01
# The following lines are desirable for IPv6 capable hosts
::1 ip6-localhost ip6-loopback
fe00::0 ip6-localnet
ff00::0 ip6-mcastprefix
ff02::1 ip6-allnodes
ff02::2 ip6-allrouters
测试node01同node02、node03连通性(其余同理),正常机器会把名称替换为IP,ping通即可
# ping node02
# ping node03
在node01-node03上运行
# cat id_rsa.pub >> authorized_keys
最偷懒的方法就是通过putty复制各自的公钥到所有节点:
node02→node01
node03→node01
最后将node01的公钥(包含node01 node02 node03的公钥)完整复制到其他2台节点上。
然后第一次ssh nodeXX需要输入yes,往后就不用密码直接、互相ssh登录任意node了。
b.然后开始通过ssh复制需要运行的hpl测试程序到所有node
首先在node02和node03上面建立相同的文件夹(本文是在node01上面编译安装mpich、openblas和hpl的)
# mkdir -p /home/share/HPL
# chmod 777 /home/share/HPL (权限设置,否则scp拷贝容易失败)
拷贝hpl到node02(node03同理,IP、文件夹路径根据实际情况修改)
# scp -r hpl-2.3 node02:/home/share/HPL
同理,mpich和openblas编译好的拷贝至/usr/local
# scp -r /usr/local/openblas node02:/usr/local
# scp -r /usr/local/mpich3.3.2 node02:/usr/local
c.建立mpich环境脚本
export PATH=$PATH:/usr/local/mpich3.3.2/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/mpich3.3.2/lib
保存为:env.sh,同样拷贝到每个节点,然后在个节点# source env.sh一下即可,各节点就可以使用mpirun、mpicc等工具了。
d.建立并行主机核心分配文件
node01:32
node02:32
node03:32
保存为:servers,下一步给mpirun –f使用,表示每个节点node提供32个计算核心,当然可以每个4核心,看实际情况,本文用了2路E5 2682 V4因此每个节点共计32个核心,每个节点共计32GB DDR4 ECC内存,3节点一共96核心。共计128GB内存!够用了够用了。[憨笑]
接下来就可以正式运行测试!
# mpirun -np 96 -f /home/share/HPL/servers ./xhpl
然后就进入漫长的计算了~~~通过修改HPL.dat文件参数提升成绩。3个节点96个核心都在100%负荷运行了~~~
相关推荐
- 雷军1994年写的老代码曝光,被称像诗一样优雅
-
大数据文摘授权转载自程序员的那些事雷军的代码像诗一样优雅↓↓↓有些网友在评论中质疑,说雷军代码不会是“屎”一样优雅吧。说这话的网友,也许是开玩笑的,也许是真没看过雷军写过的代码。在2011年的时候,我...
- 原创经验分享:低级bug耗费12小时Fix
-
调试某程序非常简单的程序,简单到认为不可能存在缺陷,但该BUG处理时间超过12小时:程序属于后台进程,监控系统每隔15秒检查外设IO状态,IO异常后发出报警或复位外设,外设都在linux下有/sys/...
- SpringBoot实现的简单停车位管理系统附带导入和演示教程视频
-
这一次为大家带来的是简单的停车位管理系统,基于SpringBoot+Thymeleaf+Mybatis框架,这个系统相对来说比较简单,很容易学习并快速上手,因为逻辑很清晰,没有太复杂的代码逻辑,所以学...
- 一个开箱即用的代码生成器(代码自动生成工具开源)
-
今天给大家推荐一个好用的代码生成器,名为renren-generator,该项目附带前端页面,可以很方便的选择我们所需要生成代码的表。首先我们通过git工具克隆下来代码(地址见文末),导入idea。...
- 【免费开源】JeecgBoot单点登录源码全部开源了
-
JeecgBoot单点登录源码全部开源了,有需要的朋友可以来薅羊毛了。一、JeecgBoot介绍JeecgBoot是一款企业级的低代码平台!前后端分离架构SpringBoot2.x,SpringCl...
- SpringBoot+JWT+Shiro+Mybatis实现Restful快速开发后端脚手架
-
作者:lywJee来源:cnblogs.com/lywJ/p/11252064.html一、背景前后端分离已经成为互联网项目开发标准,它会为以后的大型分布式架构打下基础。SpringBoot使编码配置...
- 为什么越来越多的人选择使用idea软件
-
IDEA软件是什么?IDEA软件是干什么的?为什么越来越多的人选择使用IDEA软件?IDEA软件,全称IntelliJIDEA,它是由JetBrains公司开发开发的一款功能强大的集成开发环境(ID...
- 开题报告大学生互助系统(附源码)java毕设
-
本系统(程序+源码)带文档lw万字以上文末可获取一份本项目的java源码和数据库参考。系统程序文件列表开题报告内容选题背景随着互联网技术的飞速发展,大学生群体对信息共享与互助的需求日益增长。关于大...
- SpringBoot项目快速开发框架JeecgBoot——项目简介及系统架构!
-
项目简介及系统架构JeecgBoot是一款基于SpringBoot的开发平台,它采用前后端分离架构,集成的框架有SpringBoot2.x、SpringCloud、AntDesignof...
- 新手配电脑13代CPU怎么选择(新手配电脑13代cpu怎么选择好)
-
Intel第13代酷睿i3、i5、i7、i9系列处理器的核心参数、性能差异及适用群体的详细说明(以桌面端为例):一、13代酷睿全系参数对比(桌面端主流型号)参数i3-13100i5-13600Ki7-...
- 加速 SpringBoot 应用开发,官方热部署神器真带劲
-
平时使用SpringBoot开发应用时,修改代码后需要重新启动才能生效。如果你的应用足够大的话,启动可能需要好几分钟。有没有什么办法可以加速启动过程,让我们开发应用代码更高效呢?今天给大家推荐一款Sp...
- 基于微信小程序的移动端物流系统-计算机毕业设计源码+LW文档
-
摘要随着Internet的发展,人们的日常生活已经离不开网络。未来人们的生活与工作将变得越来越数字化,网络化和电子化。网上管理,它将是直接管理移动端物流系统app的最新形式。本论文是以构建移动端物流系...
- springboot教务管理系统+微信小程序云开发附带源码
-
今天给大家分享的程序是基于springboot的管理,前端是小程序,系统非常的nice,不管是学习还是毕设都非常的靠谱。本系统主要分为pc端后台管理和微信小程序端,pc端有三个角色:管理员、学生、教师...
- SpringBoot全家桶:23篇博客加23个可运行项目让你对它了如指掌
-
SpringBoot现在已经成为Java开发领域的一颗璀璨明珠,它本身是包容万象的,可以跟各种技术集成。本项目对目前Web开发中常用的各个技术,通过和SpringBoot的集成,并且对各种技术通...
- Maven+JSP+Servlet+C3P0+Mysql实现的音乐库管理系统
-
本系统基于Maven+JSP+Servlet+C3P0+Mysql实现的音乐库管理系统。简单实现了充值、购买歌曲、poi数据导入导出、歌曲上传下载、歌曲播放、用户注册登录注销等功能。难度等级:简单技术...
你 发表评论:
欢迎- 一周热门
-
-
UOS服务器操作系统防火墙设置(uos20关闭防火墙)
-
极空间如何无损移机,新Z4 Pro又有哪些升级?极空间Z4 Pro深度体验
-
手机如何设置与显示准确时间的详细指南
-
如何在安装前及安装后修改黑群晖的Mac地址和Sn系列号
-
如何修复用户配置文件服务在 WINDOWS 上登录失败的问题
-
NAS:DS video/DS file/DS photo等群晖移动端APP远程访问的教程
-
日本海上自卫队的军衔制度(日本海上自卫队的军衔制度是什么)
-
10个免费文件中转服务站,分享文件简单方便,你知道几个?
-
爱折腾的特斯拉车主必看!手把手教你TESLAMATE的备份和恢复
-
FANUC 0i-TF数据备份方法(fanuc系统备份教程)
-
- 最近发表
- 标签列表
-
- linux 查询端口号 (58)
- docker映射容器目录到宿主机 (66)
- 杀端口 (60)
- yum更换阿里源 (62)
- internet explorer 增强的安全配置已启用 (65)
- linux自动挂载 (56)
- 禁用selinux (55)
- sysv-rc-conf (69)
- ubuntu防火墙状态查看 (64)
- windows server 2022激活密钥 (56)
- 无法与服务器建立安全连接是什么意思 (74)
- 443/80端口被占用怎么解决 (56)
- ping无法访问目标主机怎么解决 (58)
- fdatasync (59)
- 405 not allowed (56)
- 免备案虚拟主机zxhost (55)
- linux根据pid查看进程 (60)
- dhcp工具 (62)
- mysql 1045 (57)
- 宝塔远程工具 (56)
- ssh服务器拒绝了密码 请再试一次 (56)
- ubuntu卸载docker (56)
- linux查看nginx状态 (63)
- tomcat 乱码 (76)
- 2008r2激活序列号 (65)