百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Kubernetes问题排查|POD启动失败

nanshan 2025-01-12 17:25 29 浏览 0 评论

介绍

POD提供了一种抽象层,可以在同一节点上运行多个容器,这些容器可以共享相同的IP地址和端口空间,也可以通过共享存储卷实现数据共享。Kubernetes中的POD是最小的可部署单元,它是由一个或多个容器组成的,一个POD中的容器通常是相互关联的,它们共享同一个环境并一起工作。

例如:一个Web应用程序POD可能包含一个前端容器和一个后端容器,它们共享同一个网络命名空间和存储卷,以实现数据的共享和通信。 在Kubernetes中,POD是一个临时的实例,它可能被重建或者迁移,因此POD不应该被视为持久的实体。相反,Kubernetes集群中的其他组件(如Deployment、ReplicaSet、StatefulSet等)通常会管理POD的生命周期,并确保在需要时重新启动或替换POD。

POD启动失败原因有以下几种

镜像拉取失败

当 Kubernetes 集群无法拉取容器镜像时,POD 就无法启动。这可能是由于网络不稳定、镜像仓库故障、镜像版本号错误等原因导致的。可以通过检查镜像地址、网络连接等进行排查。

资源不足

如果节点资源不足,POD 就无法启动。资源可以包括 CPU、内存、存储等。可以通过调整 POD 的资源请求和限制来解决。

容器启动失败

当容器的启动命令错误、容器中的应用程序无法启动或容器中的环境变量配置错误时,POD 就无法启动。可以通过查看容器日志,来确定容器启动失败的原因。

端口冲突

当 POD 中的容器端口与节点或其他 POD 中已有的端口冲突时,容器无法启动。可以通过检查端口配置、服务配置等来解决。

配置错误

当 POD 的配置文件中存在错误时,POD 就无法启动。例如标签选择器错误、挂载目录错误等。可以通过检查配置文件来解决。

安全限制

当节点上的安全机制限制了 POD 的启动时,POD 就无法启动。例如 SELinux 权限限制、节点防火墙等。可以通过检查节点安全规则来解决这些问题。

POD启动失败ContainerCreating

前面文章中我在新添加的节点上运行Jenkins,看到已经被调度到新节点192.168.81.200上了,但是它的状态不对是ContainerCreating。在K8s中POD状态最常见的是ContainerCreating状态。这种状态通常发生在Pod中的容器无法启动或初始化的情况下。

去所在的节点上查看日志发现问题,是POD在mount数据目录的时候报错。

Mar  8 18:15:53 192 kubelet: Output: mount: 文件系统类型错误、选项错误、192.168.81.183:/data/k8s_nfs/ops-pvc-jenkins-pvc-6b4e08ab-6f90-4d16-ab49-5d78d224db77 上有坏超级块、
Mar  8 18:15:53 192 kubelet: 缺少代码页或助手程序,或其他错误
Mar  8 18:15:53 192 kubelet: (对某些文件系统(如 nfs、cifs) 您可能需要
Mar  8 18:15:53 192 kubelet: 一款 /sbin/mount.<类型> 助手程序)
Mar  8 18:15:53 192 kubelet: 有些情况下在 syslog 中可以找到一些有用信息- 请尝试
Mar  8 18:15:53 192 kubelet: dmesg | tail  这样的命令看看。

这就属于上面总结的几个原因当中的挂载卷失败了,Pod中的容器可能无法挂载所需的卷。可以通过检查卷名称是否正确、卷是否存在以及访问权限是否正确来解决此问题。

我这个是使用的NFS和StorageClass在Kubernetes中配置持久化存储,它一种灵活且可靠的解决方案,它可以帮助我们在Kubernetes集群中轻松地管理和配置持久化存储,这个方案请参考Kubernetes基于NFS实现持久化存储

上面这个报错是挂载PV指定的目录错误,原因是我们新节点没有安装nfs组件,nfs-utils是一个提供NFS客户端和服务器的工具集,可以用于挂载NFS共享目录到本地文件系统,如果您想在Linux系统上使用NFS协议,那么您需要安装nfs-utils软件包。

以下是在不同的Linux发行版上安装nfs-utils的方法:

#在Ubuntu/Debian上安装nfs-utils:
sudo apt-get update
sudo apt-get install nfs-common

#在CentOS/RHEL上安装nfs-utils:
sudo yum install nfs-utils

#在SUSE上安装nfs-utils:
sudo zypper install nfs-client

安装完成后,过1分钟就可以看到POD可以成功运行了。

并且在日志里也可以看到磁盘卷可以正常创建,镜像正常下载了。

相关推荐

Linux 的磁盘系统,和你了解的Windows差别很大

我的C盘去哪了?一个系统,如果没有存储,那么也就不能称之为系统。存储性是一个完整系统的重要组成部分。例如AWS最开始的服务就是S3(用来存储数据的云服务),足以见得存储对于一个应用平台是多么的重要。...

一文读懂 Linux 硬盘挂载:从问题到解决方案

各位互联网大厂的后端开发伙伴们!在咱们日常工作中,操作Linux系统是常有的事儿吧。你们有没有遇到过这样的场景:新添加了一块硬盘,满心欢喜准备用来存储重要数据或者部署新的应用服务,却突然发现不知道...

硬盘分区(硬盘分区格式)

 磁盘(硬盘)分区,可以分C、D、E等分区,大家可能都会用,会根据自已的需要确定所需的空间,但分区是如何工作的呢,内容如下。Windows中有3类:MBR分区:MasterBootRecord,也...

parted命令工具分区介绍(particle命令)

linux系统磁盘分区通常可以使用fdisk和parted命令,当分区大小小于2TB的时候,两种皆可以使用,当分区大于2TB的话,就需要用parted分区。以下介绍parted命令相关使用,以sdb为...

Linux 服务器上查看磁盘类型的方法

方法1:使用lsblk命令lsblk输出说明:TYPE列显示设备类型,如disk(物理磁盘)、part(分区)、rom(只读存储)等。NAME列显示设备名称(如sda、nvme0n1)。TR...

Linux分区命令fdisk和parted使用介绍

摘要:一般情况下,Linux分区都是选择fdisk工具,要求硬盘格式为MBR格式,能支持的最大分区空间为2T。但是目前在实际生产环境中使用的磁盘空间越来越大,呈TB级别增长;而常用的fdisk这个工具...

linux 分区原理与名词解释(linux操作系统中的分区类型)

分区的意义将磁盘分成几份,每份挂在到文件系统的那个目录在linux里的文件系统Ext2:早期的格式,不支持日志功能Ext3:ext2改良版,增加了日志功能,是最基本且最常用的使用格式了Ext4:针对e...

linux 分区合并(linux合理分区)

查看虚拟机当前磁盘挂载情况fdisk-l选择磁盘fdisk/dev/sda查看磁盘分区情况p重新选择分区n选择主分区p保存w创建物理卷pvcreate/dev/sda3查看物理卷信息pvdi...

如何在 Linux 系统中永久禁用交换分区 ?

Linux操作系统中的交换分区或交换文件充当硬盘上的临时存储区域,当物理内存(RAM)满时,系统使用该存储区域。它用于交换较少使用的内存页,这样系统就不会因为运行应用程序而耗尽物理内存。随着技术的发...

Linux 如何知道硬盘已用多少空间、未用多少空间

刚出社会时,去了一家公司上班,老板为了省钱,买的服务器是低配的,硬盘大小只有40G,有一次网站突然不能访问了,排查半天才知道原来服务器的硬盘空间已用完,已无可用空间。第一步是查看硬盘的使用情况,第二步...

用Linux系统管理磁盘空间 就该这么来

要想充分有效的管理使用Linux系统中的存储空间,用户必须要做的就是双管齐下,一边扩充空间一边限制空间。不得不说的就是很多时候磁盘空间就像水资源,需节制水流。说到要如何实现限制空间就离不开使用LVM技...

Windows 11 磁盘怎么分区?(windows11磁盘怎么分区)

Windows11磁盘分区技术解析与操作指南:构建高效存储体系一、磁盘分区的技术本质与系统价值磁盘分区作为存储系统的基础架构,通过逻辑划分实现数据隔离与管理优化。Windows11采用NTF...

linux上创建多个文件分区,格式化为 ext2、ext3、ext4、XFS 文件

以下是在Linux系统上创建多个20GB文件分区并格式化为不同文件系统的分步指南:步骤1:创建基础文件(4个20GB文件)bash#创建4个20GB稀疏文件(实际占用空间随写入量增长)ddif=/...

救命的U盘低格哪家最强?(低格优盘)

周二时有位童鞋留言说U盘之前做过引导盘,现在格式化不了,用各种工具都不行,而且因为U盘厂商的关系,查不到U盘主控,无法量产恢复,特来求助。小编花了点时间特意弄坏一个U盘分区,终于试出方法了,特来分享一...

Linux 查看硬件磁盘存储大小和磁盘阵列(RAID)的组合方式

一、查看硬件磁盘存储大小查看所有磁盘信息:#lsblk该命令会列出所有磁盘(如/dev/sda、/dev/nvme0n1)及其分区和挂载点。查看磁盘总容量:fdisk-l#或parted-...

取消回复欢迎 发表评论: