百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

【Docker 新手入门指南】第十五章:常见故障排除

nanshan 2025-07-08 21:42 2 浏览 0 评论

一、前期准备:收集关键信息

在排查问题前,建议先获取以下系统数据,便于精准定位故障:

1. 系统基础信息

# 查看 Docker 版本(确认是否为最新稳定版)
docker version  

# 查看 Docker 系统配置(存储驱动、Cgroup 版本等)
docker info  

# 查看 Docker 守护进程日志(定位守护进程启动异常)
journalctl -u docker.service -xe

2. 容器运行状态

# 列出所有容器(包括停止状态)
docker ps -a  

# 查看容器实时日志(添加 --follow 追踪最新日志)
docker logs [容器ID/名称]  

# 获取容器详细配置(网络、挂载、资源限制等)
docker inspect [容器ID/名称]

二、常见问题分类排查

1. 安装与初始化问题
典型症状:权限错误、守护进程启动失败、服务无法初始化

  • 权限不足
# 将当前用户加入 docker 用户组(需重启终端生效) 
sudo usermod -aG docker $USER newgrp docker # 立即生效权限变更
  • 守护进程状态异常
# 检查服务状态(active/running 为正常)

sudo systemctl status docker # 重启/启动服务 
sudo systemctl restart docker sudo systemctl enable --now docker # 开机自启并立即启动
  • 依赖缺失(Linux 系统)
    • Ubuntu/Debian:确保安装 apt-transport-httpsca-certificatescurl 等依赖
    • CentOS:安装 yum-utils 并配置稳定仓库源

2. 网络连接问题
典型症状:容器无法联网、端口映射失效、跨容器通信失败

  • 网络配置检查
# 查看默认网络(bridge 为默认网络) 
docker network ls 

# 检查容器所属网络配置(IP、DNS、网关) 
docker network inspect bridge
  • 端口冲突
# 查看宿主机端口占用(替换 <端口号>)
sudo lsof -i :<端口号> 
  
  # 更换映射端口(例如将容器 80 端口映射到宿主机 8080)
  docker run -p 8080:80 nginx
  • DNS 解析失败
    • 修改 Docker 守护进程配置(/etc/docker/daemon.json):
{ 
  "dns": ["8.8.8.8", "8.8.4.4"] # 配置公共 DNS 服务器 
}
    • 重启 Docker 服务使配置生效

3. 存储与磁盘问题
典型症状:磁盘空间不足、数据卷挂载失败、镜像无法删除

  • 清理无效资源
# 清理所有停止的容器、未使用的镜像和网络
docker system prune -a -f  

# 查看磁盘占用详情(镜像/容器/数据卷分布)
docker system df  
  • 数据卷异常
# 列出所有数据卷
docker volume ls  

# 检查数据卷挂载路径(宿主机路径是否存在)
docker volume inspect [卷名]  
  • 镜像残留清理
# 删除悬空镜像(无标签的临时镜像)
docker image prune -f  

# 强制删除镜像(包含依赖标签)
docker rmi -f [镜像ID]  

4. 性能与资源问题
典型症状:容器卡顿、CPU/内存占用过高、宿主机性能下降

  • 资源监控
# 实时监控容器资源(CPU/内存/网络/IO)
docker stats [容器ID/名称]  

# 查看容器内进程(排查异常进程)
docker top [容器ID/名称]  
  • 资源限制配置
# 限制 CPU(0.5 核)和内存(512MB)
docker run -d --cpus="0.5" --memory=512m nginx  

# 限制磁盘 IO(示例:读写速率 10MB/s)
docker run -d --device-read-bps=/dev/sda:10mb --device-write-bps=/dev/sda:10mb myapp  

5. 镜像构建与拉取问题
典型症状:镜像拉取超时、构建失败、镜像标签错误

  • 仓库连接问题
# 登录私有仓库(检查账号密码是否正确)
docker login [仓库地址]  

# 使用镜像加速器(国内推荐腾讯云/阿里云镜像)
sudo nano /etc/docker/daemon.json  
{
  "registry-mirrors": ["https://mirror.ccs.tencentyun.com"]
}
  • Dockerfile 构建错误
    • 检查构建上下文路径(避免包含无关文件)
    • 添加 --no-cache 跳过缓存重新构建:
docker build --no-cache -t myapp .  
    • 通过 docker build --progress=plain 查看详细构建日志

6. 安全与权限问题
典型症状:容器以 root 运行、镜像存在漏洞、访问控制失效

  • 非 root 用户运行容器
# 指定 UID/GID 运行(需镜像支持非 root 用户)
docker run -d --user 1001:1001 nginx  
  • 漏洞扫描与修复
# 使用 Docker Scan 扫描镜像漏洞(需先安装 Trivy)
docker scan [镜像名]:[标签]  

# 查看镜像敏感配置(如特权模式)
docker inspect --format='{{.HostConfig.Privileged}}' [镜像ID]  

三、常见错误代码与解决方案

错误信息

可能原因

解决方法

Error response from daemon: conflict

容器名称冲突

docker rm [冲突容器名] 或指定新名称

port is already allocated

端口被占用

更换端口或终止占用进程

OCI runtime create failed

内核参数不支持

检查 Cgroup 驱动(docker info 确认)

manifest unknown

镜像不存在或标签错误

确认镜像名/标签是否正确,重新拉取

driver failed programming external connectivity

防火墙或网络配置错误

关闭防火墙或配置 iptables 规则

四、最佳实践与维护建议

预防措施

  1. 定期备份:对重要数据卷和 docker-compose.yml 进行版本控制
  2. 资源隔离:使用 docker-compose 管理多容器应用,配置 cpu_shares/memory 限制
  3. 版本管理:固定镜像标签(如 nginx:1.23-alpine),避免使用 latest 标签

日常维护

# 每周清理无效资源
docker system prune -a -f --volumes  

# 每月更新 Docker 和镜像
sudo apt update && sudo apt upgrade docker-ce  
docker pull --all-tags nginx  # 强制更新所有标签镜像

日志管理

  • 配置日志驱动(如 json-file 或接入 ELK 系统):
{
  "log-driver": "json-file",
  "log-opts": {
    "max-size": "10m",
    "max-file": "3"
  }
}

相关推荐

删库之后不要着急跑路,教你神不知鬼不觉找回数据

在工作中,我们误删数据或者数据库,我们一定需要跑路吗?我看未必,程序员一定要学会自救,神不知鬼不觉的将数据找回。在mysql数据库中,我们知道binlog日志记录了我们对数据库的所有操作,所以...

数据库告警不可用,增删改受阻(数据库限制删除)

前言:昨晚,突然出现服务不可用告警,查看日志上线报文入库到数据库很慢并受阻,出现数据不同步问题。排查问题查看发现服务都是在执行update、insert这些DML命令的时候,报的数据库执行超时。经过一...

Binlog实现MySQL复制,5个关键步骤,务必掌握!

复制是MySQL最重要的功能之一,MySQL集群的高可用、负载均衡和读写分离都是基于复制来实现的。Binlog就是实现主从复制的关键,主数据库将修改操作记录到Binlog中,从数据库通过解...

MySQL数据实时增量同步到Elasticsearch

Mysql到Elasticsearch的数据同步,一般用ETL来实现,但性能并不理想,目前大部分的ETL是定时查询Mysql数据库有没有新增数据或者修改数据,如果数据量小影响不大,但如果几百万上千万的...

MySQL 数据库恢复:如何执行时间点恢复(PITR)以挽救受损数据?

天津鸿萌科贸发展有限公司从事数据安全服务二十余年,致力于为各领域客户提供专业的数据恢复、数据备份、数据取证、数据迁移、网络安全、数据清除等解决方案,并针对企业面临的数据安全风险,提供专业的相关数据安全...

阿里面试:MySQL Binlog有哪些格式?底层原理?优缺点?

binlog的格式也有三种:STATEMENT、ROW、MIXED,下面我详解binlog三种模式@mikechenStatement模式Statement模式:是基于SQL语句的复制(statem...

快速带你读懂MySQL的binlog写入机制

深入讲解MySQL中的重要日志binlog的写入机制以及影响IO性能的关键配置,并且介绍了如何利用binlog去恢复数据,保证MySQL的可靠性。Q:binlog写入时机binlog的写入逻辑并...

MySQL 误删除数据恢复全攻略:基于 Binlog 的实战指南

在MySQL的世界里,二进制日志(Binlog)就是我们的"时光机"。它默默记录着数据库的每一个重要变更,就像一位忠实的史官,为我们在数据灾难中提供最后的救命稻草。本文将带您深入掌握如...

一文了解MySQL Binlog(一文了解肝脏有益和有害的食物)

MySQL的Binlog日志是一种二进制格式的日志,Binlog记录所有的DDL和DML语句(除了数据查询语句SELECT、SHOW等),以Event的形式记录,同时记录语句执行时...

数据丢失?别慌!MySQL备份恢复攻略

想象一下,某个晴朗的午后,你正享受着咖啡,突然接到紧急电话:你的网站或APP彻底挂了!系统崩溃,界面全白。虽然心头一紧,但你或许还能安慰自己:系统崩溃只是暂停服务,数据还在,修复修复就好了。然而,如果...

Mysql中的bin log、redo log、undo log的区别

最近在整理面试题,在看mvcc的时候看到了undolog,今天索性把这三个log都记录一遍。MySQL的逻辑架构说之前先说一下MySQL的基本架构,MySQL主要分为两层:Server层和存储引...

binlog日志定时清理(binlog清理规则)

binlog日志binlog是MySQL数据库的一种日志文件,用于记录所有对数据的修改操作。binlog全称为binarylog,它以二进制格式记录MySQL服务器上所有的修改操作,包括对哪个数据库...

茶水间炸锅了!菜鸟误删用户表,运维老张的MySQL救命三招!

(公司茶水间,运维老张、开发小王和新人小李围着咖啡机)小李:(紧张兮兮)张哥!我...我好像把测试库的用户表删了!下午演示咋办啊?老张:(淡定喝咖啡)慌啥?昨晚的备份是吃干饭的?走,教你恢复!一、基础...

解决运维痛点,提高运维安全性-雷池 SafeLine WAF新功能身份认证

雷池介绍使用雷池SafeLineWAF已经两年多了,在1.5.x版本时就已经开始测试使用,并在推出LTS版本后转入LTS分支。近期雷池SafeLineWAF重点更新了身份认证功能,并提供了SS...

【Docker 新手入门指南】第十五章:常见故障排除

一、前期准备:收集关键信息在排查问题前,建议先获取以下系统数据,便于精准定位故障:1.系统基础信息#查看Docker版本(确认是否为最新稳定版)dockerversion#查看...

取消回复欢迎 发表评论: