百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

MongoDB 常见问题处理(一)(mongodb报错)

nanshan 2025-04-06 19:27 13 浏览 0 评论

MongoDB维护过程中常用问题处理

MongoDB实例监控中,CPU使用率过高问题排查?

  • 使用top命令查看当前CPU资源利用情况,若都在正常范围,则考虑是否频繁操作数据库。
  • 确定业务是否有很高的操作数据库频率 若通过监控指标或command line发现,业务QPS过高,则需要考虑升级实例配置,否则排查是否有慢查询堆积。
  • 确定是否有慢查询堆积 在主节点用慢查询日志(system.profile)找到超过200ms的语句,然后再通过.explain()解析影响行数,分析为什么超过200ms。

container网络入/出流量告警问题?

当出现网络流量过高的情况,通常是因为服务器与服务器之间拷贝数据导致的,拷贝结束,流量即可恢复正常,如果不是数据拷贝,通常是服务器中毒或者受到攻击,在对内或对外大量发包导致,此时,可按照以下方法进行排查

  • 如果您使用的是Linux系统的服务器,可以在系统中安装nethogs查看具体的进程占用流量的情况(如nether eth0->查看网卡具体流量)并杀死该进程;对于一些常见的网络问题,如容器之间网络通信问题,您可以使用Tcpdump工具捕获网络流量,来解决这些网络问题.
  • 如果您使用的是windows系统,可通过资源监视器(启动任务管理器>资源监视器>网络)看到哪些进程占用网络流量并结束相关进程.

容器down 后排查处理?

当prometheus监控到容器down指标Container Killed告警,说明容器可能失效或终止运行,以异常状态退出或健康检查失败,k8s的核心组件 kubelet会根据设置的pod重启策略自动重启该容器,例如容器运行时内存超出限制,容器以Failed状态终止,kubelet则自动重启该容器。而pod中的守护进程supervisor会保证mongod服务自动重启。

MongoDB监控里Memory使用率过高?

mongo为了优化读写效率,将内存当做缓存,读写次数越多、数据量越大,缓存就越大。

解决办法:

  • 控制并发连接数: MongoDB driver在连接mongod时,会维护一个连接池(默认100),当有大量的客户端同时访问同一个mongod时,就要减少每个客户端连接池的大小,可以在配置文件中通过配置net.maxIncomingConnections来限制最大的并发连接数,防止数据库压力过载。或者增大memory资源。
  • 是否配置journal mongodb4.0默认开启journal,这样会持久化存储,不过会耗费内存资源,除非正常关闭数据库。可以在配置文件中关闭journal,不会做持久化存储,而是每分钟做一次全量的checkpoint,所以在异常出现的情况下,会丢掉大概一分钟的数据。

存储使用率达到预警值问题?

mongodb删除数据时,不会直接释放磁盘,而是产生很多碎片。这些碎片会被mongodb继续使用,当有新数据插入时,会重复利用这些碎片,不需要新申请磁盘,导致磁盘会处于高水位的使用水平,由于碎片只会被所属的库使用,在新建很多库的情况下,会使磁盘资源越来越紧张。解决方法:

  • 使用命令:df -TH,查看系统的空间使用情况,查看是哪个数据盘资源负载过高,理想情况下,考虑提升系统资源,否则按以下方法排查处理。
  • 将准备节点清空,重新同步同步 备节点同步的过程中,碎片空间会被清理。备节点同步的是完全的数据和索引。然后再进行一次主备切换,再将主节点数据清空,同步一次,最终让主备节点都达到释放碎片的目的。
  • 使用compact命令 compact是mongodb中的压缩命令,可以删除数据产生的碎片。在WiredTiger引擎下,该命令会将整理出的空间释放给操作系统: 进入要执行的数据库:db.runCommand({compact:"库名/集合名",force:true}),在每一个节点上都需要执行,且带force:true参数,否则出错。
  • 做repairDatabase 在mongodb数据库中运行db.repairDatabase() , 或者 db.runCommand({ repairDatabase: 1 })、或带几个参数: db.runCommand({ repairDatabase: 1, preserveClonedFilesOnFailure: , backupOriginalFiles: } ),这是官方认为唯一可以回收磁盘空间的方法,不过,能不用的情况下,尽量不用,会花费很多时间与性能的。

相关推荐

ubuntu24.04下kubernetes1.30环境搭建

设置root用户密码#在Ubuntu系统中,默认情况下root用户是被禁用的(没有设置密码)#而是通过sudo命令让普通用户临时获取管理员权限,#如果需要启用或修改root密...

Canonical 在 Ubuntu 24.10 发布之前对 Snap 进行了更多改进

作为Ubuntu桌面临时工程总监,OliverSmith介绍了Ubuntu24.10的最新进展。在Ubuntu24.10功能冻结之前,GNOME47测试版已经登陆Ubuntu...

Ubuntu Touch OTA-5手机系统发布:细化电源配置等

IT之家8月2日消息,UBports基金会于7月30日发布UbuntuTouch20.04OTA-5版本更新,距离上次OTA-4更新发布相隔6个月时间。Ubuntu...

Ubuntu更契合英特尔酷睿Ultra,综合性能比Win11高15%

IT之家12月23日消息,英特尔本月推出酷睿UltraMeteorLake处理器,那么Win11和Ubuntu发行版两者时间,谁能更好地发挥其性能呢?国外科技媒体phoron...

针对英特尔酷睿CPU优化,Canonical发布Ubuntu实时内核

IT之家7月27日消息,Canonical今天宣布针对支持时序协调运算(TCC)和时间敏感网络(IEEETSN)的英特尔酷睿处理器,推出优化版实时Ubuntu内核。Canonical...

在Ubuntu/Debian上设置永久DNS域名服务器

在Linux上设置自定义DNS服务器可以提高性能和安全性,甚至可以通过DNS阻止一些使用地理屏蔽的网站。有几种方法可以做到这一点,包括在许多Linux发行版中包括的NetworkManagerGUI...

宣布延期:Ubuntu 24.04 LTS第一个版本发布推迟两周

Ubuntu开发团队原计划于8月19日星期四发布Ubuntu24.04.1LTS。然而,由于发现几个重大升级错误,发布被推迟。Ubuntu24.04.1LTS的新发布日期现定为...

Ubuntu系统已经十岁了 10月新推14.10版

|责编:李鑫比较非主流的Ubuntu系统刚刚推出了14.10版,同时大家也可能不知道其实它已经十岁了!它的第一次公布时间为2004年的10月呢。在这次十周年更新中,Ubuntu为用...

wsl2在休眠后的时间偏差问题的修复

笔记本电脑在日常使用中,常常会有进入休眠状态的情况。休眠对于wsl2而言,却造成了时间偏差的问题,休眠期间wsl2的时间停止了。这个问题的根治,需要等微软。本文提供的是一种简单的修复办法。ntp是网络...

基于Ubuntu22.04源码安装配置RabbitVCS过程记录

基于Ubuntu22.04源码安装配置RabbitVCS过程记录安装开始时间开始时间:2025年7月18日17:09(北京时间)系统:Ubuntu22.04用户:itgather时区:A...

GNOME 46桌面环境发布,Ubuntu 24.04 LTS和Fedora 40率先预装

IT之家3月21日消息,GNOME团队今天发布公告,正式推出代号为“Kathmandu”的GNOME46桌面环境,并已经开放下载。Fedora40发行版将于4月发布,率先预装...

如果大家同意的话 Ubuntu可能很快就会有一个新的垃圾桶图标

Ubuntu贡献者目前正在构思一个新的垃圾桶图标,该图标最早可能在10月份Ubuntu25.10发布时出现在Dock栏中。关于Ubuntu垃圾桶图标外观的讨论在2019年持续进...

Ubuntu 25.10 通过更安全地获取时间来提供进一步的安全性提升

Canonical宣布将从Ubuntu25.10开始使用一款名为chrony的软件,以实现更安全的时间管理。最终用户无需过于担心这一变化,但它将增强系统安全性,尤其是在加密操作和证书验证方...

Linux 修改系统时间的两种方式

一:更新系统时间的方式1、手动修改通过相关工具来手动修改系统的时间。2、自动同步使用NTP自动同步系统时间。二:手动修改系统时间1、date工具作用:显示和设置系统时间选项:-d<字符串&g...

Ubuntu计划下版本为RISC-V设置RVA23基线,大量硬件无法升级

IT之家7月14日消息,主要Linux发行版之一的Ubuntu计划在其接下来的一个大版本25.10中将对RISC-V处理器的准入门槛设置从此前的RVA20配置文件更新至最新...

取消回复欢迎 发表评论: