百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

干货分享 | DNS解析故障实战案例及排查方法

nanshan 2025-02-15 16:44 18 浏览 0 评论

近日,中科三方技术团队成功帮助某大型央企排除域名解析故障。此次故障发生在该公司的网络系统中,对其日常运营造成了影响。故障发生后,该公司相关人员立即与中科三方取得联系,寻求技术支持。中科三方快速响应,并组织技术团队进行会诊,最终成功找到问题所在,排除故障难题,保障了该公司域名解析的正常运行。

通过与该公司的沟通了解到,该公司为了实现IPv4/IPv6双栈及其他域名解析场景,需对其官网的DNS服务器进行迁移。作为该公司的域名服务商,中科三方及时提供技术支撑,进行了SOA记录的设置,成功完成授权DNS服务器的切换转移。但在切换完成后,该公司的技术人员通过测试发现,新的DNS服务器未生效,网站域名仍使用原DNS服务器。

在接到该公司的问题反馈后,中科三方技术团队立即对SOA记录进行了检查,在发现设置无误后,随即通过whois查询工具发现,该公司域名已切换至新的DNS服务器。

在排除了SOA授权出错的可能外,中科三方技术团队使用自研递归解析监测系统对该域名进行了全方位检查,发现多个递归解析节点不生效,随后使用nslookup命令的查询结果也与此一致,由此技术人员判断是由于DNS缓存未刷新,导致新切换的DNS服务器未生效。在等待一段时间,DNS缓存失效后,再次通过测试发现新的DNS服务器生效。

在排查DNS服务器不生效的过程中,中科三方技术人员还发现了两个严重的潜在问题。

一,该公司新切换的DNS服务器未做A记录设置

访客对网站发起解析请求时,会委托递归DNS服务器进行全球解析查询,依次从根域名服务器、顶级域名服务器,最终在权威域名服务器获取最新的权威数据。如果DNS服务器未做A记录,就会导致顶级域名服务器在收到递归服务器的请求时,无法给出该DNS服务器(权威服务器)的地址,从而导致域名解析的失败,影响访客对网站的正常访问。在发现该问题后,中科三方立即反馈给该公司相关负责人,在最短时间内完成DNS服务器A记录的添加,避免造成更严重的影响。

二,存在一条NS记录将主域名指向一台未知服务器

NS(Name Server)记录是域名服务器记录,用来指定该域名由哪个DNS服务器来进行解析,因此在上述场景中,这个未知的服务器充当了主域名的DNS服务器的角色,提供域名解析服务。经过排查发现,该未知服务器不可用,不会对公司域名解析正确性造成影响,但是会因为对DNS服务器的轮询,产生一定的解析时延。在确定该条NS记录对公司业务系统没有影响的情况下,中科三方配合该公司技术人员完成对此条NS记录的删除。

经过数小时的紧张工作,中科三方技术团队成功帮助该公司解决域名解析故障,使系统恢复正常功能,同时凭借专业的经验,排除了两个潜在的安全隐患,避免了更多解析安全故障的发生。该公司对中科三方的技术支持表示衷心感谢,对中科三方团队专业的技术实力和丰富的实战经验给予了高度评价。

DNS解析是互联网中非常重要的基础服务,如果DNS解析发生故障就会对网站的正常运行造成严重影响,因此掌握DNS解析故障排查的思路非常重要。

DNS故障排查思路

当发生解析故障时,首先要检查解析记录是否设置正确,包括域名注册商所提供的SOA记录,尤其需要注意的是使用云解析DNS对默认线路的添加,因解析记录设置错误而导致解析不生效的情况在实际场景中比较常见也比较容易解决。

其次,可以通过whois查询工具,检查域名状态是否正常,如果域名未续费、未实名,就会被域名注册局/商暂停解析,此时域名会出现serverhold、clientHold等状态,这种情况下就会出现域名解析不生效。

第三,检查DNS缓存是否刷新,修改解析记录或者修改DNS服务器,都需要等待DNS缓存失效后,各地DNS服务器才能同步新的记录,可以使用nslookup命令查询缓存是否刷新,如果测试发现权威解析生效,本地解析(公共解析)未生效即代表DNS缓存尚未刷新。

最后,还有一种情况是解析过程受到上级网络设施的强行阻断,可以通过dig+trace测试,本地DNS向根DNS服务器查询时,直接返回IP地址,一般可判断为DNS查询在根DNS服务器处就被阻断,DNS遭到缓存投毒被劫持。这种情况可通过清理DNS缓存或更换本机DNS服务器来解决。

以上就是域名解析故障常用的排查思路,基本上能够解决大部分域名解析不生效难题。但由于实际业务场景比较复杂,具体问题仍需具体分析,在遇到解析故障时,应尽快与域名服务商取得联系,寻求专业的技术支持,才能更快更准确定位问题所在,排除故障解决问题,最大程度降低因域名解析造成的影响。

相关推荐

CentOS 7 搭建 Harbor2.4.1 Docker镜像仓库

上一篇文章我们使用了registry镜像来搭建Docker私有镜像仓库,但是使用体验不是很好,没有一个可管理的UI界面,管理很麻烦。本篇文章将介绍一个新的搭建Docker镜像仓库的工具叫做Har...

简单认识认识mqtt及mosquitto(mqtt报文解析)

某项目中使用了MQTT作为进程间的通信方式,之前没用过,这两篇笔记我们就来一起学习一下这种方式。MQTT的一些介绍以下介绍内容来自《[野火]《LwIP应用开发实战指南》MQTT协议全称是Messa...

全源码打造高性能 LNMP 架构: 实战教程(2025最新版)

适用场景:企业生产环境、自建Web服务、深度性能调优操作系统:CentOS7/8、RockyLinux、Debian、Ubuntu(本文以CentOSStream9为例)技术栈:N...

Nacos3.0重磅来袭!全面拥抱AI,单机及集群模式安装详细教程!

之前和大家分享过JDK17的多版本管理及详细安装过程,然后在项目升级完jdk17后又发现之前的注册和配置中心nacos又用不了,原因是之前的nacos1.3版本的,版本太老了,已经无法适配当前新的JD...

Ubuntu24.04.2 企业级MinIO存储系统部署指南

一、概要1.1MinIO架构解析MinIO是一款高性能的云原生对象存储系统,采用Golang开发并遵循ApacheLicensev2.0协议。其核心架构基于纠删码(ErasureCode)技...

从零打造自己的 国产鸿蒙(OpenHarmony)定制系统-完整可落地流程

适用版本:OpenHarmony4.0/5.0Standard目标人群:想在x86PC、RK3568开发板或自有硬件上裁剪、加品牌、预装应用并生成可刷机镜像的开发者/团队目录环境准...

一次暂未成功的dify安装经历(dify怎么安装)

前几天在阿里云买了一台机,这几天一直在尝试安装dify,到现在还没安装上我是按这个教程装的https://blog.csdn.net/2401_82469710/article/details/14...

ZLMediaKit教程(五)支持webrtc(webrtc lib)

ZLMediaKit系列文章(共六篇):ZLMediaKit流媒体(一)编译安装ZLMediaKit教程(二)主程序和配置文件解析ZLMediaKit教程(三)URL规则ZLMediaKit教程...

Linux程序安装与管理指南(linux程序安装命令大全)

在Linux系统中,安装和管理程序主要通过包管理器和手动编译安装两种主要方式实现。以下是详细的操作指南,涵盖常见发行版(如Ubuntu/Debian、CentOS/RHEL、Fedora等)的用法。一...

离线状态下安装 Nginx 各个模块?这篇攻略让你轻松搞定

你是不是也在为离线状态下安装Nginx各个模块而发愁?在互联网大厂后端开发工作中,我们常常会遇到一些特殊的网络环境,比如公司内部的离线服务器,或是处于隔离状态的测试环境。当需要在这些离线环境中安装...

Rust实践:Win10环境下的openssl交叉编译

Rust支持跨平台,可以指定生成目标平台,交叉编译也是支持的。当然,想要交叉编译成功,还需要指定平台的编译器(如:msvc、gcc等)。openssl是C语言开发的库,如果在Rust代码中用到open...

Linux下Blackwell架构显卡(RTX5070/5090)编译PaddlePaddle指南

Blackwell显卡架构如RTX5070\5090等显卡当前Paddle预编译版本中包含的GPU架构(即SM架构)是有限的,比如常见的SM75(T4)、SM86(A10)、SM89(...

突破操作系统界限,掌握Linux的必备指南

#头条创作挑战赛#简介Linux是一种开源的操作系统,它的核心思想是自由和开放。Linux以其稳定性、可靠性和安全性而闻名,被广泛用于服务器和嵌入式设备中。Linux创始人Linux安装在安装Linu...

Linux日常高频使用的100条命令,强烈建议收藏

查看系统信息如何查看系统版本:uname-alsb_release-acat/etc/os-release如何查看系统内核信息:uname-r如何查看系统CPU信息:lscpucat...

Linux文件系统结构全解析(linux文件结构详解)

对Linux新手而言,“一切皆文件”的设计哲学常让人既兴奋又困惑——打开终端输入ls/,看到的bin、etc、var等目录到底有什么用?如何快速定位关键文件?本文将从Linux文件系统的底层逻...

取消回复欢迎 发表评论: