百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

秒杀:用CDN把请求处理在服务器之外

nanshan 2024-12-18 16:00 16 浏览 0 评论

一. 前言

后端程序员碰到这个概念的场景其实不多,我首次碰到还是在搭建自己博客网站的时候。

用最直观的场景来描述就是 : 买的服务器带宽太低,导致前端下载静态文件卡顿。

解决的方式是 : 将域名配置 CDN , 让静态文件获取不走后端服务器。

在高并发的系统中, CDN 可以帮助用户对静态文件分流,减少服务器负载.

二. 先看流程

2.1 原本的问题

  1. 请求直接打到业务源服务器上面,占用资源(带宽,CPU,端口,内存等等)
  2. 请求很难就近选择服务端,数据传输过程长,稳定性差,延时高
  3. 恶意请求会直接打到服务器上,增加风险
  4. 稳定性差,业务稳定性依赖于源服务器的可用性

2.2 CDN 的处理流程

  1. 当用户向源域名 (image.a.com) 发起请求的时候,会发起 DNS 查询
  2. DNS 基于源域名通过 CNAME 获取到 CDN 域名 (dns.a.com
  3. 请求在 CDN 服务节点中,通过智能路由选择最近的 CDN 节点 (PS :这一步也可以通过负载均衡 DNS 实现)
  4. 用户获取解析IP 地址 , 向 IP 地址发起访问
  5. 访问 CDN 节点如果没有缓存,则透传到源节点访问,同时回写 CDN

关于智能路由

智能路由是指根据用户的地理位置、网络状况和其他条件,动态地选择最优的 CDN 节点来提供内容。

这个机制可以在 CDN 服务节点中实现,也可以在 DNS 服务集群中实现。从阿里藏经阁中找到的文档就能看到 :

通过 DNS 调度服务找到了对应最近的 IP ,再直接访问对应的 IP 地址。

三. 再看使用

以某云为例,当初几块钱搞了一个域名 :

先看专业术语

  • CDN : 内容分发网络 (Content Delivery Network)
  • 边缘节点 : 即 CDN 节点 ,本质上是部署在全球的服务器,用于缓存和分发内容
  • Cache 缓存 : 即 CDN 上缓存的请求内容
  • 源站 : 存储网站或应用程序内容的实际服务器
  • 回源 : 当用户请求的内容在 CDN 节点上没有缓存时,CDN 节点向源站服务器请求获取内容,并将其缓存到节点上
  • 缓存命中和缓存未命中 : 存在缓存时则为缓存命中
  • 清除缓存 : 当数据不正确时,需要把 CDN 节点上的内容清除
  • DDoS 防护 : 帮助抵御恶意的 DDoS 攻击

四. 深入原理

4.1 怎么把 CDN 配置到 DNS 里面

第一步就是让请求打到 CDN 服务器 ,而不是源服务器。要实现这一步最终还是需要 DNS 的配合

java复制代码// 方式一 : CNAME 记录
- 1. CDN 服务提供商提供一个用于 CDN 的域名
- 2. 在 DNS 解析服务提供商 中配置 CNAME , 将源域名指向 CDN 域名
- 3. DNS 辅助访问源域名时自动指向 CDN 域名 

// 方式二 : A 记录
- 1. 从 CDN 服务商处获取 CDN 节点的 IP 列表
- 2. 将 IP 列表配置到 DNS 的 A 记录中,走常规的 DNS 解析 IP 的流程

CNAME 是什么 ?

  • CNAME 是 DNS 记录类型之一,全称为“Canonical Name”(规范名字)
  • CNAME 是创建了一个域名的别名,将一个域名指向另外一个域名
  • 通过 CNAME 可以把加速域名指向 CDN 域名,这样 DNS 就能将请求解析到 CDN 域名

A 记录是什么 ?

  • DNS 的基础概念,用于将域名映射到 IPv4 地址
  • 一个域名可以配置多个 IP 地址

4.2 CDN 命中失败的原因

  • 客户端请求是动态请求
  • 源站返回强制不缓存的HTTP 头
  • 未返回响应头Etag 和Last-modified
  • 全站加速未配置静态加速

4.3 CDN 缓存慢的原因

  • 刷新缓存,可能导致短时间内命中率下降。
  • 带宽突增,会导致CDN 节点回源较多,命中率会表现有下降趋势。
  • CDN 节点访问新内容,导致CDN 节点回源较多,命中率会表现有下降趋势。
  • 缓存规则调整,可能会影响命中率。

五. 成本估算及场景

5.1 成本估算

  • 参考国内的阿里云和腾讯云 ,10TB的 CDN 总量大概在 1200 左右
  • 掘金里面第一次访问一个页面的流量大概在3M左右 (后续访问会走本地缓存,这一块实际上不会走到 CDN)
  • 那么 10TB CDN 平均可以支持 300万 次单页面的访问 (假设忽略浏览器缓存和大图片)

这个价格相比扩充带宽肯定是更划算的,带宽闲时供应商可不会给你减钱哦,同时处理网络请求带来的负载消耗也不小。

看了一下掘金的 img 确实走的 CDN 。

5.2 适用场景

  • 静态文件缓存 : 如图片、样式表、脚本等
  • 流媒体和视频分发 : 分发流媒体和视频内容,减少视频加载时间和缓冲 (不过我感觉流媒体走 DNS 效果可能不好)
  • 动态内容加速 :应该是基于关键字进行缓存,功能肯定没有服务端的强大
  • 全球负载均衡 :根据用户的地理位置和网络状况,将请求路由到最优的服务器节点
  • 高峰期缓存预热 :支持缓存内容的刷新和预热,确保内容更新后能及时生效

5.3 一般服务商会提供的功能

  • 访问控制 :白名单 、 盗链 、鉴权 、QPS 、限速 、端口限制 等等
  • 缓存规则 :基于缓存键 ,基于状态码 ,基于 HTTP 头部 ,缓存过期时间等等
  • 回源方式 : 分片 ,回源请求头配置 , 超时时间等等
  • HTTPS 配置 : 版本,配置等
  • 定制化 : 错误页面,指定状态码,压缩等等

总结

这篇是系列文章的第一篇,后续会陆陆续续把并发场景的知识点详细的过一遍。

想做一个秒杀的全流程系列文章,只能做后端层面的压测,所以前端限制这一块只能通过概念的形式展现了~~

CDN 原理了解就行,应用使用供应商的服务即可,基本上云开发商都提供了这些服务接口。

作者:AntBlack
链接:https://juejin.cn/post/7261434671182446629

相关推荐

删库之后不要着急跑路,教你神不知鬼不觉找回数据

在工作中,我们误删数据或者数据库,我们一定需要跑路吗?我看未必,程序员一定要学会自救,神不知鬼不觉的将数据找回。在mysql数据库中,我们知道binlog日志记录了我们对数据库的所有操作,所以...

数据库告警不可用,增删改受阻(数据库限制删除)

前言:昨晚,突然出现服务不可用告警,查看日志上线报文入库到数据库很慢并受阻,出现数据不同步问题。排查问题查看发现服务都是在执行update、insert这些DML命令的时候,报的数据库执行超时。经过一...

Binlog实现MySQL复制,5个关键步骤,务必掌握!

复制是MySQL最重要的功能之一,MySQL集群的高可用、负载均衡和读写分离都是基于复制来实现的。Binlog就是实现主从复制的关键,主数据库将修改操作记录到Binlog中,从数据库通过解...

MySQL数据实时增量同步到Elasticsearch

Mysql到Elasticsearch的数据同步,一般用ETL来实现,但性能并不理想,目前大部分的ETL是定时查询Mysql数据库有没有新增数据或者修改数据,如果数据量小影响不大,但如果几百万上千万的...

MySQL 数据库恢复:如何执行时间点恢复(PITR)以挽救受损数据?

天津鸿萌科贸发展有限公司从事数据安全服务二十余年,致力于为各领域客户提供专业的数据恢复、数据备份、数据取证、数据迁移、网络安全、数据清除等解决方案,并针对企业面临的数据安全风险,提供专业的相关数据安全...

阿里面试:MySQL Binlog有哪些格式?底层原理?优缺点?

binlog的格式也有三种:STATEMENT、ROW、MIXED,下面我详解binlog三种模式@mikechenStatement模式Statement模式:是基于SQL语句的复制(statem...

快速带你读懂MySQL的binlog写入机制

深入讲解MySQL中的重要日志binlog的写入机制以及影响IO性能的关键配置,并且介绍了如何利用binlog去恢复数据,保证MySQL的可靠性。Q:binlog写入时机binlog的写入逻辑并...

MySQL 误删除数据恢复全攻略:基于 Binlog 的实战指南

在MySQL的世界里,二进制日志(Binlog)就是我们的"时光机"。它默默记录着数据库的每一个重要变更,就像一位忠实的史官,为我们在数据灾难中提供最后的救命稻草。本文将带您深入掌握如...

一文了解MySQL Binlog(一文了解肝脏有益和有害的食物)

MySQL的Binlog日志是一种二进制格式的日志,Binlog记录所有的DDL和DML语句(除了数据查询语句SELECT、SHOW等),以Event的形式记录,同时记录语句执行时...

数据丢失?别慌!MySQL备份恢复攻略

想象一下,某个晴朗的午后,你正享受着咖啡,突然接到紧急电话:你的网站或APP彻底挂了!系统崩溃,界面全白。虽然心头一紧,但你或许还能安慰自己:系统崩溃只是暂停服务,数据还在,修复修复就好了。然而,如果...

Mysql中的bin log、redo log、undo log的区别

最近在整理面试题,在看mvcc的时候看到了undolog,今天索性把这三个log都记录一遍。MySQL的逻辑架构说之前先说一下MySQL的基本架构,MySQL主要分为两层:Server层和存储引...

binlog日志定时清理(binlog清理规则)

binlog日志binlog是MySQL数据库的一种日志文件,用于记录所有对数据的修改操作。binlog全称为binarylog,它以二进制格式记录MySQL服务器上所有的修改操作,包括对哪个数据库...

茶水间炸锅了!菜鸟误删用户表,运维老张的MySQL救命三招!

(公司茶水间,运维老张、开发小王和新人小李围着咖啡机)小李:(紧张兮兮)张哥!我...我好像把测试库的用户表删了!下午演示咋办啊?老张:(淡定喝咖啡)慌啥?昨晚的备份是吃干饭的?走,教你恢复!一、基础...

解决运维痛点,提高运维安全性-雷池 SafeLine WAF新功能身份认证

雷池介绍使用雷池SafeLineWAF已经两年多了,在1.5.x版本时就已经开始测试使用,并在推出LTS版本后转入LTS分支。近期雷池SafeLineWAF重点更新了身份认证功能,并提供了SS...

【Docker 新手入门指南】第十五章:常见故障排除

一、前期准备:收集关键信息在排查问题前,建议先获取以下系统数据,便于精准定位故障:1.系统基础信息#查看Docker版本(确认是否为最新稳定版)dockerversion#查看...

取消回复欢迎 发表评论: