百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

CDN加速技术,开发人员也必须要搞清楚

nanshan 2024-11-08 12:38 52 浏览 0 评论

各位志同道合的朋友们大家好,我是一个一直在一线互联网踩坑十余年的编码爱好者,现在将我们的各种经验以及架构实战分享出来,如果大家喜欢,就关注我,一起将技术学深学透,我会每一篇分享结束都会预告下一专题

前几天,我们讲到了为何引入缓存且应该什么时候引入,并且讲到了我们生产中缓存的读写策略是什么,忘记了的可以自行去文章列表看下,同时又单独深入讲解了redis哨兵机制(Redis 哨兵机制以及底层原理深入解析,这次终于搞清楚了)和缓存穿透问题的解决方案(缓存穿透问题,开发中真实解决方案)。至此,我们现在的系统架构已经是这样子的了

于架构图我们可以看出,我们现在使用了分布式缓存来加速动态请求的各种数据,但是,我们的系统中其实还有很多的静态资源的,并且请求量也是超级大的。例如:

  1. 移动端APP,有很多的图片,小视频以及流媒体等。
  2. 对于网站来说,不仅有上面那些资源之外,还有大量的HTML 文件,css文件以及Javascript文件等。

现在我们的一个商城里面,有很多的商品图片,并且详情页还有产品介绍视频,目前这些静态资源均是放在Nginx服务器上的,请求量很大,并且这些文件对于访问速度要求极高,并且占据很高的带宽。这里就会很有可能出现访问速度变慢,将带宽占满从而影响我们后端动态请求。这个时候我们就需要考虑该怎么去对这些静态资源做加速了。

如何思考加速

首先我们想一下可不可以也用分布式缓存来存储达到加速的目的呢?答案肯定是不行的,因为:

  1. 图片或者视频文件大小都不小,在几兆到几百兆之间。
  2. 我们的用户是遍地全国各地的甚至还有国外用户,需要让用户能很快的得到相应,即就近访问,我们不能全国各地都建机房去部署缓存,不现实。
  3. 图片或视频信息文件很大,访问量又极高,这样,如果自建机房带宽肯定是会面临极大的风险。

因此,我们不能自建机房来加速静态资源,我们需要在我们的应用服务器外层加一层静态资源处理的组件,并且还能遍地全国各地让用户能就近访问,还能让这些缓存命中率很高,以至于尽量减少回源到我们自己的业务服务器,这种技术就是我们下面要说的CDN。

CDN核心技术

CDN 其实就是网络分发的一种技术,它将我们的静态资源分发到各个地理位置不同的机房服务器上,这样就能实现用户就近访问的问题,且加快静态资源的访问速度。

你可能会说,cdn这玩意我们开发又用不到,不用去掌握的吧,其实不然,建议你不要只是将自己一直放在只是开发的位置,你要有掌控全局的决心,很多cdn排查的工作都是需要资深工程师才能干的,所以你要了解这门技术,现在假如让你来配置cdn和排查CDN问题,你可能就会因为自身技术壁垒而感到束手无策。

首先,我们来看看搭建一个CDN系统需要考虑的两个关键点:

  1. 怎样才能让用户请求先映射到CDN服务器上,这应该是最基本的了。
  2. 怎样根据用户所处的地理位置,选出离他最近的CDN节点给用户访问。

接下来,我们就基于上面考虑点来一起来看看CDN技术是怎么实现静态资源的加速。

如何将用户请求落到CDN服务器上

12306网站我们应该都不陌生,它是有很多的cdn节点来让我们就近访问提供静态资源加速的,而我们输入的网址就是12306自己家的网址,并不是cdn的ip。这是为什么呢?因为如果直接提供给用户cdn 节点IP的话,如果IP改变怎么办,那所有的静态资源都得改变地址,这种是很不靠谱的,所以都是直接给我们服务的自己家域名,然后隐藏住CDN 的IP,那这种机制该怎么做呢?其实大家应该能猜得到,就是运用DNS 进行域名映射。

DNS(Domain Name System)就是一个存储域名和 IP 映射的分布式数据库,其中域名解析返回的结果有两种:

  1. 直接返回域名对应的 IP 地址。
  2. 返回另一个域名,即将当前域名解析到另一个域名,会跳转到另一个域名解析上,现在我们就是通过这种方式来解决上面域名映射问题

下面我们就来看看具体的是怎么操作的。

假设我们的一级域名为 a.com ,那么我们就可以将图片服务域名定义为“img.a.com”,然后将这个域名的解析结果配置到CDN提供的域名上。例如,ucoud提供一个这样的域名“78f98.cdn.ucloud.com.cn”,我们的系统图片地址是这个样子"img.a.com/100.jpg"。

用户在请求100.jpg 地址的时候,DNS服务器就会将这个域名解析到78f98.cdn.ucloud.com.cn 域名上,然后再将这个域名解析到CDN的IP地址,这样就得到了CDN上资源数据了。

我们知道其实DNS解析是有个问题的就是,因为域名解析过程是分好几个级别的,每一级有专门的域名服务器承担其解析的职责,所以,域名的解析过程有可能需要跨越公网做多次 DNS 查询,在性能上是比较差的。

经过了向多个 DNS 服务器做查询之后,整个 DNS 的解析的时间有可能会到秒级别,那我们应该解决这个问题呢?

这里,我就将我们在做数据抓取的时候是怎么解决这个性能问题告诉大家,希望给遇到同样问题的朋友一点思路。即如果是APP的项目话,我们就在APP启动的时候,对需要的域名进行预解析,然后将解析结果缓存到一个LRU缓存中,LRU缓存算法可以看前面的文章哈(LRU缓存淘汰算法,这次没人再说你不会开发)。这样,如果我们使用这个域名的时候,就先从缓存中获得对应的 IP ,如果没有的话,就再走整个DNS 的查询过程。这个时候缓存中解析结果可能会变更,这样就会缓存数据失效,我们可以起一个定时任务,去定期的更新缓存中的数据就行了。这种方案在解析性能上还是提升不少的,基本控制在200ms以内。

通过上面我们已经知道了用户的请求是怎么到达CDN服务器的,并且针对DNS的解析进行了相关的讲解同时对于性能问题也给出了自己开发中的建议,现在我们再来看看它的整体架构图,来整体回顾下。

怎么才能找到离用户最近的CDN节点

现在,我相信大家肯定都掌握了如何让用户的请求怎么请求到CDN上了,接下来我们就要看另一个问题了,就是我们应该怎么将最近的CDN节点分给用户。

GSLB(Global Server Load Balance)这个组件就是对于部署在不同地理位置的服务器做负载均衡,其下面也可能管理了很多的本地负载均衡组件,主要有两个作用:

GSLB它可以通过多种策略,来保证返回的CDN 服务器与用户尽量保证在同一个地理区域。例如可以通过将用户的 IP 分为n多不同的地理区域,然后将CDN 服务器对应到各个区域里,这样就可以根据用户所在的区域来返回相应的CDN节点。现在再来看看其现在的架构图:

当然,是否能够从 CDN 节点上获取到资源还取决于 CDN 的同步延时,一般在使用CDN时是这样的流程:

  1. 我们先通过CDN厂商提供的接口将静态资源写到CDN的其中一个节点上。
  2. CDN 自己内部会将静态资源同步到各个节点。

我们知道其实只要有同步,肯定是会有延时的,一旦我们无法从选定的 CDN 节点上获取到数据,我们就不得不从源站获取数据,而用户网络到源站的网络可能会跨越多个主干网,这样不仅性能上有损耗,也会消耗源站的带宽,带来更高的研发成本。所以,我们在使用 CDN 的时候需要关注 CDN 的命中率和我们自身服务器的带宽情况。

总结,今天我们学习了使用CDN技术对我们的静态资源进行加速,主要有两个核心知识,一个是如何将用户请求落到CDN节点上,另一个则是怎么才能选择用户最近的CDN节点给用户。CDN技术并不是运维的专属,我们开发人员应该要掌握其核心知识,这样我们在遇到这方面问题时才不会显得那么不专业,如果今天的内容对你有帮助,恰好你又喜欢就关注我,我会持续更新开发中实战案例方案,谢谢。

下一篇预告:讲讲分布式调度的话题

在wx【架构师修炼】菜单中可获取专属架构视频资料,专注分享 java架构、python系列、人工智能系列、小程序等,你会感谢我的哈

相关推荐

今晚拿下PHP反序列化的一系列操作

引言在CTF中反序列化类型的题目还是比较常见的,之前有学习过简单的反序列化,以及简单pop链的构造。这次学习内容为php内置的原生类的反序列化以及一点进阶知识。在题目给的的代码中找不到可利用的类时,这...

Win10安装Apache和PHP(apache安装php模块)

说明:虽然PHPStudy之类的软件给我们提供了方便的集成环境,但是其使用的是非线程安全的PHP版本(NotThreadSafe,NTS),某些功能不可以使用。所以,我们还需要自己再安装一个Apa...

腾讯云云函数部署laravel项目(腾讯云函数 selenium)

1、购买函数套餐包在Serverless控制台,选择函数套餐包进行购买2、新建函数服务2.1、模板创建选择函数URL:新建函数URL,启用公网访问:2.1.1、postman访问首页2.1.2、pos...

站长教你搭建属于自己的网站(站长教你搭建属于自己的网站是什么)

每个人都希望可以有自己的网站,因为那样高端大气上档次,低调奢华有内涵,尤其是公司用户,一般会有自己的网站。而个人呢,也可以搭建自己的网站博客,论坛等,但是一般个人都是搭建博客的。好了,那么下面站长教你...

微信公众号开发出现 cURL error 60: SSL certificate problem ssl证书

在phpstudy的环境下如果出现这样的报错cURLerror60:SSLcertificateproblem:unabletogetlocalissuercertificat...

【网络安全】关于PHP Study nginx解析高危漏洞的预警通报

网络安全近日,山石网科安全研究院监测发现PHPStudyWindows最新版本存在nginx解析漏洞,可以造成任意代码执行。一、漏洞情况phpStudy是一个PHP调试环境的程序集成包,该程序包集成...

PHP 环境 搭建教程(php环境搭建教程linux)

PHP是一种编程语言,很多网站都用PHP语言编写,我们有时候需要测试一个网站,就需要PHP环境才能运行,又要安装Apache、又要安装MySQL……真的非常麻烦。其实我们可以使用PHP集成...

黑客搭建钓鱼平台,手把手教你如何钓鱼?

跨站脚本攻击XSS:通过HTML注入篡改了网页,插入了恶意的脚本,从而用户浏览网页时,控制用户浏览器的一种攻击那么,我们搭建一个XSS钓鱼平台吧,注意:这个平台仅用于学习和测试,小伙伴们不要动有坏心思...

php源码网站搭建方法和过程(php网站源码完整)

web网站是我们上网的窗口,而网站是如何搭建的呢?今天我们来做一个介绍,以php代码为例来进行介绍(后续会介绍一下java代码搭建,如果想要我这里涉及的工具或源码请私信我)。1、首先你需要去网上下载你...

使用VS Code调试PhpStudy环境里的代码

最近几个月把所有项目都迁过来VSCode了(除了因为Unity调试问题反而用回了VisualStudio),PHP也就抛弃了最强的PhpStorm。这段时间抽空在帮朋友处理PHP项目,然...

phpstudy搭建PHP+Mysql服务(用phpstudy搭建服务器)

PHP是一种创建动态交互性站点的强有力的服务器端脚本语言。PHP是免费的,并且使用非常广泛。同时,对于像微软ASP这样的竞争者来说,PHP无疑是另一种高效率的选项。(1)PHP环境搭建使用V...

Windows安装phpstudy(Windows安装mysql)

说明:phpstudy是一个PHP+MySQL+Apache的集成环境,可以减少单独部署各个所需软件的麻烦,以及更加方便地切换版本。phpenv、wamp等软件的作用一样。由于环境的不同,安装过程中可...

phpstudy安装及简单使用教程(phpstudy安装教程详解)

phpstudy前不久爆出有后门,我的看法是,去看下是哪个版本有后门,为啥会有后门,怎么解决掉这个后门,而不是听到后门就弃用了。毕竟phpstudy绿色安装,配置简单,多版本融合,真香。前言:关于开发...

如何对dedeCMS的开源程序进行二次开发

二次开发,简单的说就是在现有的软件上进行定制修改,功能的扩展,然后达到自己想要的功能和效果,一般来说都不会改变原有系统的内核。为了让更多人了解二次开发,并更方便的了解DedeCMS的二次开发,下面将会...

mysql基础问题三问(底层逻辑;正在执行;日志观察)

背景:经常面试会遇到且实际工作中也会应用到的三个场景:目录:一.mysql查询时的底层原理是什么?二.如何查看正在执行的mysql语句?三.如何观察mysql运行过程中的日志信息?-----...

取消回复欢迎 发表评论: