百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

Day1 网络世界入门:从打开浏览器到数据抵达的全过程

nanshan 2025-03-30 19:23 10 浏览 0 评论

在当今数字化时代,网络已成为我们生活中不可或缺的一部分。每天,我们无数次打开浏览器,输入网址,瞬间就能获取到来自世界各地的信息。但你是否想过,从我们在浏览器中敲下网址的那一刻,到数据最终呈现在屏幕上,这背后究竟经历了怎样的过程?今天,就让我们一起揭开网络世界神秘的面纱,深入了解从打开浏览器到数据抵达的全过程。

输入网址:一切的开始

当我们在浏览器的地址栏中输入网址,比如 “www.baidu.com”,这一简单的操作其实开启了一段复杂的旅程。网址,专业术语称为 URL(统一资源定位符),它就像是网络世界的门牌号。以 “https://www.baidu.com/s?wd=网络知识” 为例,“https” 是协议,告诉浏览器使用何种方式与服务器通信;“www.baidu.com” 是域名,对应着服务器的地址;“s” 是路径,指示服务器上的具体资源位置;“wd = 网络知识” 则是参数,用于向服务器传递我们的搜索需求等信息。

在输入网址后,浏览器首先要做的是将域名转换为对应的 IP 地址。因为在网络中,计算机之间是通过 IP 地址来相互识别和通信的。这就需要借助 DNS(域名系统),它如同网络世界的电话簿。当浏览器发现本地缓存中没有该域名对应的 IP 地址时,就会向本地 DNS 服务器发送查询请求。本地 DNS 服务器若在自己的缓存中也未找到匹配项,便会向上级 DNS 服务器,如根域名服务器、顶级域名服务器等发起查询,直至找到该域名对应的 IP 地址,然后将其返回给浏览器。[此处插入一张 DNS 查询流程的示意图,例如从本地 DNS 到根域名服务器、顶级域名服务器再到权威域名服务器的查询路径图]

建立连接:数据传输的桥梁

获取到 IP 地址后,浏览器需要与目标服务器建立连接。最常用的连接方式是基于 TCP(传输控制协议)的三次握手。第一次握手,浏览器(客户端)向服务器发送一个带有 SYN(同步序列号)标志的数据包,告诉服务器自己想要建立连接,并随机生成一个初始序列号 seq=x。此时,客户端进入 SYN_SENT 状态。第二次握手,服务器收到客户端的请求后,会返回一个带有 SYN 和 ACK(确认)标志的数据包。其中,SYN 标志用于同步服务器的序列号,假设为 seq=y,ACK 标志则用于确认收到客户端的请求,确认号 ack=x+1。此时,服务器进入 SYN_RCVD 状态。第三次握手,客户端收到服务器的响应后,再发送一个带有 ACK 标志的数据包,确认号 ack=y+1,告诉服务器自己已收到服务器的确认信息。至此,双方成功建立起可靠的 TCP 连接,进入 ESTABLISHED 状态,为数据传输做好了准备。[插入一张 TCP 三次握手的动态示意图,清晰展示三次握手过程中数据包的交互]

发送请求:传递用户的需求

连接建立后,浏览器会根据我们输入的网址和操作,构建 HTTP(超文本传输协议)请求报文。如果是普通的网页访问,可能是一个 GET 请求,请求报文中会包含我们请求的资源路径等信息。例如,我们访问百度首页,请求报文大致如下:

GET / HTTP/1.1

Host: www.baidu.com

User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9

Accept-Encoding: gzip, deflate, br

Accept-Language: zh-CN,zh;q=0.9

在这个请求报文中,“GET” 表示请求方法,“/” 是请求的资源路径,“HTTP/1.1” 是协议版本。“Host” 字段指定了目标服务器的域名,“User-Agent” 字段描述了客户端的信息,如浏览器类型、操作系统等,这些信息有助于服务器返回适合客户端显示的内容。“Accept” 系列字段则告诉服务器客户端支持的响应内容类型、编码方式和语言等。

浏览器将构建好的 HTTP 请求报文交给传输层,传输层会在其基础上添加 TCP 头部,然后再交给网络层添加 IP 头部,最终形成一个完整的数据包,准备在网络中传输。

数据传输:穿越复杂的网络

数据包从我们的计算机出发,首先会经过本地网络,如家庭或办公室的路由器。路由器就像是网络中的交通枢纽,它会根据数据包的目标 IP 地址,在自己的路由表中查找最佳的转发路径。例如,如果目标 IP 地址属于外网,路由器会将数据包转发到与外网连接的接口。在这个过程中,还会涉及到 ARP(地址解析协议),它负责将目标 IP 地址解析为对应的 MAC(媒体访问控制)地址,因为在局域网内,数据是通过 MAC 地址来进行传输的。[插入一张局域网内数据传输,从计算机到路由器,涉及 ARP 解析的示意图]

数据包离开本地网络后,会在互联网的骨干网络中穿梭。这期间,它可能会经过多个路由器、交换机等网络设备。每个设备都会根据自己的规则和配置,对数据包进行转发、路由等处理,就像接力赛一样,将数据包一步步传向目标服务器所在的网络。在传输过程中,为了确保数据的完整性和可靠性,TCP 协议会对数据包进行编号和确认。如果某个数据包在传输过程中丢失或损坏,接收方会要求发送方重新发送。

服务器响应:提供所需的数据

当数据包最终抵达目标服务器时,服务器会首先检查 IP 头部和 TCP 头部,确认数据包的来源和完整性。然后,将 TCP 头部和 IP 头部剥离,提取出 HTTP 请求报文,交给服务器上运行的 Web 服务程序进行处理。例如,对于百度服务器来说,它会根据请求报文中的路径和参数,如 “/s?wd = 网络知识”,在自己的数据库中查找相关的网页内容和搜索结果。

服务器根据请求生成 HTTP 响应报文,响应报文的格式与请求报文类似,同样包含状态行、头部和正文。例如,一个成功的响应报文可能如下:

HTTP/1.1 200 OK

Content-Type: text/html; charset=utf-8

Content-Length: 12345

Server: Apache/2.4.41 (Ubuntu)

Date: Sun, 16 Aug 2020 10:20:30 GMT

Last-Modified: Sat, 15 Aug 2020 15:30:00 GMT

Cache-Control: max-age=3600

Expires: Sun, 16 Aug 2020 11:20:30 GMT

百度搜索结果

...

...

在这个响应报文中,“HTTP/1.1 200 OK” 是状态行,表示请求成功,“200” 是状态码。“Content-Type” 字段指定了响应内容的类型为 HTML,字符编码为 UTF-8。“Content-Length” 字段告诉客户端响应正文的长度。服务器还会在头部添加一些其他信息,如服务器软件类型、日期、缓存控制等。然后,服务器将响应报文通过网络原路返回给客户端。

接收数据:呈现精彩的内容

客户端(浏览器)接收到服务器返回的响应数据包后,同样会先经过网络层和传输层的处理,剥离 IP 头部和 TCP 头部,提取出 HTTP 响应报文。浏览器会根据响应报文中的内容类型,如 HTML、CSS、JavaScript、图片等,进行相应的解析和渲染。

对于 HTML 页面,浏览器会按照 HTML 的语法规则,将其解析为文档对象模型(DOM)树。然后,根据 CSS 样式表对 DOM 树中的元素进行样式渲染,确定每个元素在页面中的位置、颜色、字体等外观属性。如果页面中包含 JavaScript 脚本,浏览器会逐行解析和执行脚本,实现页面的交互功能,如动态更新页面内容、响应用户的点击事件等。最后,浏览器将渲染好的页面呈现给我们,我们便看到了期待已久的网页内容。

从打开浏览器到数据抵达,这看似简单的操作背后,蕴含着计算机网络领域众多复杂而精妙的技术和原理。了解这一过程,不仅能让我们更好地理解网络世界的运行机制,也有助于我们在日常使用网络时,更好地排查问题、优化网络体验。在后续的文章中,我们还将深入探讨网络世界的更多奥秘,敬请期待。

相关推荐

电脑cpu占用率高?怎么办?1分钟快速解决!

案例:电脑cup过高怎么办?【我的电脑运行缓慢,导致我学习和工作的效率很低。刚刚查看了一下电脑,发现它的cpu占用率很高。有没有小伙伴知道如何解决此电脑cpu过高的问题?】电脑是我们生活中不可缺少的工...

CPU使用率100%怎么办

当电脑的CPU使用率达到100%时,往往会引发一系列令人头疼的问题,如卡顿、过载、过热甚至死机。这些问题不仅严重影响了电脑的正常使用,还可能对硬件造成损害。为了有效应对这一挑战,我们可以采取一系列措施...

提高CPU利用率方法

一、背景:一般小项目服务器的虚拟机服务器CPU很难达到要求的,要求一般都是使用率达到60%-90%,除非是数据库服务器,还有计算很频繁的应用服务器,不然是大部分的都不能达到要求的,无法达到要求,就得是...

Go到Rust:代码对比揭示60% CPU使用率降低的技术路径

Go与Rust作为现代系统级编程语言,在并发处理和内存管理上采取了截然不同的设计哲学。本文通过四个典型场景的代码对比,剖析两种语言在CPU效率层面的核心差异,揭示为何部分技术团队通过语言迁移实现了60...

一招教你解决CPU占用率100%的问题 #电脑小技巧

大家好,今天讲一下CPU占用率100%的解决方法。·首先点运行,在这块输入gpedit.msc回车。·打开管理模板,Windows组件,MicrosoftDefender防病毒。·点开扫描,扫描期间...

技术丨教你降低CPU与内存占用率,让系统快如闪电

当内存和CPU都达到了较大的占用率时,很可能会导致系统崩溃。该如何解决这一问题?本期视频将指导大家:如何有效减少内存和CPU的占用率。快来看看具体操作步骤吧!1.尝试运行ePSA硬件检测首先,尝试运...

Serv00服务器搭建代理节点全流程|无需保号保活|Cloudflare隧道

注册图文教程(2024)「链接」视频教程BiliBili:Serv00服务器搭建代理节点全流程|无需保号保活|Cloudflare隧道|serv00-play脚本_哔哩哔哩_bilibiliS...

600+ 道 Java面试题及答案整理(建议收藏)

小七整理了最近几年最新、最全的Java面试题,题目涉及Java基础、集合、多线程、IO、分布式、Spring全家桶、MyBatis、Dubbo、缓存、消息队列、Linux…等等。题库共6...

网络编程 | 彻底搞懂网络 IO 模型

令人头大的IO说起网络IO相关的开发,很多人都头大,包括我自己,写了几年的代码,对IO相关的术语说起来也是头头是道,什么NIO、IO多路复用等术语一个接一个。但是也就自己知道,这些概念一...

开源全方位运维监控工具:HertzBeat

HertzBeat:实时监控系统性能,精准预警保障业务稳定-精选真开源,释放新价值。概览HertzBeat是一款深受广大开发者喜爱的开源实时监控解决方案。它以其简洁直观的设计理念和免安装Agent的...

网络安全工程师必知的75个网络端口

作为一名网络安全工程师,必须熟知网络端口,一般将端口分为以下3类:(1)公认端口(Well-KnownPorts):范围从0到1023(2)注册端口(RegisteredPorts):从1024到...

PHP技能评测

公司出了一些自我评测的PHP题目,现将题目和答案记录于此,以方便记忆。1.魔术函数有哪些,分别在什么时候调用?__construct(),类的构造函数__destruct(),类的析构函数__cal...

2020年Dubbo30道高频面试题!还在为面试烦恼赶快来看看

前言Dubbo是一个分布式服务框架,致力于提供高性能和透明化的RPC远程服务调用方案,以及SOA服务治理方案。简单的说,dubbo就是个服务框架,如果没有分布式的需求,其实是不需要用的,只有在分布式的...

2018年度回顾:挖矿木马为什么会成为病毒木马黑产的中坚力量

一、概述根据腾讯御见威胁情报中心监测数据,2018年挖矿木马样本月产生数量在百万级别,且上半年呈现快速增长趋势,下半年上涨趋势有所减缓。由于挖矿的收益可以通过数字加密货币系统结算,使黑色产业变现链条十...

自查风险突出的30个服务高危端口

在计算机网络中,端口是一种用于区分不同网络服务或应用程序的逻辑地址。每个网络服务或应用程序都需要至少一个端口(号)来实现网络通信。当某个端口开放时,便能接收来自于其它计算机或网络设备的连接请求和数据。...

取消回复欢迎 发表评论: