从输入URL到加载页面的完整过程以及http报文的解析

    xiaoxiao2023-10-11  153

    当我们需要访问网络上的页面时,在浏览器输入URL(或者说网址),浏览器就会显示相应的页面。 但是计算机和网络所经历的过程却远比表面上看到的要复杂,那么具体经历了什么呢。

    总体流程图:

    第一步 输入URL,域名服务器(DNS)解析域名,映射为IP地址

    为了标识互联网上的每一台计算机并使他们能够互相找到对方,国际组织NIC(Network Information Center)负责为每一台连接到互联网的计算机分配唯一的IP地址,用于标识本台计算机(注意:服务器的本质也是计算机,所以普通计算机也可以用作服务器)。所以当互联网的某台计算机想要获取互联网上的资源时,必须提供对方的IP地址。 然而IP地址太难记忆且复杂,于是域名系统(DNS,Domain Name System)诞生。DNS是将(便于辨认和记忆的)域名和IP地址相互映射的一个分布式数据库。每一个域名对应一个或多个IP地址(大型企业比如百度的服务器就不止一个,所以IP地址就不止一个,而他的域名是唯一的)。这样,当我们想要访问互联网的计算机时,只要输入他的域名,那么浏览器就会将域名提交给域名服务器解析为对应的IP地址(一个域名对应多个IP地址时,域名系统会提供最近的IP地址)。然后浏览器再根据IP地址访问对应计算机。

    第二步 建立TCP连接

    第一步获取了IP地址后,第二步计算机便可向目的服务器发送http请求。 根据计算机层次的规则,高层协议的运作建立在低层协议的完善。http协议属于应用层,IP属于网络层。所以http协议的连接的前提是运输层的TCP连接。 TCP的连接则是三次握手建立连接。

    第三步 发送http请求命令

    建立TCP连接后,客户端便可以向服务器发送http请求,服务器也会相应地给客户端返回http响应。(相互传送数据)。客户端向服务器发送http请求报文,请求报文由三部分组成:请求行、请求头、请求体。 (1)get请求报文体,因为get请求的参数放在url中,所以最后的请求数据为空 (2)post请求报文体,post请求的参数放在请求体中,即最后一行 ①请求方法:HTTP/1.1 定义的请求方法有8种:GET、POST、PUT、DELETE、PATCH、HEAD、OPTIONS、TRACE,最常的两种GET和POST,如果是RESTful接口的话一般会用到GET、POST、DELETE、PUT。 ②URL:为请求对应的URL地址,它和报文头的Host属性组成完整的请求URL ③协议名称及版本号。(HTTP/1.1) ④HTTP的报文头,报文头包含若干个属性,格式为“属性名:属性值”,服务端据此获取客户端的信息。(accept、contenttype等等) ⑤报文体 它将一个页面表单中的组件值通过param1=value1¶m2=value2的键值对形式编码成一个格式化串,它承载多个请求参数的数据。不但报文体可以传递请求参数,请求URL也可以通过类似于“/chapter15/user.html? param1=value1¶m2=value2”的方式传递请求参数。

    第四步 服务器返回http响应报文

    收到http请求后,服务器将会向客户端返回响应报文。 http的响应报文也由三部分组成:响应行、响应头、响应体 (1)一个实际的http响应报文实例(网图)(返回数据类型为JSON格式) ①报文协议及版本; ②状态码及状态描述; ③响应报文头,也是由多个属性组成; ④响应报文体,即传回来的数据。

    (2)我自己的http响应报文实例(部分)(返回数据为text/html) 一些常用的状态码: 200 OK 请求成功(其后是对GET和POST请求的应答文档。) 400 Bad Request 服务器未能理解请求。(前端向后端传数据错误) 401 Unauthorized 被请求的页面需要用户名和密码。 404 Not Found 服务器无法找到被请求的页面。 500 Internal Server Error 请求未完成。服务器遇到不可预知的情况。(一般是后台代码错误) 502 Bad Gateway 服务器从上游服务器收到一个无效的响应。 505 HTTP Version Not Supported 服务器不支持请求中指明的HTTP协议版本。 其它更多状态码参考:http://www.w3school.com.cn/tags/html_ref_httpmessages.asp

    客户端(浏览器)接收到响应报文后,例如html文档,解析渲染显示html。

    之后客户端还会发送请求,比如html中引用了js、css等等文件,客户端会继续发送请求获取文件资源。

    第五步 关闭TCP连接

    结束访问后,TCP即可断开连接 四次挥手关闭TCP连接

    参考文章: https://www.jianshu.com/p/eb3e5ec98a66 https://www.cnblogs.com/guobm/p/9739704.html

    最新回复(0)