一直以来,网络在很大程度上都是围绕着HTTP的请求/响应模式而构建的。所有的HTTP通信都是由客户端控制的,这就需要用户进行互动或者定期轮询,以便从服务器加载数据。长期以来存在着各种技术让服务器得知有新数据可用时,立即将数据发送都客户端,这些技术种类繁多,例如推送或则“Comet”。
但是这些解决方案都存在一个相同的问题:由于HTTP协议的开销,导致他们不适合做低延迟的应用。为了解决这些问题,WebSocket将网络套接字引入到客户端和服务器端,浏览器和服务器之间可以通过套接字建立持久的通信,双方随时都可以互相发送数据给对方,而不是之前由客户端控制的请求————应答模式。
现在,很多网站为了实现消息推送,所用的技术都是采用的轮询。轮询是在特定的时间间隔(1s),由浏览器对服务器发出HTTP REQUEST,然后由服务器返回最新的数据给客户端浏览器。这种传统的模式具有很明显的缺点,即浏览器需要不断地向服务器发出请求,然而HTTP request和Header是非常冗长的,里面包含的可用数据比例很可能非常低,这回占用很多的带宽和服务器资源。
WebSocket是HTML5开始提供的一种浏览器与服务器进行全双通信的网络技术,WebSocket通信协议与2011年被IEIF定位标准RFC6455,WebsSocket api被W3c定为标准。
在WebSocket api中,浏览器和服务器只需要做一个握手的动作,然后,浏览器和服务器之间形成了一条快速通道,两者就可以之间互相传输消息数据了。WebSocket基于TCP双向全双工进行消息传递,同一时刻,既可以发送消息,也可以接受消息,相比HTTP的半双工协议,性能得到很大的提升。
WebSocket设计出来的目的就是取代轮训和Comet技术,使客户端浏览器具备向C/S架构下桌面系统一样的实时通讯能力。浏览器通过javascript 向服务器发出建立WebSocket连接的请求,连接成功后,客户端和服务端可以通过TCP直接交互数据。因为WebSocket连接本质上就是一个TCP连接,所以在数据传输的稳定性和数据传输量的大小方面,和轮训即Comet技术相比,具有很大的优势。
建立WebSocket连接时,需要通过客户端或者浏览器发出握手请求,请求消息如图所示:
为了建立一个WebSocket 连接,客户端浏览器首先向服务器发起一个HTTP请求,这个请求和通常的HTTP请求不同,包含了一些附加头信息,其中附加头信息“Upgrade:Websocket”表明这是一个申请协议升级的HTTP请求。服务端解析这些附加头信息,然后生成应答信息返回客户端,客户端和服务端的WebSoket连接就建立起来了,双方可以通过这个连接通道自由传递信息,并且这个连接会持续存在直到客户端或服务器端的某一方主动关闭连接。
请求消息中的"sec-websocket-key"是随机的,服务器会用这些数据构造出一个SHA-1的消息摘要,把“sec-websocket-key”加上一个魔幻字符串“*************”。使用SHA-1加密,然后进行Base64编码,将结果作为"sec-websocket-accept"头的值,返回给客户端。
握手成功之后,服务端和客户端就可以通过“message”的方式进行通信了,一个消息有一个或多个帧组成,WebSocket的消息并不一定对应一个特定网络层的帧,他可以被分割成多个帧或者被合并。
帧都有自己对应的类型,属于同一消息的多个帧具有相同的数据类型。从广义上讲,数据类型可以使文本数据、二进制数据和控制帧。
为了关闭WebSocket 连接,客户端和服务端需要通过一个安全的方法关闭底层TCP连接以及TLS会话。如果合适,丢弃任何可能已经接受的字节:必要时,可以通过任何手段关闭连接。
底层的TCP连接,在正常的情况下,应该首先由服务器关闭。在异常的情况下,客户端可以发起TCP close 指令。因为,当服务器被指示关闭WebSocket连接时,它应该立即发起一个TCP Close操作;客户端应该等待服务器的TCP close.
WebSocket 的握手关闭消息带有一个状态码和一个可选关闭原因,它必须按照协议要求发送一个Close 控制帧,当对端接受到关闭帧指令时,需要主动关闭Websocket 连接。