Apache全解(二)_http协议

By | 2019年 11月 23日

HTTP服务通信过程

在这里插入图片描述
在这里插入图片描述

HTTP相关术语

  1. http: Hyper Text Transfer Protocol, 80/tcp
  2. html: Hyper Text Markup Language 超文本标记语言,编程语言
  3. CSS: Cascading Style Sheet 层叠样式表
  4. js: javascript

HTML示例:

<html>
<head>
<title>html语言</title>
</head>
<body>
<img src="url..." >
<h1>你好</h1>
<p><a href=http://www.baidu.com></a>百度搜索</p>
</body>
</html>

MIME

Multipurpose Internet Mail Extensions 多用途互联网邮件扩展
参考:http://www.w3school.com.cn/media/media_mimeref.asp

/etc/mime.types
格式:

major/minor
text/plain
text/html
text/css
image/jpeg
image/png
video/mp4
application/javascript

HTTP工作机制

  1. http请求:http request
  2. http响应:http response
  3. 一次http事务:请求<-->响应
  • Web资源:web resource
    一个网页由多个资源构成,打开一个页面,会有多个资源展示出来,但是每个
    资源都要单独请求。因此,一个“Web 页面”通常并不是单个资源,而是一组资
    源的集合
    • 静态文件:无需服务端做出额外处理
      文件后缀:.html, .txt, .jpg, .js, .css, .mp3, .avi
    • 动态文件:服务端执行程序,返回执行的结果
      文件后缀:.php, .jsp ,.asp
在这里插入图片描述

并行连接

在这里插入图片描述

串行,持久连接和管道

提高HTTP连接性能
1. 并行连接:通过多条TCP连接发起并发的HTTP请求
2. 持久连接:keep-alive,长连接,重用TCP连接,以消除连接和关闭的时延,以事务个数和时间来决定是否关闭连接
3. 管道化连接:通过共享TCP连接发起并发的HTTP请求
4. 复用的连接:交替传送请求和响应报文(实验阶段)

HTTP协议

在这里插入图片描述


1. http/0.9:1991,原型版本,功能简陋,只有一个命令GET。GET /index.html ,服务器只能回应HTML格式字符串,不能回应别的格式
2. http/1.0: 1996年5月,支持cache, MIME, method
+ 引入了POST命令和HEAD命令
+ 每个TCP连接只能发送一个请求,发送数据完毕,连接就关闭,如果还要请求其他资源,就必须再新建一个连接
+ 头信息是 ASCII 码,后面数据可为任何格式。服务器回应时会告诉客户端,数据是什么格式,即Content-Type字段的作用。这些数据类型总称为MIME 多用途互联网邮件扩展,每个值包括一级类型和二级类型,预定义的类型,也可自定义类型, 常见Content-Type值:text/xml image/jpeg audio/mp3
3. http/1.1:1997年1月
+ 引入了持久连接(persistent connection),即TCP连接默认不关闭,可以被多个请求复用,不用声明Connection: keep-alive。对于同一个域名,大多数浏览器允许同时建立6个持久连接
+ 引入了管道机制(pipelining),即在同一个TCP连接里,客户端可以同时发送多个请求,进一步改进了HTTP协议的效率
+ 新增方法:PUT、PATCH、OPTIONS、DELETE
+ 同一个TCP连接里,所有的数据通信是按次序进行的。服务器只能顺序处理回应,前面的回应慢,会有许多请求排队,造成"队头堵塞"(Head-of-line blocking)
+ 为避免上述问题,两种方法:一是减少请求数,二是同时多开持久连接。网页优化技巧,如合并脚本和样式表、将图片嵌入CSS代码、域名分片(domain sharding)等
+ HTTP 协议不带有状态,每次请求都必须附上所有信息。请求的很多字段都是重复的,浪费带宽,影响速度
4. HTTP2.0: SPDY的升级版
+ 头信息和数据体都是二进制,称为头信息帧和数据帧
+ 复用TCP连接,在一个连接里,客户端和浏览器都可以同时发送多个请求或回应,且不用按顺序一一对应,避免了“队头堵塞“,此双向的实时通信称为多工(Multiplexing)
+ 引入头信息压缩机制(header compression),头信息使用gzip或compress压缩后再发送;客户端和服务器同时维护一张头信息表,所有字段都会存入这个表,生成一个索引号,不发送同样字段,只发送索引号,提高速度
+ HTTP/2 允许服务器未经请求,主动向客户端发送资源,即服务器推送(server push)

HTTP1.0和HTTP1.1的区别

  1. 缓存处理,在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准,HTTP1.1则引入了更多的缓存控制策略例如Entity tag,If-Unmodified-Since, If-Match, If-None-Match等更多可供选择的缓存头来控制缓存策略
  2. 带宽优化及网络连接的使用,HTTP1.0中,存在一些浪费带宽的现象,例如客户端只是需要某个对象的一部分,而服务器却将整个对象送过来了,并且不支持断点续传功能,HTTP1.1则在请求头引入了range头域,它允许只请求资源的某个部分,即返回码是206(Partial Content),方便了开发者自由的选择以便于充分利用带宽和连接
  3. 错误通知的管理,在HTTP1.1中新增24个状态响应码,如409(Conflict)表示请求的资源与资源当前状态冲突;410(Gone)表示服务器上的某个资源被永久性的删除
  4. Host头处理,在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址,因此,请求消息中的URL并没有传递主机名(hostname)。但随着虚拟主机技术的发展,在一台物理服务器上可以存在多个虚拟主机(Multi-homed Web Servers),并且它们共享一个IP地址。HTTP1.1的请求消息和响应消息都应支持Host头域,且请求消息中如果没有Host头域会报告一个错误(400 Bad Request)
  5. 长连接,HTTP 1.1支持长连接(PersistentConnection)和请求的流水线(Pipelining)处理,在一个TCP连接上可以传送多个HTTP请求和响应,减少了建立和关闭连接的消耗和延迟,在HTTP1.1中默认开启Connection: keep-alive,弥补了HTTP1.0每次请求都要创建连接的缺点
在这里插入图片描述

HTTP1.0和HTTP1.1的区别

HTTP1.0和1.1现存的问题

  1. HTTP1.x在传输数据时,每次都需要重新建立连接,无疑增加了大量的延迟时间,特别是在移动端更为突出
  2. HTTP1.x在传输数据时,所有传输的内容都是明文,客户端和服务器端都无法验证对方的身份,无法保证数据的安全性
  3. HTTP1.x在使用时,header里携带的内容过大,增加了传输的成本,并且每次请求header基本不怎么变化,尤其在移动端增加用户流量
  4. 虽然HTTP1.x支持了keep-alive,来弥补多次创建连接产生的延迟,但是keep-alive使用多了同样会给服务端带来大量的性能压力,并且对于单个文件被不断请求的服务(例如图片存放网站),keep-alive可能会极大的影响性能,因为它在文件被请求之后还保持了不必要的连接很长时间

HTTPS

  1. 为解决安全问题,网景在1994年创建了HTTPS,并应用在网景导航者浏览器中。 最初,HTTPS是与SSL一起使用的;在SSL逐渐演变到TLS时(其实两个是一个东西,只是名字不同而已),最新的HTTPS也由在2000年五月公布的RFC 2818正式确定下来。HTTPS就是安全版的HTTP,目前大型网站基本实现全站HTTPS
  2. HTTPS协议需要到CA申请证书,一般免费证书很少,需要交费
  3. HTTP协议运行在TCP之上,所有传输的内容都是明文,HTTPS运行在SSL/TLS之上,SSL/TLS运行在TCP之上,所有传输的内容都经过加密的
  4. HTTP和HTTPS使用的是不同的连接方式,端口不同,前者是80,后者是443
  5. HTTPS可以有效的防止运营商劫持,解决了防劫持的一个大问题
  6. HTTPS 中的SSL握手等过程降低用户访问速度,但是只要经过合理优化和部署,HTTPS 对速度的影响完全可以接受

SPDY

SPDY:2009年,谷歌研发,综合HTTPS和HTTP两者有点于一体的传输协议,主要特点:
1. 降低延迟,针对HTTP高延迟的问题,SPDY优雅的采取了多路复用(multiplexing)。多路复用通过多个请求stream共享一个tcp连接的方式,解决了HOL blocking的问题,降低了延迟同时提高了带宽的利用率
2. 请求优先级(request prioritization)。多路复用带来一个新的问题是,在连接共享的基础之上有可能会导致关键请求被阻塞。SPDY允许给每个request设置优先级,重要的请求就会优先得到响应。比如浏览器加载首页,首页的html内容应该优先展示,之后才是各种静态资源文件,脚本文件等加载,可以保证用户能第一时间看到网页内容
3. header压缩。HTTP1.x的header很多时候都是重复多余的。选择合适的压缩算法可以减小包的大小和数量
4. 基于HTTPS的加密协议传输,大大提高了传输数据的可靠性
5. 服务端推送(server push),采用了SPDY的网页,例如网页有一个sytle.css的请求,在客户端收到sytle.css数据的同时,服务端会将sytle.js的文件推送给客户端,当客户端再次尝试获取sytle.js时就可以直接从缓存中获取到,不用再发请求了

HTTP2.0和SPDY区别:

  1. HTTP2.0 支持明文 HTTP 传输,而 SPDY 强制使用 HTTPS
  2. HTTP2.0 消息头的压缩算法采用 HPACK,而非 SPDY 采用的 DEFLATE

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注