Apache全解(三)_URL与HTTP请求

By | 2019年 11月 23日

URI

URI: Uniform Resource Identifier 统一资源标识,分为URL和URN

  1. URN: Uniform Resource Naming,统一资源命名
  2. URL: Uniform Resorce Locator,统一资源定位符,用于描述某服务器某特定资源位置

示例: P2P下载使用的磁力链接是URN的一种实现
magnet:?xt=urn:btih:660557A6890EF888666
==两者区别== :URN如同一个人的名称,而URL代表一个人的住址。换言之,URN定义某事物的身份,而URL提供查找该事物的方法。URN仅用于命名,而不指定地址

URL组成

在这里插入图片描述

URL组成:
<scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>
scheme:方案,访问服务器以获取资源时要使用哪种协议
user:用户,某些方案访问资源时需要的用户名
password:密码,用户对应的密码,中间用:分隔
Host:主机,资源宿主服务器的主机名或IP地址
port:端口,资源宿主服务器正在监听的端口号,很多方案有默认端口号
path:路径,服务器资源的本地名,由一个/将其与前面的URL组件分隔
params:参数,指定输入的参数,参数为名/值对,多个参数,用;分隔
query:查询,传递参数给程序,如数据库,用?分隔,多个查询用&分隔
frag:片段,一小片或一部分资源的名字,此组件在客户端使用,用#分隔

URL示例

http://www.magedu.com:8080/images/logo.jpg
ftp://mage:password@172.16.0.1/pub/linux.ppt
rtsp://videoserver/video_demo/
*Real Time Streaming Protocol*

网站访问量

  1. IP(独立IP):即Internet Protocol,指独立IP数。一天内来自相同客户机IP地址只计算一次,记录远程客户机IP地址的计算机访问网站的次数,是衡量网站流量的重要指标
  2. PV(访问量): 即Page View, 页面浏览量或点击量,用户每次刷新即被计算一次,PV反映的是浏览某网站的页面数,PV与来访者的数量成正比,PV并不是页面的来访者数量,而是网站被访问的页面数量
  3. UV(独立访客):即Unique Visitor,访问网站的一台电脑为一个访客。一天内相同的客户端只被计算一次。可以理解成访问某网站的电脑的数量。网站判断来访电脑的身份是通过来访电脑的cookies实现的。如果更换了IP后但不清除cookies,再访问相同网站,该网站的统计中UV数是不变的
  4. 网站统计:http://www.alexa.cn/rank/

网站访问量

  1. QPS:request per second,每秒请求数
  2. PV,QPS,并发连接数换算公式:
    QPS= PV* 页⾯衍⽣连接次数/ 统计时间(86400)
    并发连接数 =QPS * http平均响应时间
  3. 峰值时间:每天80%的访问集中在20%的时间里,这20%时间为峰值时间
  4. 峰值时间每秒请求数(QPS)=( 总PV数 页⾯衍⽣连接次数)80% ) / ( 每天秒数 * 20% )

Web服务请求处理步骤

在这里插入图片描述

一次完整的http请求处理过程

(一)、建立连接:

接收或拒绝连接请求

(二)、接收请求:

接收客户端请求报文中对某资源的一次请求的过程

Web访问响应模型(Web I/O)
1. 单进程I/O模型:启动一个进程处理用户请求,而且一次只处理一个,多个请求被串行响应
2. 多进程I/O模型:并行启动多个进程,每个进程响应一个连接请求
3. 复用I/O结构:启动一个进程,同时响应N个连接请求
实现方法:多线程模型和事件驱动
4. 多线程模型:一个进程生成N个线程,每线程响应一个连接请求
事件驱动:一个进程处理N个请求
5. 复用的多进程I/O模型:启动M个进程,每个进程响应N个连接请求,同时接收M*N个请求

在这里插入图片描述
(三)、处理请求:

服务器对请求报文进行解析,并获取请求的资源及请求方法等相关信息,根据方法,资源,首部和可选的主体部分对请求进行处理
元数据:请求报文首部

<method> <URL> <VERSION>
HEADERS 格式 name:value
<request body>
#<Method>:GET、POST、HEAD、PUT、DELETE、TRACE、OPTIONS

示例:

Host: www.magedu.com   #请求的主机名称
Server: Apache/2.4.7
(四)、 访问资源:

服务器获取请求报文中请求的资源web服务器,即存放了web资源的服务器,负责向请求者提供对方请求的静态资源,或动态运行后生成的资源
资源放置于本地文件系统特定的路径:DocumentRoot

#配置:
DocumentRoot  /var/www/html
#存放路径
/var/www/html/images/logo.jpg
#访问方法
http://www.magedu.com/images/logo.jpg
  • web服务器资源路径映射方式:
    (a) DocumentRoot
    (b) alias
    (c) 虚拟主机docroot
    (d) 用户家目录docroot
(五)、 构建响应报文:

一旦Web服务器识别除了资源,就执行请求方法中描述的动作,并返回响应报文。响应报文中 包含有响应状态码、响应首部,如果生成了响应主体的话,还包括响应主体
1)响应实体: 如果事务处理产生了响应主体,就将内容放在响应报文中回送过去。响应报文中通常包括:
描述了响应主体MIME类型的Content-Type首部
描述了响应主体长度的Content-Length
实际报文的主体内容
2)URL重定向: web服务构建的响应并非客户端请求的资源,而是资源另外一个访问路径
分为:永久重定向、临时重定向

3)MIME类型: Web服务器要负责确定响应主体的MIME类型。多种配置服务器的方法可将MIME类型与资源管理起来
▷魔法分类:Apache web服务器可以扫描每个资源的内容,并将其与一个已知模式表(被称为魔法文件)进行匹配,以决定每个文件的MIME类型。这样做可能比较慢,但很方便,尤其是文件没有标准扩展名时
▷显式分类:可以对Web服务器进行配置,使其不考虑文件的扩展名或内容,强制特定文件或目录内容拥有某个MIME类型
▷类型协商: 有些Web服务器经过配置,可以以多种文档格式来存储资源。在这种情况下,可以配置Web服务器,使其可以通过与用户的协商来决定使用哪种格式(及相关的MIME类型)"最好"

(六)、 发送响应报文

Web服务器通过连接发送数据时也会面临与接收数据一样的问题。服务器可能有很多条到各个客户端的连接,有些是空闲的,有些在向服务器发送数据,还有一些在向客户端回送响应数据。服务器要记录连接的状态,还要特别注意对持久连接的处理。对非持久连接而言,服务器应该在发送了整条报文之后,关闭自己这一端的连接。对持久连接来说,连接可能仍保持打开状态,在这种情况下,服务器要正确地计算Content-Length首部,不然客户端就无法知道响应什么时候结束了

(七)、 记录日志

最后,当事务结束时,Web服务器会在日志文件中添加一个条目,来描述已执行的事务

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注