一、HTTP简介
1.http协议介绍
- HTTP协议(HyperText Transfer Protocol,超文本传输协议)是因特网上应用最为广泛的一种网络传输协议,所有的WWW文件都必须遵守这个标准。
- HTTP是基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)
- HTTP协议通常承载于TCP协议之上,有时也承载于TLS或SSL协议层之上,这个时候,就成了我们常说的HTTPS。如下图
- HTTP是一个应用层协议,由请求和响应构成,是一个标准的客户端服务器模型。HTTP是一个无状态的协议。
- HTTP默认的端口号为80,HTTPS的端口号为443。
2.http协议工作流程
一次HTTP操作称为一个事务,其工作过程大概如下:
- 用户在浏览器中键入需要访问网页的URL或者点击某个网页中链接;
- 浏览器根据URL中的域名,通过DNS解析出目标网页的IP地址;
浏览器请求这个页面:http://hackr.ip/index.html
在这一步,需要域名系统DNS解析域名hackr.ip,得主机的IP地址 20X.189.105.112。
然后将上面结合本机自己的信息,封装成一个http请求数据包
- 在HTTP开始工作前,客户端首先会通过TCP/IP协议来和服务端建立链接(TCP三次握手)
- 建立连接后,客户机发送一个请求给服务器,请求方式的格式为:统一资源标识符(URL)、协议版本号,后边是MIME信息包括请求修饰符、客户机信息和可内容。
- 服务器接到请求后,给予相应的响应信息,其格式为一个状态行,包括信息的协议版本号、一个成功或错误的代码,后边是MIME信息包括服务器信息、实体信息和可能的内容。
- 一般情况下,一旦Web服务器向浏览器发送了请求数据,它就要关闭TCP连接,然后如果浏览器或者服务器在其头信息加入了这行代码:Connection:keep-alive,TCP连接在发送后将仍然保持打开状态,于是,浏览器可以继续通过相同的连接发送请求。保持连接节省了为每个请求建立新连接所需的时间,还节约了网络带宽。
2.1 短连接
短连接的操作步骤是: 建立连接——数据传输——关闭连接...建立连接——数据传输——关闭连接
如果客户请求频繁,将在TCP的建立和关闭操作上浪费较多时间和带宽。
2.2 长链接
长链接,指在一个连接上可以连续发送多个数据包,在连接保持期间,如果没有数据包发送,需要双方发链路检测包。
长链接操作步骤: 建立连接——数据传输...(保持连接)...数据传输——关闭连接
长连接可以省去较多的TCP建立和关闭的操作,减少浪费,节约时间
长链接分为 without pipelining 和 with pipelining,下图中是without pipelining,客户端只在收到前一个请求的响应后,才发出新的请求。
2.3 管线化
下图是with pipelining,每次建立链接后无需等待请求回来就可以发送下一个请求
3. Http请求报文
客户端发送一个HTTP请求到服务器的请求消息包括以下格式:
请求行(request line)、请求头部(header)、请求体组成,下图给出了请求报文的一般格式。
请求行:
方法:
GET 获取资源
POST 向服务器端发送数据,传输实体主体
PUT 传输文件
HEAD 获取报文首部
DELETE 删除文件
OPTIONS 询问支持的方法
TRACE 追踪路径
协议/版本号
URL
请求头:
通用首部(General Header)
请求首部(Request Header)
响应首部(Response Header)
实体首部(Entity Header Fields)
请求体
请求报文拆解:
3.1 get请求
3.2 post请求
4. Http响应报文
HTTP响应组成:响应行、响应头、响应体。
响应行
(HTTP/1.1)表明HTTP版本为1.1版本,状态码为200,状态消息为(ok)
响应头
Date:生成响应的日期和时间;
Content-Type:指定了MIME类型的HTML(text/html),编码类型是ISO-8859-1
响应体
响应报文拆解:
5. Http状态码
| 类别 | 原因 | 
| 1XX | Informational(信息性状态码) | 
| 2XX | Success(成功状态码) | 
| 3XX | Redirection(重定向) | 
| 4XX | Client Error(客户端错误状态码) | 
| 5XX | Server Error(服务器错误状态吗) | 
5.1 2XX 成功
200(OK 客户端发过来的数据被正常处理
204(Not Content 正常响应,没有实体
206(Partial Content 范围请求,返回部分数据,响应报文中由Content-Range指定实体内容
5.2 3XX 重定向
301(Moved Permanently) 永久重定向
302(Found) 临时重定向,规范要求,方法名不变,但是都会改变
303(See Other) 和302类似,但必须用GET方法
304(Not Modified) 状态未改变, 配合(If-Match、If-Modified-Since、If-None_Match、If-Range、If-Unmodified-Since)
307(Temporary Redirect) 临时重定向,不该改变请求方法
5.3 4XX 客户端错误
400(Bad Request) 请求报文语法错误
401 (unauthorized) 需要认证
403(Forbidden) 服务器拒绝访问对应的资源
404(Not Found) 服务器上无法找到资源
5.4 5XX 服务器端错误
500(Internal Server Error)服务器故障
503(Service Unavailable) 服务器处于超负载或正在停机维护
6. 首部
6.1 通用首部字段
| 首部字段名 | 说明 | 
| Cache-Control | 控制缓存行为 | 
| Connection | 链接的管理 | 
| Date | 报文日期 | 
| Pragma | 报文指令 | 
| Trailer | 报文尾部的首部 | 
| Trasfer-Encoding | 指定报文主体的传输编码方式 | 
| Upgrade | 升级为其他协议 | 
| Via | 代理服务器信息 | 
| Warning | 错误通知 | 
6.2 请求首部字段
| 首部字段名 | 说明 | 
| Accept | 用户代理可处理的媒体类型 | 
| Accept-Charset | 优先的字符集 | 
| Accept-Encoding | 优先的编码 | 
| Accept-Langulage | 优先的语言 | 
| Authorization | Web认证信息 | 
| Expect | 期待服务器的特定行为 | 
| From | 用户的电子邮箱地址 | 
| Host | 请求资源所在的服务器 | 
| If-Match | 比较实体标记 | 
| If-Modified-Since | 比较资源的更新时间 | 
| If-None-Match | 比较实体标记 | 
| If-Range | 资源未更新时发送实体Byte的范围请求 | 
| If-Unmodified-Since | 比较资源的更新时间(和If-Modified-Since相反) | 
| Max-Forwards | 最大传输跳数 | 
| Proxy-Authorization | 代理服务器需要客户端认证 | 
| Range | 实体字节范围请求 | 
| Referer | 请求中的URI的原始获取方 | 
| TE | 传输编码的优先级 | 
| User-Agent | HTTP客户端程序的信息 | 
6.3 响应首部字段
| 首部字段名 | 说明 | 
| Accept-Ranges | 是否接受字节范围 | 
| Age | 资源的创建时间 | 
| ETag | 资源的匹配信息 | 
| Location | 客户端重定向至指定的URI | 
| Proxy-Authenticate | 代理服务器对客户端的认证信息 | 
| Retry-After | 再次发送请求的时机 | 
| Server | 服务器的信息 | 
| Vary | 代理服务器缓存的管理信息 | 
| www-Authenticate | 服务器对客户端的认证 | 
6.4 实体首部字段
| 首部字段名 | 说明 | 
| Allow | 资源可支持的HTTP方法 | 
| Content-Encoding | 实体的编码方式 | 
| Content-Language | 实体的自然语言 | 
| Content-Length | 实体的内容大小(字节为单位) | 
| Content-Location | 替代对应资源的URI | 
| Content-MD5 | 实体的报文摘要 | 
| Content-Range | 实体的位置范围 | 
| Content-Type | 实体主体的媒体类型 | 
| Expires | 实体过期时间 | 
| Last-Modified | 资源的最后修改时间 | 
参考:
- HTTP简介
- HTTP协议详解
- HTTP
- HTTP工作过程
    
    










