WWW:
WWW是一个基于HTTP的客户-服务器应用系统,即属于客户-服务器范型的分布式计算应用
HTTP协议:
TCP/IP 协议栈中(基于TCP/IP通信协议)的应用层的面向对象的协议,工作于客户端-服务端架构之上。
最重要的就是HTTP协议中的HTTP Header, HTTP Header控制着数据的传输,它控制着用户浏览器的渲染行为和服务器的执行逻辑。
为什么HTTP不使用UDP
- udp链接不安全,不可靠,主要应用在不安全性要求不高,效率要求比较高的应用程序,比如聊天程序。http要处理电子商务的应用。
- http协议只定义了应用层的东西,下层的可靠性要传输层来保证,但是没有说一定要用tcp,只要是可以保证可靠性传输层协议都可以承载http,比如有基于sctp的http实现。http也不是不能通过udp承载(如HTTPU),在手机上就有人自己开发基于reliable udp的http协议,不过都是非标准的
- 如果用UDP,网页源文件传输后可能导致很多错误,浏览器解析可能各种报错
通信过程:
- 建立TCP连接(HTTP是在TCP/IP协议栈内的应用层协议)
- 客户端向web服务器发送请求命令
- 客户端发送请求消息头+空行+请求正文
- Web服务器应答,发回代码描述
- web服务器发送应答头消息
- web服务器发送应答消息头+空行+相应正文
- web服务端关闭tcp连接(如果客户端或者服务器在头消息加入了代码Connection:keep-alive则连接仍保持)
主要特点:
- 简单快速:HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
- 灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
- 无连接:限制每次连接只处理一个请求。
- 无状态:对于事务处理没有记忆能力
- 支持B/S及C/S模式。
HTTP请求:
包括三部分——
- 请求方法/URI 协议/版本
- 请求头
- 请求正文(2和3之间用空行分割)
GET /books/java.html HTTP/1.1
Accept: */*
Accept-Language: en-us
Connection: Keep-Alive
Host: localhost
Referer: http://localhost/links.asp
User-Agent: Mozilla/4.0
Accept-Encoding: gzip, deflate
请求方法:
首先声明:HTTP协议没有对传输的数据大小进行限制,HTTP协议规范也没有对URL长度进行限制。
GET:
由get提交的表单数据只经过简单的编码,同时作为URL的一部分发送给服务器,数据存在安全隐患,且URL的长度可能受浏览器或者OS的限制,导致发送数据大小受限。数据存放在QUERY_STRING环境变量中。Servlet使用doGet()处理请求
举个例子:
http://www.test.com/aaa?key1=value1&key2=value2
POST:
提交表单数据时,数据不是作为URL请求的一部分而是作为标准数据传送给web服务器,克服了GET方法中信息无法保密以及数量小(但各个web服务器会规定post所提交的数据大小进行限制)的特点。数据从标准输入流获取,通过Request.Form获取消息。但是,不支持复杂数据类型,因为post没有定义传输数据结构的语义和规则。Servlet使用doPost()处理请求
get和post都是key/value的形式。
还有其他:HEAD, PUT, DELETE, OPTIONS, CONNECT
请求头:
- 通用信息头
通用信息头字段既能用于请求消息,也能用于响应消息,它包括一些与被传输的实体内容没有关系的常用消息头字段。
Cache-Control: no-cache
Connection: close/Keep-Alive
Date: Tue, 11 Jul 2000 18:23:51 GMT
Pragma: no-cache
Trailer: Date
Transfer-Encoding: chunked
Upgrade: HTTP/2.0, SHTTP/1.3
Via: HTTP/1.1 Proxy1, HTTP/1.1 Proxy2
Warning: any text
- 一般请求头
在请求消息中向服务器传递附加信息,主要包括客户端可以接受的数据类型、压缩方法、语言、以及发出请求的超链接所属网页的URL地址等
Accept: text/html,image/*
Accept-Charset: ISO-8859-1,unicode-1-1
Accept-Encoding: gzip,compress
Accept-Language: en-gb,zh-cn
Authorization: Basic enh4OjEyMzQ1Ng==
Expect: 100-continue
From: zxx@it315.org
Host: www.it315.org:80
If-Match: "xyzzy", "r2d2xxxx"
一些常见的字段:
Cache-Control: no-cache
Connection: close/Keep-Alive
HTTP应答:
包括三部分——
- 协议/版本 代码描述
- 响应头(服务器在响应消息中向客户端传递附加信息)
- 相应正文(2和3之间用空行分割)
HTTP/1.1 200 OK
Server: Microsoft-IIS/5.0
Date: Thu, 13 Jul 2000 05:46:53 GMT
Content-Length: 2291
Content-Type: text/html
Cache-control: private
<html>
...</html>
HTTPS
HTTP的安全版本,是一种基于SSL/TLS的HTTP。HTTP以明文方式发送内容,不提供任何方式的数据加密,因而不适合传输敏感信息。HTTPS加入了SSL协议,SSL依靠证书来验证服务器的身份。
与HTTP区别:
- HTTPS用到CA申请证书
- HTTP信息都是明文传输,HTTPS使用SSL加密传输协议
- 二者连接方式不同,HTTP使用端口80,HTTPS位443
URI和URL的区别:
URI,是uniform resource identifier,统一资源标识符,用来唯一的标识一个资源。
URL是uniform resource locator,统一资源定位器,它是一种具体的URI,即URL可以用来标识一个资源,而且还指明了如何locate这个资源。
Keep-Alive字段
HTTP协议采用“请求-应答”模式
- 当处于非KeepAlive模式时,每个请求/应答客户和服务器都要新建一个连接,完成之后立即断开连接(Http为无连接协议)
- 当使用Keep-Alive模式(又称持久连接、连接重用)时,Keep-Alive功能使客户端到服务器端的连接持续有效,当出现对服务器的后继请求时,Keep-Alive功能避免了建立或者重新建立连接。
http 1.0中默认是关闭的,需要在http头加入"Connection: Keep-Alive",才能启用Keep-Alive;http 1.1中默认启用Keep-Alive,如果加入"Connection: close ",才关闭。目前大部分浏览器都是用http1.1协议,也就是说默认都会发起Keep-Alive的连接请求了,所以是否能完成一个完整的Keep-Alive连接就看服务器设置情况。
在请求时,如要保持连接,则设置Connection:keep-Alive,否则设置close;响应时,如果显示Connection:close,为无连接状态,否则显示Keep-Alive:300,表示保持连接300秒