HTTP格式
每个HTTP请求和响应都遵循相同的格式,一个HTTP包含Header和Body两部分,其中Body是可选的。
HTTP协议是一种文本协议,所以,它的格式也非常简但
HTTP GET请求的格式:
GET /path HTTP/1.1
Header1: Value1
Header2: Value2
Header3: Value3
每个Header一行一个,换行符是\r\n。
HTTP POST请求的格式:
POST /path HTTP/1.1
Header1: Value1
Header2: Value2
Header3: Value3
body data goes here...
当遇到连续两个\r\n时,Header部分结束,后面的数据全部是Body。
HTTP响应的格式:
200 OK
Header1: Value1
Header2: Value2
Header3: Value3
body data goes here...
HTTP响应如果包含body,也是通过\r\n\r\n来分隔的。
请再次注意,Body的数据类型由Content-Type头来确定,如果是网页,Body就是文本,如果是图片,Body就是图片的二进制数据。
当存在Content-Encoding时,Body数据是被压缩的,最常见的压缩方式是gzip,所以,看到Content-Encoding: gzip时,需要将Body数据先解压缩,才能得到真正的数据。压缩的目的在于减少Body的大小,加快网络传输。
\r\n是换行 \r是为了兼容微软的浏览器 使编写的程序能全浏览器使用
创建套接字
tcp_server_socket = socket.socket(socket.AF_INET,socket.SOCK_STREAM)
socket.socket(AddressFamily,Type)#套接字的创建格式
函数socket.socket创建一个socket,返回该socket的描述符,该函数带有两个参数:1.Address Family :可以选择AF_INET(用于internet进程间通信)或者AF_UNK(用于同一台机器进程间通信),实际工作中常用AF_INET
2.Type:套接字类型,可以是SOCK_STREAM(流式套接字,主要用于TCP协议)或者SOCK_DGRAM(数据报套接字,主要用于UDP协议)
tcp_server_socket.setsocket(socket.SOL_SOCKET,socket.SO_REQUEADDR,1) 这个语句可以让服务器的端口重复利用,避免出现服务器先发出关闭请求后 短时在连接服务器出现的端口被占用的错误服务器中一切的外链资源:CSS js 图片,视频等都会重新发起请求;最后1的作用是结束后立即释放端口。
编写服务器时 如果客户端请求的路径是根路径的话,服务器最好给根路径绑定一个主页面,不要让用户在访问根路径的时候出现404页面。
父进程在生成子进程的同时复制所有资源在子进程中进程关闭时有关闭两次,线程则不会复制,所以只需要关闭一次。
随着用户的增加 网站的压力越来越大 进程和线程逐渐无法满足需求,需要运用协程来减小网站压力
猴子插件既from gevent import monkey monkey.patch_all() 的作用时把有延迟操作和阻塞的对象替换成gevent对象
进程:
多进程,主进程和子进程之间资源不是共享的,子进程复制一份主进程,所以 主程序中,要把主进程close ,然后等待子进程执行完 close。程序才会结束。
线程:多线程,主线程和子线程之间资源是共享的。子线程不复制主线程,所以这里的主程序没有close了,只有子线程中有。
多任务的好处:
当多个浏览器同时访问服务器时,不会阻塞。服务器不可能只为一个浏览器服务,所以多任务是必须的。线程占用资源更少。
协程才是占用资源更少