一、web的本质
在了解WSGI之前,先明白什么是web应用,而web应用的本质就是:
1、客户端通过浏览器发送一个http请求
2、服务器收到请求后生成一个HTML文档
3、服务器把HTML文档作为相应返回给客户端
4、客户端的浏览器接受到响应的HTML文档并解析显示。
所以,最简单的Web应用就是先把HTML用文件保存好,用一个现成的HTTP服务器软件,接收用户请求,从文件中读取HTML,返回。Apache、Nginx、Lighttpd等这些常见的静态服务器就是干这件事情的。
如果要动态生成HTML,就需要把上述步骤自己来实现。不过,接受HTTP请求、解析HTTP请求、发送HTTP响应都是苦力活,如果我们自己来写这些底层代码,还没开始写动态HTML呢,就得花个把月去读HTTP规范。
正确的做法是底层代码由专门的服务器软件实现,我们用Python专注于生成HTML文档。因为我们不希望接触到TCP连接、HTTP原始请求和响应格式,所以,需要一个统一的接口,让我们专心用Python编写Web业务。
浏览器动态请求页面流程图如下:
二、WSGI是什么
WSGI全称是python web sever gateway interface,是为python语言定义的web服务器和web应用程序或框架之间的一种简单而通用的接口,是基于CGI(common gateway interface)通用网关协议标准设计的,要强调的是WSGI不是一个服务器、框架、python模块或者软件,它是一种规范,而这种规范描述的就是web服务器和web应用或框架之间的通信协议
说白了,WSGI相当与一座“桥梁”,连接着web服务器和web应用程序或框架,不过这个桥的功能有点弱,有时候需要别的桥来帮忙。
三、WSGI的作用
WSGI连接着两方:一方是服务器或网关,另一方是应用程序或应用框架。服务方调用应用方,提供环境信息,以及一个回调函数(提供给应用程序用来将消息头传递给服务器方),并接收Web内容作为返回值。
WSGI中间件,同时实现了服务器和应用程序的api,在服务器和应用程序之间起调解的作用,在应用程序看来,WSGI中间件就是服务器;而在服务器看来,WSGI中间件就是应用程序。
“中间件”组件可以执行以下功能:
1,重写环境变量后,根据目标URL,将请求消息路由到不同的应用对象。
2,允许在一个进程中同时运行多个应用程序或应用框架。
3,负载均衡和远程处理,通过在网络上转发请求和响应消息。
4,进行内容后处理,例如应用XSLT样式表。
四、WSGI的实现
4.1 wsgi application
WSGI协议要求:
the application object接受两个参数且可以被多次调用
这两个参数分别为:
参数一:environ:是一个CGI式的字典;
参数二:start_response:是一个回调函数:application用来向server传递http状态码/消息/http头
注意:
1、协议要求可调用对象必须将响应体封装成一个可迭代的strings返回。
2、可调用对象是指:函数、方法、类或者带有callable方法的实例。
3、可调用对象都可以作为the application object
# the application object. 可以使用其他名字,
# 但是在使用mod_wsgi 时必须为 "application"
def application( environ, start_response):
# 构造响应体,以可迭代字符串形式封装
response_body = "<h2>OK</h2>"
# HTTP 响应码及消息
status = '200 OK'
# 提供给客户端的响应头.
# 封装成list of tuple pairs 的形式:
# 格式要求:[(Header name, Header value)].
response_headers = [('Content-Type', 'text/plain'),
('Content-Length', str(len(response_body)))]
# 将响应码/消息及响应头通过传入的start_reponse回调函数返回给server
start_response(status, response_headers)
# 响应体作为返回值返回
# 注意这里被封装到了list中.
return [response_body]
4.2 wsgi server
wsgi server接收request请求,封装一系列环境变量,按照wsgi规范调用注册的wsgi app,最后将response返回给客户端。
WSGI server必须要调用application,同时,从application的协议要求可知:
第一: WSGI server必须向application提供环境参数,因此,自身也必须能够获取环境参数。
第二: WSGI server接收application的返回值作为响应体。
wsgi server的基本工作流程:
1,服务器创建socket,监听端口,等待客户端连接。
2,当有请求来时,服务器解析客户端信息放到环境变量environ中,并调用绑定的handler来处理请求。
3,handler解析这个http请求,将请求信息例如method,path等放到environ中。
4,wsgi handler再将一些服务器端信息也放到environ中,最后服务器信息,客户端信息,本次请求信息全部都保存到了环境变量environ中。
5,wsgi handler 调用注册的wsgi app,并将environ和回调函数传给wsgi app
6,wsgi app 将reponse header/status/body 回传给wsgi handler
最终handler还是通过socket将response信息塞回给客户端。
#最简单的WSGI server为Python自带的wsgiref.simple_server
from wsgiref.simple_server import make_server
httpd = make_server('localhost', 8080, application)
httpd.serve_forever()