简介
aiohttp
是Python3
下的一个异步的HTTP
库,它可以作为客户端请求数据也可以作为服务器使用。安装很简单。。
pip3 install aiohttp
使用
作为客户端的使用
#! /usr/bin/env python3
# -*- coding: utf-8 -*-
import asyncio
from aiohttp import ClientSession
url = "http://www.shuiyueyue.com"
headers = { "User-Agent": "Hi!Pretty!" }
async def darling(loop):
async with ClientSession(loop=loop) as session:
async with session.get(url, headers=headers) as resp:
print(await resp.text())
if __name__ == "__main__":
loop = asyncio.get_event_loop()
loop.run_until_complete(darling(loop))
作为服务器的使用
#! /usr/bin/env python3
# -*- coding: utf-8 -*-
import asyncio
from aiohttp import web
async def yoyoyo(request):
body = "<!DOCTYPE html><html><head><meta charset='utf-8'><title>Yo!Yo!Yo!</title></head><body><p>脑子有壳???</p></body></html>"
resp = web.Response(body=body.encode("utf-8"))
resp.content_type= "text/html; charset=utf-8"
return resp
async def init(loop):
app = web.Application(loop=loop)
app.router.add_get("/", yoyoyo)
return await loop.create_server(app.make_handler(), "", 8080)
if __name__ == "__main__":
loop = asyncio.get_event_loop()
loop.run_until_complete(init(loop))
loop.run_forever()
代理
所谓代理,就是相当于帮一对小情侣传纸条的一个中间人的角色,当小花想要将小纸条传给小明的时候,却发现中间站着个老师,这时最好的方法就是让小花把小纸条给老师,然后让老师把小纸条传给小明。同理,当一个客户端想要通信一个连接不到的服务器的时候,简单的方法就是找一个能连接到那个服务器的机子作为代理服务器,过程一般如下:
- 客户端发送请求
- 代理服务器接收来自客户端的请求
- 代理服务器将客户端的请求发送给服务器
- 服务器接收来自代理服务器的请求并响应
- 代理服务器接收来自服务器的响应
- 代理服务器将响应发送回客户端
- 客户端接收响应
一个简单的代理服务器所需要处理的就是四个步骤:
- 接收客户端请求
- 发送客户端请求至服务器
- 接收服务器响应
- 发送服务器响应至客户端
实例
废话说了一堆我终于要开始写代码了,首先了解一下请求头和响应头中需要过滤的信息:
-
Content-Encoding
,Accept-Encoding
这两个交给代理服务器自己去处理,省得出现什么压缩错误 -
Transfer-Encoding
去掉分块传输的响应头,由代理服务器自身处理 -
Content-Length
内容字节数也交给服务器处理,否则如果修改了内容会导致长度不一 -
Proxy-Connection
这个是使用代理服务器才会出现的,恩,怎么能让人知道你在使用代理服务器呢 -
Connection
替换掉Proxy-Connection
并将值修改为close
,否则如果使用keep-alive
可能会导致分块传输 -
Host
尝试过几次因为没有去掉这个导致无法连接,所以让代理服务器自己处理这个就好了
知道了要过滤内容之后,可以开始编写处理头部信息的函数了:
bad_headers = ("accept-encoding", "content-encoding", "transfer-encoding", "content-length", "proxy-connection", "connection", "host")
async def fuckheaders(headers):
h = {}
for name, value in headers.items():
if name.lower() not in bad_headers:
h[name] = value
h['Connection'] = 'close'
return h
现在需要编写一个接收客户端请求的小型服务器,aiohttp.web
通过middlewares
来处理请求或响应的信息,要编写middlewares
处理函数需要将处理函数封装到一个函数中,如下:
async def factory(app, handler):
async def resp_handler(request):
# 做点啥...也可以不做...取决于你决定什么时候处理信息
results = await handler(request)
# 做点啥...也可以不做...取决于你决定什么时候处理信息
# 如果是作为最后的处理函数最后需要返回响应数据
response = web.Response(body=results.text)
return response
return resp_handler
现在编写这个小型服务器:
async def factory(app, handler):
async def fuck(request):
print("==> %s" % request.host)
method = request.method
url = str(request.url)
headers = await fuckheaders(request.headers)
data = await request.read()
return await getresp(app.loop, method, url, headers, data)
return fuck
上面的getresp
函数其实就是代理服务器向服务器发送请求的处理函数,现在开始编写:
async def getresp(loop, method, url, headers, data):
async with ClientSession(loop=loop) as session:
async with session.request(method, url, headers=headers, data=data) as resp:
print("<== %s" % resp.host)
body = await resp.read()
headers = await fuckheaders(resp.headers)
response = web.Response(body=body, status=resp.status, reason=resp.reason, headers=headers)
return reponse
初始化函数:
async def init(loop, port):
app = web.Application(loop=loop, middlewares=[factory])
return await loop.create_server(app.make_handler(), "", port)
完成啦,快夸夸自己!几十行代码就能完成一个简单的异步代理服务器,以下是完整代码:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import sys
import asyncio
from aiohttp import web, ClientSession
bad_headers = ("accept-encoding", "content-encoding", "transfer-encoding", "content-length", "proxy-connection", "connection", "host")
async def fuckheaders(headers):
h = {}
for name, value in headers.items():
if name.lower() not in bad_headers:
h[name] = value
h['Connection'] = "close"
return h
async def factory(app, handler):
async def fuck(request):
print("==> %s" % request.host)
method = request.method
url = str(request.url)
headers = await fuckheaders(request.headers)
data = await request.read()
return await getresp(app.loop, method, url, headers, data)
return fuck
async def getresp(loop, method, url, headers={}, data={}):
async with ClientSession(loop=loop) as session:
async with session.request(method, url, headers=headers, data=data) as resp:
print("<== %s" % resp.host)
body = await resp.read()
headers = await fuckheaders(resp.headers)
response = web.Response(body=body, status=resp.status, reason=resp.reason, headers=headers)
return response
async def init(loop, port):
app = web.Application(loop=loop, middlewares=[factory])
return await loop.create_server(app.make_handler(), "", port)
def main():
if len(sys.argv) < 2:
print("Usage: %s <listen port>" % sys.argv[0])
sys.exit(1)
port = int(sys.argv[1])
loop = asyncio.get_event_loop()
loop.run_until_complete(init(loop, port))
loop.run_forever()
if __name__ == "__main__":
main()
完事儿
GitHub: https://github.com/maoyouxiao/AioProxy
Blog: http://www.shuiyueyue.com