项目地址:https://github.com/kerlomz/captcha_platform/tree/cnn,这个算是最早版本的分支了,已经不维护了,目前持续维护的是msster分支。
文章:https://www.jianshu.com/p/80ef04b16efc
上一篇【不懂代码TensorFlow做验证码识别了】传送门:https://www.jianshu.com/p/b1a5427db6e2
项目更新速报:
- 项目新建了一个分支,基于CNN+LSTM+CTC的不定长验证码识别的部署,移步:https://github.com/kerlomz/captcha_platform/tree/lstm(2018/10/16)
笔者每每有一个伟大的梦想时,总是遭到【二狗】的无情阻挠,都只好先告一段落,现祭出【二狗臣服图】望她能悬崖勒马,金盆洗手,浪子回头,痛改前非。
说到梦想,我刚好有一个,我希望成为一个优雅的程序猿,每一行代码都是艺术品,不会有人交接我代码的时候忍不住破口大骂“这是实习生写的吧”。不说废话,下面给大家介绍的是承接上一篇文章的,一键部署训练模型的一条龙服务。
1. 配置文件
model.yaml
# Convolution: The number of layers is at least 3.
# - The number below corresponds to the size of each layer of convolution.
System:
Device: 'gpu:0'
# ModelName: Corresponding to the model file in the model directory,
# - such as YourModelName.pb, fill in YourModelName here.
# CharSet: [ALPHANUMERIC, ALPHANUMERIC_LOWER, ALPHANUMERIC_UPPER, NUMERIC].
# ImageChannel: [1 - Gray Scale, 3 - RGB].
# CharLength: Captcha Length
Model:
ModelName: zhengf
ImageChannel: 1
CharLength: 4
CharSet: ALPHANUMERIC
# Magnification: [ x2 -> from size(50, 50) to size(100,100)].
# OriginalColor: [false - Gray Scale, true - RGB].
# Binaryzation: [-1: Off, >0 and < 255: On].
# Smoothing: [-1: Off, >0: On].
# Invert [Binaryzation Color Invert]
# Blur: [-1: Off, >0: On].
Pretreatment:
Magnification: 0
OriginalColor: false
Binaryzation: 150
Smoothing: 1
Invert: true
Blur: -1
这次只有一个配置,上一篇训练模型所用的model.yaml是可以直接搬迁过来的。为什么识别的服务还需要预处理(Pretreatment)的参数呢,原因很简单。假设,为了训练一只猫识别“大鸡腿”(训练),而我们手里只有一整只鸡,预处理就是把“鸡”变成“大鸡腿”的过程,鸡好比(原未处理的验证码图片)。所以若是丢一整只鸡给猫(用未预处理的图片作为输入),猫是一脸懵逼的(无法输出预测)。
喻体 | 本体 |
---|---|
大鸡腿 | 预处理后的验证码图片 |
鸡 | 原未处理的验证码图片 |
猫 | 计算机或机器学习系统 |
把“鸡”变成“大鸡腿”的过程 | 预处理 |
2. 部署:什么就一步?
将训练好的pb格式模型,放置于部署工具同一路径的model文件夹下。
单文件双击即开即用。
至于使用源代码的童鞋们, README.md 已经写的蛮详解了哦,有不懂的可以加文章底部的群交流。
3. 调用
部署方式为HTTP服务,提供POST方式调用,参数格式为JSON。
请求地址:http://localhost:19951/captcha/v1
参数 | 必选 | 类型 | 说明 |
---|---|---|---|
image | Yes | String | Base64 编码 |
Python调用示例代码:
import base64
import requests
captcha_url = "http://www.***.com/CheckCode"
captcha_bytes = requests.get(captcha_url).content
url = 'http://localhost:19951/captcha/v1'
_params = dict(image=base64.b64encode(captcha_bytes).decode())
resp = requests.post(url, json=_params)
print(resp.text)
with open("captcha_{}.jpg".format(resp.json().get("message").get("result")), "wb") as f:
f.write(captcha_bytes)
返回结果结构:
{"message": {"result": "5qhl"}, "code": 200, "success": true}
4. 下载地址
链接: https://pan.baidu.com/s/15gn481ekQhd_tN5ip_xwsQ
密码: vg33
GPU版本需要下载安装CUDA和cuDNN依赖,下载地址见上篇
5. 后记
如果各位大佬已经有了自己的训练代码,也可以微调一下神经网络的结构,与之对应。其实只要修改输入与输出的scope_name。可参考部署代码:
predict = sess.graph.get_tensor_by_name("output/predict:0")
x = sess.graph.get_tensor_by_name('input:0')
keep_prob = sess.graph.get_tensor_by_name('keep_prob:0')
改法大致如下:即可适应于本套部署工具:
x = tf.placeholder(tf.float32, [None, IMAGE_HEIGHT * IMAGE_WIDTH], name='input')
label = tf.placeholder(tf.float32, [None, MAX_CAPTCHA_LEN * CHAR_SET_LEN], name='label')
keep_prob = tf.placeholder(tf.float32, name='keep_prob')
...
with tf.name_scope('output'):
_x = linear(_x)
final_output = tf.reshape(_x, [-1, MAX_CAPTCHA_LEN, CHAR_SET_LEN])
predict = tf.argmax(final_output, 1, name='predict')
如果各位好汉对验证码识别感兴趣的,可以加QQ群(857149419)交流,新群,欢迎大家一起学习和交流。