自动部署深度神经网络模型TensorFlow（Keras）到生产环境中

Keras简介

Keras是一套由Python实现的高级神经网络API，可以基于不同的后台（backend）实现，包括TensoreFlow，CNTK，MXNet（基于Keras-MXNet，处于孵化阶段）和Theano（已停止开发）。Keras可以让用户能快速的开发出原型，支持流行的卷积网络（Convolutional Networks）、循环网络（Recurrent Networks）或者两者的组合，并且可以无缝的在CPU和GPU上运行。

Keras模型分类

Keras提供了两种类型的模型，顺序（Sequential）模型和函数式（Functional）模型：

顺序模型，由一组线性的层堆栈组成（a linear stack of layers），是一种最简单的模型类型，API简单明了，详情查看官方文档：Guide to the Sequential model
函数式模型，可以定义更复杂的模型网络结构，比如多输出模型，有向无环图，具有共享层的多模型，详情查看官方文档：Guide to the Functional API

以上两套API，生成的模型类型是keras.models.Sequential（继承自Model）和keras.models.Model类，除了以上两种类型模型，从Keras 2.2.0开始，支持用户继承keras.models.Model来创建完全自定义化模型类型，详情查看官方文档模型自类化（Model subclassing）。本文中我们主要讨论非子类化（non-subclassing）模型的部署，关于子类化模型（subclassing）的部署会在后面介绍。

Keras模型部署准备

在上一篇文章《自动部署开源AI模型到生产环境：Sklearn、XGBoost、LightGBM、和PySpark》中我们介绍了如何通过AutoDeployAI的AI模型自动部署和管理系统DaaS（Deployment-as-a-Service）来自动部署传统开源机器学习模型（包括Scikit-learn、XGBoost、LightGBM、和PySpark等），这里我们详细介绍如果通过DaaS来自动部署Keras深度神经网络模型，同样我们需要：

安装Python DaaS-Client
初始化DaasClient
创建项目

详细准备工作，请参考以上文章中的部署准备部分。完整的代码，请参考Github上的Notebook：deploy-keras.ipynb

默认部署Keras模型

基于Keras Sequence API训练一个简单的多分类模型，使用Scikit-learn中的Iris数据：

from keras.models import Sequential
from keras.layers import Dense
from keras.optimizers import Adam

model = Sequential()
model.add(Dense(10, input_shape=(4,), activation='relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(6, activation='relu'))
model.add(Dense(3, activation='softmax'))
model.compile(Adam(lr=0.04), 'categorical_crossentropy', ['accuracy'])
model.fit(X_train, pd.get_dummies(y_train).values, epochs=100)

发布Keras模型：

publish_resp = client.publish(model,
                              name='keras-iris',
                              mining_function='classification',
                              x_test=X_test,
                              y_test=y_test,
                              description='A Keras classification model')
pprint(publish_resp)

publish_resp是一个字典类型的结果，记录了模型名称，和发布的模型版本。

{'model_name': 'keras-iris', 'model_version': '1'}

测试Keras模型：

test_resp = client.test(publish_resp['model_name'], 
                        model_version=publish_resp['model_version'])
pprint(test_resp)

test_resp是一个字典类型的结果，记录了测试REST API信息，如下：

{'access_token': 'A-LONG-STRING-OF-BEARER-TOKEN-USED-IN-HTTP-HEADER-AUTHORIZATION',
 'endpoint_url': 'https://daas.autodeploy.ai/api/v1/test/deployment-test/daas-python37-faas/test',
 'payload': {'args': {'X': [{'dense_1_input': [5.7, 4.4, 1.5, 0.4]}],
                      'model_name': 'keras-iris',
                      'model_version': '1'}}}

使用requests库调用测试API：

response = requests.post(test_resp['endpoint_url'],
                         headers={'Authorization': 'Bearer {token}'.format(token=test_resp['access_token'])},
                         json=test_resp['payload'],
                         verify=False)
pprint(response.json())

返回结果：

{'result': [{'dense_4': [[0.996542751789093,
                          0.0034567660186439753,
                          4.955750227964018e-07]]}],
 'stderr': [],
 'stdout': []}

正式部署Keras模型：

deploy_resp = client.deploy(model_name='keras-iris', 
                            deployment_name='keras-iris-svc',
                            model_version=publish_resp['model_version'],
                            replicas=1)
pprint(deploy_resp)

返回结果：

{'access_token': 'A-LONG-STRING-OF-BEARER-TOKEN-USED-IN-HTTP-HEADER-AUTHORIZATION',
 'endpoint_url': 'https://daas.autodeploy.ai/api/v1/svc/deployment-test/keras-iris-svc/predict',
 'payload': {'args': {'X': [{'dense_1_input': [5.7, 4.4, 1.5, 0.4]}]}}}

使用requests库调用正式API：

response = requests.post(deploy_resp['endpoint_url'],
                         headers={'Authorization': 'Bearer {token}'.format(token=deploy_resp['access_token'])},
                         json=deploy_resp['payload'],
                         verify=False)
pprint(response.json())

结果如下：

{'result': [{'dense_4': [[0.996542751789093,
                          0.0034567660186439753,
                          4.955750227964018e-07]]}]}

除了使用Keras API，对于TensorFlow，DaaS也同样支持使用tf.keras API训练的模型。

自定义部署Keras模型

基于tf.Keras Functional API训练模型，使用Keras中的MNist数据来识别用户输入的数字，以下代码参考Functional API on MNIST：

# load MNIST dataset
(x_train, y_train), (x_test, y_test) = mnist.load_data()

# from sparse label to categorical
num_labels = len(np.unique(y_train))
y_train = to_categorical(y_train)
y_test = to_categorical(y_test)

# reshape and normalize input images
image_size = x_train.shape[1]
x_train = np.reshape(x_train,[-1, image_size, image_size, 1])
x_test = np.reshape(x_test,[-1, image_size, image_size, 1])
x_train = x_train.astype('float32') / 255
x_test = x_test.astype('float32') / 255

# network parameters
input_shape = (image_size, image_size, 1)
batch_size = 128
kernel_size = 3
filters = 64
dropout = 0.3

# use functional API to build cnn layers
inputs = Input(shape=input_shape)
y = Conv2D(filters=filters,
           kernel_size=kernel_size,
           activation='relu')(inputs)
y = MaxPooling2D()(y)
y = Conv2D(filters=filters,
           kernel_size=kernel_size,
           activation='relu')(y)
y = MaxPooling2D()(y)
y = Conv2D(filters=filters,
           kernel_size=kernel_size,
           activation='relu')(y)
# image to vector before connecting to dense layer
y = Flatten()(y)
# dropout regularization
y = Dropout(dropout)(y)
outputs = Dense(num_labels, activation='softmax')(y)

# build the model by supplying inputs/outputs
model = Model(inputs=inputs, outputs=outputs)
# network model in text
model.summary()

# classifier loss, Adam optimizer, classifier accuracy
model.compile(loss='categorical_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

# train the model with input images and labels
model.fit(x_train,
          y_train,
          validation_data=(x_test, y_test),
          epochs=3,
          batch_size=batch_size)

为了可以快速训练出模型，修改原程序中epochs=20为3。

发布Keras模型：

publish_resp = client.publish(model,
                              name='keras-mnist',
                              mining_function='classification',
                              x_test=x_test,
                              y_test=y_test,
                              description='A tf.Keras classification model')
pprint(publish_resp)

结果如下：

{'model_name': 'keras-mnist', 'model_version': '1'}

测试Keras模型。登陆DaaS Web客户端，查看keras-mnist模型信息：

daas-model-overview.png

模型输入字段input_1，维数为(,28,28,1)，输出字段dense，维数为(,10)。切换到测试标签页，我们看到DaaS自动存储了一条测试数据，点击提交命令，测试该条数据，如图：

daas-model-test.png

自定义部署Keras模型。keras-mnist模型输入数据是由一张28*28的黑底白字灰度图像生成的numpy数组，在REST API使用JSON传输数据时，因为JSON作为一种文本格式，在存储传输大的列表时有性能劣势，并且需要调用端做图像预处理工作，增加了客户端使用的负担。我们希望这些都可以在服务器端完成：接收二进制图像文件，预处理图像，并且转成模型需要的numpy数组。在DaaS中，我们可以通过创建自定义部署脚本来完成该该任务，它允许用户在模型部署中添加任意的数据预处理和后处理操作。切换到实时预测标签页，点击命令生成自定义实时预测脚本，生成预定义脚本：

daas-model-realtime.png

点击作为API测试命令，页面切换到测试页面，修改preprocess_files函数，并且添加处理图像的函数：

def rgb2gray(rgb):
    """Convert the input image into grayscale"""
    import numpy as np
    return np.dot(rgb[...,:3], [0.299, 0.587, 0.114])


def resize_img(img_to_resize):
    """Resize image to MNIST model input dimensions"""
    import cv2
    r_img = cv2.resize(img_to_resize, dsize=(28, 28), interpolation=cv2.INTER_AREA)
    r_img.resize((1, 28, 28, 1))
    r_img = 1 - r_img
    return r_img


def preprocess_image(img_to_preprocess):
    """Resize input images and convert them to grayscale."""
    if img_to_preprocess.shape == (28, 28):
        img_to_preprocess.resize((1, 28, 28, 1))
        img_to_preprocess = 1 - img_to_preprocess / 255
        return img_to_preprocess

    grayscale = rgb2gray(img_to_preprocess)
    processed_img = resize_img(grayscale)
    return processed_img


def preprocess_files(args):
    """preprocess the uploaded files"""
    files = args.get('files')
    if files is not None:
        # get the first record object in X if it's present
        if 'X' in args:
            record = args['X'][0]
        else:
            record = {}
            args['X'] = [record]

        # TODO add your own custom opeartions, e.g. loading images, make transformation, then write back into X
        import matplotlib.image as mpimg
        for key, file in files.items():
            img = mpimg.imread(file)
            record[key] = preprocess_image(img)

    return args

输入函数名predict，选择请求正文基于表单，输入名称input_1，选择文件，点击上传测试图像2.png，点击提交，右侧响应页面显示结果为：

{
  "result": [
    {
      "dense": [
        [
          4.0412282942270394e-7,
          5.612335129967505e-8,
          0.9999896287918091,
          0.0000014349453749673557,
          2.1778572326623669e-13,
          3.3688251840913175e-12,
          1.8931906042851665e-10,
          1.7151558395767097e-8,
          0.000008489014362567104,
          6.33769703384246e-10
        ]
      ]
    }
  ],
  "stderr": [
    "Some warning messages here"
  ],
  "stdout": []
}

继续修改postprocess函数为：

def postprocess(result):
    """postprocess the predicted results"""
    import numpy as np
    return [int(np.argmax(np.array(result).squeeze(), axis=0))]

重新提交，右侧响应页面显示结果为：

daas-model-script-test.png

测试完成后，可以创建正式的部署，切换到部署标签页，点击命令添加网络服务，输入服务名称mnist-svc，其他使用默认选项，点击创建。进入到部署页面后，点击测试标签页，该界面类似之前的脚本测试界面，输入函数名predict，请求正文选择基于表单，输入名称input_1，类型选择文件，点击上传测试的图片后，点击提交：

daas-deployment-test.png

到此，正式部署已经测试和创建完成，用户可以使用任意的客户端程序调用该部署服务。点击以上界面中的生成代码命令，显示如何通过curl命令调用该服务，测试如下：

daas-deployment-curl-test.png

通过ONNX部署Keras模型：

转换模型到ONNX：

import onnxmltools

onnx_model = onnxmltools.convert_keras(model, model.name)

发布ONNX模型：

publish_resp = client.publish(onnx_model,
                              name='keras-mnist-onnx',
                              mining_function='classification',
                              x_test=x_test,
                              y_test=y_test,
                              description='A tf.Keras classification model in ONNX')
pprint(publish_resp)

结果如下：

{'model_name': 'keras-mnist-onnx', 'model_version': '1'}

测试ONNX模型：登陆DaaS Web客户端，查看keras-onnx-mnist模型信息：

daas-onnx-model-overview.png

模型输入字段input_1，维数为(N,28,28,1)，输出字段dense，维数为(N,10)。切换到测试标签页，我们看到DaaS自动存储了一条测试数据，点击提交命令，测试该条数据，如图：

daas-onnx-model-test.png

我们看到，该ONNX模型和原生Keras模型测试结果是一致的。

自定义部署ONNX模型：参考以上Keras模型，流程相同，就不再这里赘述。关于ONNX格式详情以及部署，可以参考文章《使用ONNX部署深度学习和传统机器学习模型》

总结

通过以上的演示，我们可以看到，DaaS在部署深度学习模型时的优势：既可以一键式创建默认部署，又可以灵活的自定义部署，满足用户多样的部署需求。关于其他深度学习框架的部署，比如Pytorch，MXNet等，会在后续的文章中介绍。

参考

DaaS-Client：https://github.com/autodeployai/daas-client
AutoDeployAI：https://www.autodeploy.ai/

最后编辑于：2020.06.24 14:31:21

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,456评论 5赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,370评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,337评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,583评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,596评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,572评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,936评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,595评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,850评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,601评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,685评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,371评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,951评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,934评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,167评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,636评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,411评论 2赞 342

自动部署深度神经网络模型TensorFlow（Keras）到生产环境中

自动部署深度神经网络模型TensorFlow（Keras）到生产环境中

目录

Keras简介

Keras模型分类

Keras模型部署准备

默认部署Keras模型

自定义部署Keras模型

总结

参考

推荐阅读更多精彩内容