机器学习模型部署--打通前后端任督二脉

前言

学历与定位

近日在某论坛,有网友提问道:搞机器学习是不是要博士或是硕士学历,是不是要求很高,顶会论文?本科生或者更低学历的,是不是就没有机会了?从最近公司的招聘来看,算法工程师的 bar 确实有在提高。但在某些事业部,仍需要很大的人力来做落地场景。每个人都要找准自己的定位,公司也有它的部门定位。如果是发论文、要在学术界站稳脚跟,给投资人“我们很重视最新技术”的信心,那博士确实很重要。另一个角度,从实用角度来说,研究生和本科生可能性价比更高。当然,作为一个小本就工作的人,没有较为丰富的实战经验,有机会的话,还是拿到硕士及更高学历比较好。这里的实战经验就比如:搭建一个完整的、涉及算法模型、后端及前端的系统。

mobile.jpg

模型算法的实用主义

机器学习的实用主义,不是在论文多少,而是用正确的方法去解决正确的问题。而作为背后的工程师,除了调参、除了写 sql,做调包侠、做 sql boy、报表 boy 以外,在之前的文章也提到过,要学会做正确的展示,做全套的工程化实施。毕竟,等排期很难受;有些情况前后端资源不够,或者优先级很低,那就需要自己动手了。以下以上面的垃圾邮件分类为例子,说明该如何搭建一个前后端完整的机器学习系统。

关注微信公众号:谷粒先生,下载权重文件并第一时间获取更新。

这里将本次的任务拆解,分为三个部分来讲。后端 flask、前端 Vue、ML 模型采用 flair,项目地址 kuhung/flask_vue_ML

后端 flask

相关依赖的安装

pip install -r requirements.txt

核心函数

  1. 导入函数包
from flask import Flask, jsonify, request
from flask_cors import CORS # 做跨域的准备
from flask import session # 追踪客户端会话

from flair.models import TextClassifier # 模型导入,采用前不久开源的 flair 做文本分类
from flair.data import Sentence

  1. 准备工作
app = Flask(__name__) # 声明准备
app.secret_key = "super_secret_key"

CORS(app)
classifier = TextClassifier.load_from_file('models/best-model.pt') # 模型加载

  1. 配置 flask 的路由
# 根路由配置
@app.route('/', methods=['GET'])
def index():
    return jsonify("welcome to Kuhung API")

# GET 方法,这里 session 的作用是追踪客户端会话,防止重复请求模型
@app.route('/api/tasks', methods=['GET'])
def get_result():
    result = []
    try:
        data_result = session['my_result']
        result.append ({'title': data_result['title'], 'tag': data_result['tag'] })
    except:
        result.append ({'title': 'The txt you input', 'tag': 'spam or ham' })
    return jsonify(result)

# POST 方法
@app.route('/api/task', methods=['POST'])
def input_predict_text():

    title = request.get_json()['title'] # 解析请求

    sentence = Sentence(title) # 对请求做数据预处理
    classifier.predict(sentence) # 调用模型,做预测,返回带标签的数据

    text = sentence.to_plain_string() # 解析出原始数据
    label = sentence.labels[0] # 解析出标签
    result = {'title' : text, 'tag' : label.value} # 拼接成字典格式
    session['my_result'] = result # 存入 session ,以减少重复请求对模型的压力
    
    return jsonify(result) # 返回 json 格式的数据

if __name__ == '__main__':
    app.run(debug=True)  # 开发过程中开启 debug 调试模式

启动服务

python app.py

前端 vue

前端采用 Vue 框架,与后端分离。使用 Webpack 进行资源管理与打包。

相关依赖的安装

npm install -g vue-cli
npm install

自定义组件

通过 vue init webpack flask_vue_ML 后,进入项目文件夹,增加自定义内容。

index.html


<!DOCTYPE html>
<html>
  <head>
    <meta charset="utf-8">
    <meta name="viewport" content="width=device-width,initial-scale=1.0">
    <title>exposemodel</title>
  </head>
  <body>
    <div id="app"></div>
    <!-- 其它文件会自动注入这里 -->
  </body>
</html>

src 文件夹

  • components
    • Home.vue // 自定义组件,增加
  • router
    • index.js // 路由,修改
  • App.vue // 主组件,修改
  • main.js // 入口文件,修改
Home.vue

这里定义页面的基本样式,以及获取数据的逻辑。

<template>
  <div id="todo-list-example" class="container">
    <!-- 我是进度条,最上方的 -->
    <vue-progress-bar></vue-progress-bar>
    <div class="row">
      <div class="col-md-6 mx-auto">
        <h1 class="text-center">Natural Language Processing (NLP)</h1>
        <form v-on:submit.prevent="addNewTask">
          <label for="tasknameinput">Spam Classification</label>
          <input v-model="taskname" type="text" id="tasknameinput" class="form-control" placeholder="Enter Sentence">
          <button type="submit" class="btn btn-success btn-block mt-3">
            Submit
          </button>
        </form>
          
<!-- 省略表格定义内容 -->


<script>
// 这里解决跨域请求问题,向后端发起请求
import axios from 'axios'

export default {
  data () {
    return {
      textClassify: [],
      id: '',
      taskname: '',
      isEdit: false
    }
  },
  mounted () {
    this.getTasks()
  },
    
// 省略进度条内容
    
// 请求任务相关操作
    getTasks () {
      axios({ method: 'GET', url: '/api/tasks' }).then(
        result => {
          console.log(result.data)
          this.textClassify = result.data
        },
        error => {
          console.error(error)
        }
      )
    },
</script>
​```
index.js

定义路由,设定访问路径,并将路径和组件关联

import Vue from 'vue'
import Router from 'vue-router'
import Home from '@/components/Home'

Vue.use(Router)

export default new Router({
  routes: [
    {
      path: '/',
      name: 'Home',
      component: Home
    }
  ]
})
App.vue

主组件

<template>
  <div id="app">
    <router-view/>
    <!-- 植入一波广告:微信搜索:谷粒先生,关注我的公众号 -->
    <img src="./assets/wechat.jpg">
  </div>
</template>

<script>
export default {
  name: 'App'
}
</script>

<style>
#app {
  font-family: 'Avenir', Helvetica, Arial, sans-serif;
  -webkit-font-smoothing: antialiased;
  -moz-osx-font-smoothing: grayscale;
  text-align: center;
  color: #2c3e50;
  margin-top: 60px;
}
</style>
main.js

初始化实例并加载必要插件

// The Vue build version to load with the `import` command
// (runtime-only or standalone) has been set in webpack.base.conf with an alias.
import Vue from 'vue'
import App from './App'
import router from './router'
import VueProgressBar from 'vue-progressbar'
require('../node_modules/bootstrap/dist/css/bootstrap.css')

Vue.config.productionTip = false

// 这是进度条
Vue.use(VueProgressBar, {
  color: 'rgb(143, 255, 199)',
  failedColor: 'red',
  height: '10px'
})

/* eslint-disable no-new */
new Vue({
  el: '#app',
  router,
  components: { App },
  template: '<App/>'
})

启动服务

npm run dev

模型 flair

模型这里采用 fair 框架,该框架在 2018 年底发布,易用性和效果都较前方案有了较大提升。这里直接采用官方样例训练好的垃圾邮件分类模型的权重,也就是在上文后端所读取的文件。关注我的公众号:谷粒先生,回复权重,即可获得权重文件🔗链接。

模型调用


from flair.models import TextClassifier # 模型导入,采用前不久开源的 flair 做文本分类
from flair.data import Sentence

classifier = TextClassifier.load_from_file('models/best-model.pt') # 模型加载

sentence = Sentence(title) # 对请求做数据预处理
classifier.predict(sentence) # 调用模型,做预测,返回带标签的数据

效果展示

本教程针对文本分类这个场景,构建了一套前后端分离的“完整”框架,能够给到一个最直观的感受。当然,这里还有很多优化空间,还有后续部署等事宜没有详细展开,有心的同学可以自行检索学习。通过这套流程,可以在测试服搭建一套实用主义哲学的算法模型。给到领导做展示或是公司内部使用,已经足够。项目地址 kuhung/flask_vue_ML

终端端网站访问

flask_vue_ml.jpg

关注微信公众号:谷粒先生,下载权重文件并第一时间获取更新。

喜欢我的朋友,别忘了点赞 👍、喜欢 ❤ +关注 🔔哦,你的鼓励是对我最大的支持~💪

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,132评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,802评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,566评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,858评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,867评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,695评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,064评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,705评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,915评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,677评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,796评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,432评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,041评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,992评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,223评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,185评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,535评论 2 343

推荐阅读更多精彩内容

  • 基于Vue的一些资料 内容 UI组件 开发框架 实用库 服务端 辅助工具 应用实例 Demo示例 element★...
    尝了又尝阅读 1,140评论 0 1
  • 简说Vue (组件库) https://github.com/ElemeFE/element" 饿了么出品的VUE...
    Estrus丶阅读 1,547评论 0 1
  • UI组件 element- 饿了么出品的Vue2的web UI工具套件 Vux- 基于Vue和WeUI的组件库 m...
    35eeabfa0772阅读 3,258评论 7 12
  • UI组件 element - 饿了么出品的Vue2的web UI工具套件 Vux - 基于Vue和WeUI的组...
    鲁大师666阅读 43,366评论 5 97
  • 解題思路 : 從 root 開始把所有節點用 BFS 方式放入 vector ( 節點只要不是 nullptr 就...
    一枚煎餅阅读 178评论 0 0