MNIST 机器学习入门之线性回归预测（一）

参考文献

极客学院wiki：https://wiki.jikexueyuan.com/project/tensorflow-zh/tutorials/mnist_beginners.html

TensorFlow优化器：https://blog.csdn.net/xierhacker/article/details/53174558

nump库randn()函数详解：https://blog.csdn.net/m0_38061927/article/details/75335069

tf.sess.run参数详解：https://blog.csdn.net/huahuazhu/article/details/76178681

必读文献：《白话TensorFlow和机器学习》

TensorFlow流程

读完《白话TensorFlow和机器学习》三分之二，再来看极客学院的 “MNIST机器学习入门” 章节时，还是有点读天书的感觉。但是至少，对于机器学习的内在原理和流程有了初步的认识，我觉得这应该是半入门状态。

看完这些章节和文章，我感觉所谓的机器学习，只不过是在 “自动化寻找最优解” 。尤其是梯度下降优化算法，通过每次调整0.01的值来一步步逼近线性回归的最优解。

概括一下，机器学习的步骤就是：

采集数据集

这一步包括训练集、测试集和预测集。数据集这个是非常重要的，谷歌TensorFlow只是提供了一个优化方案，对于数据集的前期处理还是需要自己来弄。说得通俗一点，需要我们将数据转换成谷歌所要求的数据类型。

比如：我们需要识别手写数字是多少，其实第一步就是通过一定的方式，将手写数字的图片转换成图像矩阵，这些矩阵才是数据集。如下图：

MNIST-Matrix.png

线性回归 + 激励函数

线性回归的目的是 “得到给定图片代表每个数字的概率”。

你可以理解成，这一步就是通过所谓的线性回归方法+优化算法（梯度下降法）得出某个图片属于 0-9数字的概率。

激励函数，如果得到的是一个概率值（该图片是0-9任意的一个数字的概率，就有10个概率值），为了更加准备得表达出这个数字是多少，就需要有一个激励函数，完全收敛到一个最大的具体的值。

实现回归模型

回归模型，本质上就是 y=wx+b，求w和b的值。当然TensorFlow里要复杂得多。

训练模型+损失函数

为了获得我们回归模型里的w和b，求得w和b的最可能值，这里需要训练模型，因此就会引入损失函数Loss，通过梯度下降法逐步逼近损失函数最小时，w和b值。

不同的训练模型采用不同的损失函数。

评估模型

最后一步当然是看看我们的模型的准确率了。第4步已经求解除了我们要的训练模型。比如我们有5000张手写数字图片，最后评估一下，发现92%的图片是识别正确的。

over

需要补充的技能

如果需要在机器学习领域有一定成绩，至少入门，需要掌握以下基本知识：

python框架：Numpy

一本书：《白话TensorFlow和机器学习》

理解线性回归：https://blog.csdn.net/xierhacker/article/details/53257748

使用TensorFlow的话，需要理解TensorFlow的API

TensorFlow线性回归实战

理解线性回归是读懂MNIST的第一步。本文主要写一个用TensorFlow训练的线性回归的案例。

参考文献：https://blog.csdn.net/xierhacker/article/details/53174558

需要解决的问题：

自己给自己出一个问题

对于以下 X，Y
X：[0.23, 0.34, 0.67, 0.89, 0.90, 0.97]
Y：[0.25, 0.33, 0.65, 0.80, 0.89, 0.99]
它们的回归模型是怎样的？
求它们的回归模型的曲线图。

先跑一个Demo

import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

# Prepare train data
# linespace函数的作用是取 -1到1区间的随机数，取100个
train_X = np.linspace(-1, 1, 100)
# np.random.randn函数的作用是取0到1的正态分布的随机值
# *train_X.shape shape是取矩阵的维度，前面的*号将tuple转成int值参数列表。train_Y是根据train_X生成随机数而已
train_Y = 2 * train_X + np.random.randn(*train_X.shape) * 0.33 + 10

# Define the model
# tf.placeholder和tf.Variable是生成变量
X = tf.placeholder("float")
Y = tf.placeholder("float")
w = tf.Variable(0.0, name="weight")
b = tf.Variable(0.0, name="bias")
# 损失函数采用(y-x*w-b)的平方
loss = tf.square(Y - X*w - b)
# GradientDescentOptimizer梯度下降法，每次下降0.01
train_op = tf.train.GradientDescentOptimizer(0.01).minimize(loss)

# Create session to run
with tf.Session() as sess:
    # 初始化tf
    sess.run(tf.initialize_all_variables())

    epoch = 1
    for i in range(10):
        # zip 函数根据两个list生成tuple组
        for (x, y) in zip(train_X, train_Y):
            # tf.sess.run()本文开头有专门的链接讲解
            _, w_value, b_value = sess.run([train_op, w, b],feed_dict={X: x,Y: y})
        print("Epoch: {}, w: {}, b: {}".format(epoch, w_value, b_value))
        epoch += 1

      
#draw，画图而已，老铁
plt.plot(train_X,train_Y,"+")
plt.plot(train_X,train_X.dot(w_value)+b_value)
plt.show()

最后的效果当然是这样的：

以上是通过TensorFlow来获取线性回归

回到我们的问题，

对于以下 X，Y
X：[0.23, 0.34, 0.67, 0.89, 0.90, 0.97]
Y：[0.25, 0.33, 0.65, 0.80, 0.89, 0.99]
它们的回归模型是怎样的？
求它们的回归模型的曲线图。

应该很简单，不过是把train data改成我们设置的数据就好了
# Prepare train data
train_X = np.array([0.23, 0.34, 0.67, 0.89, 0.90, 0.97])
train_Y = np.array([0.25, 0.33, 0.65, 0.80, 0.89, 0.99])

回归效果是这样的：

over

下一步

下一步，将会对MNIST手写数字识别Demo详细讲解，并进一步梳理机器学习入门相关概念。

最后编辑于：2018.05.07 17:10:43

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,189评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,577评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,857评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,703评论 1赞 276
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,705评论 5赞 366
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,620评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,995评论 3赞 396
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,656评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,898评论 1赞 298
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,639评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,720评论 1赞 330
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,395评论 4赞 319
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,982评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,953评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,195评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 44,907评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,472评论 2赞 342

MNIST 机器学习入门之线性回归预测（一）

参考文献

TensorFlow流程

需要补充的技能

TensorFlow线性回归实战

下一步

推荐阅读更多精彩内容