TensorFlow入门1-手写数字mnist数据集识别（单层Softmax神经网络）

1 手写字体MNIST数据集介绍

当我们开始学习编程的时候，第一件事往往是学习打印“Hello World”，机器学习（深度学习）入门的MNIST就相当于编程入门的“Hello World”。

MNIST是一个入门级的计算机视觉数据集，总共有70000张图片，其中60000张图片作为训练数据，10000张图片作为测试数据。（实际上，TensorFlow将60000张图片的训练数据拆分成了两部分，一部分是55000张的图片训练数据，另一部分是5000张的图片验证数据。）MNIST数据集官方网址为：http://yann.lecun.com/exdb/mnist/ ，在MNIST数据集中的每一张图片都代表了0-9中的一个数字，每张图片的像素都是28x28，且数字都会出现在图片的正中间。

我们把这个数组展开成一个一维数组，长度是28x28=784，以方便TensorFlow将图片的像素矩阵提供给神经网络的输入层。这样的话，训练集中的图片就相当于一个[60000，784]的张量，第一个维度数字用来索引图片，第二个维度数字用来索引每张图片中的像素点。在此张量里的每一个元素，都表示某张图片里的某个像素的强度值，值介于0和1之间。

相对应的MNIST数据集的标签是介于0到9的数字，用来描述给定图片里表示的数字。使用one-hot编码，一个one-hot向量除了某一位的数字是1以外其余各维度数字都是0。数字n将表示成一个只有在第n维度（从0开始）数字为1的10维向量。比如，标签3将表示成[0，0，0，1，0，0，0，0，0，0，0]。因此，训练集中的标签是一个[60000，10] 的张量。

2 Softmax回归

MNIST的每一张图片都表示一个数字，我们希望得到给定图片代表每个数字的概率。比如，一张包含9的图片，模型可能预测为数字9的概率是80%，预测为数字8的概率是10%（因为8和9都有上半部分的小圆），然后给予它代表其他数字的概率更小的值。

对于二分类问题，可以使用Logistic回归模型，多分类问题可以使用Softmax回归。Softmax回归模型是Logistic回归模型在多分类问题上的推广，在多分类问题中，类标签 y 可以取两个以上的值，Softmax模型可以求出不同标签值对应的分配概率。对于MNIST手写数字分类问题，其目的是辨识10个不同的单个数字，所以可以使用Softmax回归模型。

为了得到一张给定图片属于某个特定数字类的证据（evidence），我们对图片像素值进行加权求和。如果这个像素具有很强的证据说明这张图片不属于该类，那么相应的权值为负数，相反如果这个像素拥有有利的证据支持这张图片属于这个类，那么权值是正数。

下面的图片显示了一个模型学习到的图片上每个像素对于特定数字类的权值。红色代表负数权值，蓝色代表正数权值。

我们也需要加入一个额外的偏置量（bias），因为输入往往会带有一些无关的干扰量。

3 代码讲解

关于Windows系统下安装TensorFlow，参考链接：http://www.jianshu.com/p/c3a4a0ff82a6。

# 1 导入相关包
from time import time              # 计算训练模型总时间
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

# 2 加载mnist数据
start_time = time()
mnist = input_data.read_data_sets('MNIST_data/', one_hot=True)

# 3 定义模型参数（权重、偏差）及占位符
x = tf.placeholder(tf.float32, [None, 784])
W = tf.Variable(tf.zeros([784, 10]))
b = tf.Variable(tf.zeros([10]))

# 4 计算y的预测值，定义y标签值的占位符
y_predict = tf.nn.softmax(tf.matmul(x, W) + b)
y_label = tf.placeholder(tf.float32, [None, 10])

# 5 定义交叉熵损失，选择梯度下降优化方法
cross_entropy  = tf.reduce_mean(-tf.reduce_sum( y_label * tf.log(y_predict), axis=[1]))
train_step = tf.train.GradientDescentOptimizer(learning_rate=0.5).minimize(cross_entropy)

# 6 创建会话，初始化所有变量
init = tf.global_variables_initializer()
sess = tf.InteractiveSession() 
sess.run(init)

# 7 用批数据循环训练模型1000次，评估模型
for _ in range(1000):
    batch_xs, batch_ys = mnist.train.next_batch(100)
    sess.run(train_step, feed_dict={x: batch_xs, y_label: batch_ys})
correct_predict = tf.equal(tf.argmax(y_predict,1), tf.argmax(y_label, 1))
accuracy = tf.reduce_mean(tf.cast(correct_predict, dtype='float'))
print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_label: mnist.test.labels}))
print('模型训练总耗时：%.4f' %(time() - start_time)+'秒')
sess.close()

第6步和第7步也可以合并为：

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for _ in range(1000):
        batch_xs, batch_ys = mnist.train.next_batch(100)
        sess.run(train_step, feed_dict={x: batch_xs, y_label: batch_ys})
    correct_predict = tf.equal(tf.argmax(y_predict,1), tf.argmax(y_label, 1))
    accuracy = tf.reduce_mean(tf.cast(correct_predict, dtype='float'))
    print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_label: mnist.test.labels}))
    print('模型训练总耗时：%.4f' %(time() - start_time)+'秒')

最后编辑于：2017.12.10 16:10:17

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 205,236评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,867评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,715评论 0赞 340
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,899评论 1赞 278
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,895评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,733评论 1赞 283
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,085评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,722评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,025评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,696评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,816评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,447评论 4赞 322
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,057评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,009评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,254评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,204评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,561评论 2赞 343

TensorFlow入门1-手写数字mnist数据集识别（单层Softmax神经网络）

1 手写字体MNIST数据集介绍

2 Softmax回归

3 代码讲解

推荐阅读更多精彩内容