Python机器学习之神经网络手写识别

引言

使用现成的 MNIST 数据集训练图像识别，包含 70000 个手写数字图像，其中 60000 个是训练数据，另外 10000 个是测试数据。每个样本有 784 个特征，因为数据集中存储的样本是 2828 像素的手写数字图片的像素信息，因此特征数是 2828=784 个。
在训练MLP 之前，还要将数据进行一些预处理，因为样本特征是从 0~255 的灰度值，

注释：数据集如果代码执行出错。则选择直接从本地导入数据集，mnist数据集需要手动下载
解决方法参考：机器学习实战（从本地导入mnist数据集）

使用神经网络训练图像识别，并识别手写数字图像（自己随便写一个或者下载一个）

#神经网络识别手写图像
from sklearn.datasets import fetch_mldata #导入数据获取工具
import numpy as np
import matplotlib.pyplot as plt
from matplotlib.colors import ListedColormap
from sklearn.neural_network import MLPClassifier #导入MLP神经网络
from sklearn.model_selection import train_test_split #切分训练集和测试集
from PIL import Image #导入图像处理工具


# from sklearn.datasets.base import get_data_home
# print (get_data_home())

#加载手写数据集
mnist = fetch_mldata('MNIST original',data_home='C:/Users/wp905/scikit_learn_data')

#查看样本数量和样本特征数
print('=========================')
print('样本数量：{}，样本特征数：{}'.format(mnist.data.shape[0], mnist.data.shape[1]))

#建立训练集和测试集，为控制神经网络的训练时长，限定训练集和测试集的数量
X = mnist.data /255.
y = mnist.target
X_train, X_test, y_train, y_test = train_test_split(X, y, train_size= 9000, test_size=1000, random_state=6)


#设置神经网络有2层100个节点的隐藏层
mlp_hw = MLPClassifier(solver='lbfgs', hidden_layer_sizes=[100,100], activation='relu', alpha= 1e-5, random_state=62)

mlp_hw.fit(X_train, y_train)
print('\n\n\n')
print('代码运行结果：')
print('==============================================')
print('测试集数据得分：{:.2f}%'.format(mlp_hw.score(X_test, y_test)*100))

#导入一个数字图片，并进行识别
#打开图像
image = Image.open('9.jpg').convert('F') #将图片转化为32位浮点灰色图像，即每个像素用32个bit来表示，0代表黑，255表示白
#调整图像的大小
image = image.resize((28,28))
arr=[]
#将图像中的像素作为预测数据点的特征
for i in range(28):
    for j in range(28):
          #由于MNIST数据集中 0 代表白色，1 代表黑色，因此还要用 1减去像素的灰度值，以保持和数据集一致
        pixel = 1.0 - float(image.getpixel((j,i))) / 255.   #每个像素的数值除以255，以保持和数据集一致
        arr.append(pixel)

#由于只有一个样本，所以需要进行reshape操作
arr1 = np.array(arr).reshape(1,-1)
#print(arr1)
#进行图像识别
print('图片中的数字是：{:.0f}'.format(mlp_hw.predict(arr1)[0]))

使用的图像是网上下载的

9.jpg

执行结果如下：

=========================
样本数量：70000，样本特征数：784

代码运行结果：
==============================================
测试集数据得分：95.70%
图片中的数字是：9

总结

1.scikit-learn 中的MLP分类和回归在易用性方面表现的不错，但是仅限于处理小数据集。对庞大的或者复杂的数据集来说，力不从心
2.可以使用非常流行的几个Python深度学习库，比如，keras、theano、TensorFlow，这些深度学习库都支持 GPU加速，而scikit-learn并不支持，所以处理超大数据集的时候，以上几个深度学习库都要比scikit-learn效率更高。
3.对于特征类型比较单一的数据集来说，神经网络的表现不错；但如果数据集的特征类型差异比较大的话，随机森林或者是梯度上升随机决策树等基于决策树的算法表现会更好一些
4.初学者的神经网络调参原则：神经网络中的隐藏层的节点数约等于训练数据集的特征数量，但是一般不要超过500；在开始训练模型的时候，可以让模型尽量复杂，然后再对正则化参数apha进行调节来提高模型的表现。

最后编辑于：2020.12.08 10:18:42

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,179评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,229评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,032评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,533评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,531评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,539评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,916评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,574评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,813评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,568评论 2赞 320
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,654评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,354评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,937评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,918评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,152评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,852评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,378评论 2赞 342

Python机器学习之神经网络手写识别

引言

使用神经网络训练图像识别，并识别手写数字图像（自己随便写一个或者下载一个）

总结

推荐阅读更多精彩内容