Python搭建BP神经网络测试mnist数据集

mnist数据集官网:http://yann.lecun.com/exdb/mnist/

mnist数据集是一个被广泛应用(“嚼烂”)的手写体数字数据集,包含60000个训练样本及10000个测试样本,以字节形式存储。在官网下载到的数据是安装包形式,安装包及其解压后数据形式如下:


我们需要注意的是哪个文件是什么数据集,我将对应关系陈列如下:

t10k-images    :    测试图像数据集

t10k-labels      :测试标签数据集

train-images    :    训练图像数据集

train-labels    :    训练标签数据集

关于标签和图像的对应关系我不在此处表达,因为看到这篇文章的同学们应该都是对数据集有一定了解的同学们。

我在搭建神经网络测试数据的时候,参考了网上很多的代码,也搭建了很多不同的网络,引用mnist数据集的方法也测试了许多次。但也失败了好多,我最终找到了如下方法可以达到预期目标。


首先将mnist数据集转换为CSV格式:

(参考网站:https://blog.csdn.net/Albert201605/article/details/79893585)

我将个人转换代码张贴如下:

def convert(imgf, labelf, outf, n):

    f = open(imgf,'rb')

    o = open(outf,'w')

    l = open(labelf,'rb')

    f.read(16)

    l.read(8)

    images = []

    for i in range(n):

        image = [ord(l.read(1))]

            for j in range(28*28):

                image.append(ord(f.read(1)))

                images.append(image)

       for image in images:

            o.write(','.join(str(pix)for pixin image) +'\n')

        f.close()

        o.close()

        l.close()


train_image_path ='E:/College/Graduate_Paper/mnist_test/train-images.idx3-ubyte'

train_label_path ='E:/College/Graduate_Paper/mnist_test/train-labels.idx1-ubyte'

test_image_path ='E:/College/Graduate_Paper/mnist_test/t10k-images.idx3-ubyte'

test_label_path ='E:/College/Graduate_Paper/mnist_test/t10k-labels.idx1-ubyte'

convert( train_image_path , train_label_path ,'E:/College/Graduate_Paper/mnist_test/mnist_train.csv' ,60000 )

convert( test_image_path , test_label_path ,'E:/College/Graduate_Paper/mnist_test/mnist_test.csv' ,10000 )

print('Convert finished!')

转换完成后文件格式如下所示:


在此时,我们依旧无法自然语言方式直接读取测试集内的数据。


其次,将CSV格式的数据集读入神经网络进行训练测试:

(参考网址:https://blog.csdn.net/ebzxw/article/details/81591437)

代码张贴如下:

import numpy

import scipy.special


class neuralNetwork:

    def __init__(self, inputnodes, hiddennodes, outputnodes, learningrate):

        self.inodes = inputnodes

        self.hnodes = hiddennodes

        self.onodes = outputnodes

        self.lr = learningrate

        self.wih = (numpy.random.normal(0.0,pow(self.hnodes, -0.5), (self.hnodes,self.inodes)))#shape (200,784)

        self.who = (numpy.random.normal(0.0,pow(self.onodes, -0.5), (self.onodes,self.hnodes)))#shape (10,200)

        self.activation_function =lambda x: scipy.special.expit(x)

pass

    print('初始化神经网络完成')

    def train(self, inputs_list, targets_list):

        inputs = numpy.array(inputs_list,ndmin=2).T#shape (784,1)

        targets = numpy.array(targets_list,ndmin=2).T#shape (10,1)

        hidden_inputs = numpy.dot(self.wih, inputs)#shape (200,1)

        hidden_outputs =self.activation_function(hidden_inputs)

        final_inputs = numpy.dot(self.who, hidden_outputs)#shape (10,1)

        final_outputs =self.activation_function(final_inputs)

        output_errors = targets - final_outputs#shape (10,1)

        hidden_errors = numpy.dot(self.who.T, output_errors)#shape (200,1)

        self.who +=self.lr * numpy.dot((output_errors * final_outputs * (1.0 - final_outputs)),

numpy.transpose(hidden_outputs))

        self.wih +=self.lr * numpy.dot((hidden_errors * hidden_outputs * (1.0 - hidden_outputs)),

numpy.transpose(inputs))

pass

    print('神经网络训练完成')

    def query(self, inputs_list):

        inputs = numpy.array(inputs_list,ndmin=2).T

        hidden_inputs = numpy.dot(self.wih, inputs)

        hidden_outputs =self.activation_function(hidden_inputs)

        final_inputs = numpy.dot(self.who, hidden_outputs)

        final_outputs =self.activation_function(final_inputs)

return final_outputs

print('神经网络测试完成')


#设置神经网络初始参数

input_nodes =784    # 28 * 28 = 784

hidden_nodes =200

output_nodes =10

learning_rate =0.1

n = neuralNetwork(input_nodes, hidden_nodes, output_nodes, learning_rate)

print('神经网络参数传入完成')


#训练神经网络 

training_data_file =open('E:/College/Graduate_Paper/mnist_test/mnist_train.csv','r')

training_data_list = training_data_file.readlines()

training_data_file.close()

# epochs is the number of times the training data set is used for training

epochs =5

for ein range(epochs):

    for recordin training_data_list:

        all_values = record.split(',')

        inputs = (numpy.asfarray(all_values[1:]) /255.0 *0.99) +0.01

        targets = numpy.zeros(output_nodes) +0.01

        targets[int(all_values[0])] =0.99

        n.train(inputs, targets)

        pass


    print('%d times train result in the followings:'%e)

    test_data_file =open('E:/College/Graduate_Paper/mnist_test/mnist_test.csv','r')

    test_data_list = test_data_file.readlines()

    test_data_file.close()

    scorecard = []


    for recordin test_data_list:

        all_values = record.split(',')

        correct_label =int(all_values[0])

        inputs = (numpy.asfarray(all_values[1:]) /255.0 *0.99) +0.01

        outputs = n.query(inputs)

        label = numpy.argmax(outputs)

        if (label == correct_label):

            scorecard.append(1)

        else:

            scorecard.append(0)

        pass

    scorecard_array = numpy.asarray(scorecard)

    print('performance = ', scorecard_array.sum() / scorecard_array.size)

    pass


代码运行结果展示如下:


更改参数对神经网络识别正确率影响如下所示:


测试数据仅供参考,转载请注明出处。若有疑问,请私信我(不经常上),看到后会尽快与您讨论。若有侵权,请联系我删除此文。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,772评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,458评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,610评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,640评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,657评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,590评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,962评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,631评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,870评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,611评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,704评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,386评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,969评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,944评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,179评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,742评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,440评论 2 342