动手学深度学习(三)——丢弃法(从零开始)

文章作者:Tyan
博客:noahsnail.com  |  CSDN  |  简书

注:本文为李沐大神的《动手学深度学习》的课程笔记!

丢弃法的概念

在现代神经网络中,我们所指的丢弃法,通常是对输入层或者隐含层做以下操作:

  • 随机选择一部分该层的输出作为丢弃元素;
  • 把丢弃元素乘以0;
  • 把非丢弃元素拉伸。

丢弃法的实现

import mxnet as mx
from mxnet import nd
from mxnet import gluon
from mxnet import autograd
from utils import load_data_fashion_mnist, accuracy, evaluate_accuracy, SGD

# 设置随机种子
mx.random.seed(2)

# 实现dropout
def dropout(X, drop_probability):
    # 计算保留数据的比例
    keep_probability = 1 - drop_probability
    # 确保drop_probability的输入合法
    assert 0 <= keep_probability <= 1
    # 丢弃所有元素
    if keep_probability == 0:
        return X.zeros_like()
    # 随机生成一个相同纬度的矩阵, 根据随机值和keep_probability的对比确定是否丢弃该元素
    mask = nd.random.uniform(0, 1.0, X.shape, ctx=X.context) < keep_probability
    # 保证 E[dropout(X)] == X, 对剩下的数据进行缩放
    scale = 1 / keep_probability
    return mask * X * scale
# 测试dropout
A = nd.arange(20).reshape((5,4))
dropout(A, 0.0)
[[  0.   1.   2.   3.]
 [  4.   5.   6.   7.]
 [  8.   9.  10.  11.]
 [ 12.  13.  14.  15.]
 [ 16.  17.  18.  19.]]
<NDArray 5x4 @cpu(0)>
dropout(A, 1.0)
[[ 0.  0.  0.  0.]
 [ 0.  0.  0.  0.]
 [ 0.  0.  0.  0.]
 [ 0.  0.  0.  0.]
 [ 0.  0.  0.  0.]]
<NDArray 5x4 @cpu(0)>
dropout(A, 0.5)
[[  0.   2.   4.   0.]
 [  8.   0.  12.   0.]
 [ 16.  18.   0.   0.]
 [  0.   0.   0.  30.]
 [  0.  34.  36.   0.]]
<NDArray 5x4 @cpu(0)>

丢弃法的本质

一般来说,在集成学习里,我们可以对训练数据集有放回地采样若干次并分别训练若干个不同的分类器;测试时,把这些分类器的结果集成一下作为最终分类结果。事实上,丢弃法在模拟集成学习。丢弃法实质上是对每一个这样的数据集分别训练一个原神经网络子集的分类器。与一般的集成学习不同,这里每个原神经网络子集的分类器用的是同一套参数。因此丢弃法只是在模拟集成学习。使用丢弃法的神经网络实质上是对输入层和隐含层的参数做了正则化:学到的参数使得原神经网络不同子集在训练数据上都尽可能表现良好。

数据获取

# 批数据大小
batch_size = 256

# 加载数据
train_data, test_data = load_data_fashion_mnist(batch_size)

含两个隐藏层的多层感知机

# 模型输入大小
num_inputs = 28 * 28

# 模型输出大小
num_outputs = 10

# 第一个隐藏层节点数量
num_hidden1 = 256

# 第二个隐藏层节点数量
num_hidden2 = 256

# 随机数据时的标准差
weight_scale = 0.01

# 第一个隐藏层权重
W1 = nd.random_normal(shape=(num_inputs, num_hidden1), scale=weight_scale)
# 第一个隐藏层偏置
b1 = nd.zeros(num_hidden1)

# 第二个隐藏层权重
W2 = nd.random_normal(shape=(num_hidden1, num_hidden2), scale=weight_scale)
# 第二个隐藏层偏置
b2 = nd.zeros(num_hidden2)

# 输出层权重
W3 = nd.random_normal(shape=(num_hidden2, num_outputs), scale=weight_scale)
# 输出层偏置
b3 = nd.zeros(num_outputs)

# 参数数组
params = [W1, b1, W2, b2, W3, b3]

# 需要计算梯度, 添加自动求导
for param in params:
    param.attach_grad()

定义包含丢弃层的模型

# 第一个隐藏层的丢弃概率
drop_prob1 = 0.2
# 第二个隐藏层的丢弃概率
drop_prob2 = 0.5

# 定义网络
def net(X):
    X = X.reshape((-1, num_inputs))
    # 第一层全连接
    h1 = nd.relu(nd.dot(X, W1) + b1)
    # 在第一层全连接后添加丢弃层
    h1 = dropout(h1, drop_prob1)
    # 第二层全连接
    h2 = nd.relu(nd.dot(h1, W2) + b2)
    # 在第二层全连接后添加丢弃层
    h2 = dropout(h2, drop_prob2)
    # 返回输出
    return nd.dot(h2, W3) + b3

训练

# 定义交叉熵损失
softmax_cross_entropy = gluon.loss.SoftmaxCrossEntropyLoss()

# 定义学习率
learning_rate = 0.5

# 训练
for epoch in range(5):
    # 训练损失
    train_loss = 0.0
    # 训练准确率
    train_acc = 0.0
    # 迭代训练
    for data, label in train_data:
        with autograd.record():
            # 计算输出
            output = net(data)
            # 计算损失
            loss = softmax_cross_entropy(output, label)
        # 梯度反向传播
        loss.backward()
        # SGD更新梯度
        SGD(params, learning_rate / batch_size)
        # 记录训练损失
        train_loss += nd.mean(loss).asscalar()
        # 记录训练准确率
        train_acc += accuracy(output, label)
    # 计算测试准确率
    test_acc = evaluate_accuracy(test_data, net)
    print("Epoch %d. Loss: %f, Train acc %f, Test acc %f" % (epoch, train_loss / len(train_data), train_acc / len(train_data), test_acc))
Epoch 0. Loss: 1.221062, Train acc 0.528746, Test acc 0.754006
Epoch 1. Loss: 0.598503, Train acc 0.774890, Test acc 0.813101
Epoch 2. Loss: 0.499490, Train acc 0.818493, Test acc 0.840244
Epoch 3. Loss: 0.457343, Train acc 0.832699, Test acc 0.835036
Epoch 4. Loss: 0.426575, Train acc 0.846070, Test acc 0.849159
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,980评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,178评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,868评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,498评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,492评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,521评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,910评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,569评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,793评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,559评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,639评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,342评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,931评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,904评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,144评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,833评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,350评论 2 342

推荐阅读更多精彩内容