梵高眼中的世界（二）基于perceptual损失的网络

Index

Introduction
Architecture
- Image Transformation Network 图像转换网络
  - Residual Connections 残差连接
  - Down-sampling and Up-sampling
- Loss Network 损失网络

Introduction

本文基于CVPR2016中Fei Fei Li团队的<Perceptual Losses for Real-Time Style Transfer and Super-Resolution>一文。

在上一篇文章梵高眼中的世界（一）实时图像风格转换简介中，我们介绍了Gatys的算法，对单张白噪声图像进行梯度下降。很明显，假如我们想要做一个关于图像艺术风格转换的app，我们不可能对每一张用户上传的图像进行训练。这不仅需要很长的时间，还需要很强的计算力。
我们希望做到实时风格转换，很明显我们需要实现一个前馈的神经网络。也就是，对于每一张图片，我们只需要将其通过该前馈神经网络，就可以直接得到转换后的图像。Fei Fei Li团队的算法做到了这一点。
他们的算法包含两个网络：Image Transfer Network图像转移网络，和Loss Network损失网络。其中Image Transfer Network即我们需要的前馈神经网络，而Loss Network只作用于训练过程。接下来我们将讲解该网络框架以及一些细节。

Architecture

System overview

由上图我们能够清晰地看到整个网络框架。其中左边虚框中的fw即Image Transfer Network，右边虚框中的即Loss Network。输入图片通过fw网络，得到y^{。通过训练后，y}即为我们希望得到的风格转换后的图片。y_s为目标风格图片，y_c为内容图片。再将y^, y_s, y_c输入到训练好的VGG16网络，得到特殊层数的值计算Loss，即可使用梯度下降进行训练。

Image Transformation Network 图像转换网络

在本文中，图像风格转换网络由卷积层以及转置卷积层组成。网络结构如下：

两层卷积层, strides=[1,2,2,1]

conv1: [9,9,3,32]
conv2: [3,3,32,64]

五层残差连接层:残差层全为filters为[3,3,64,64], strides=[1,1,1,1]的网络。
两层转置卷积层, strides=1,1/2,1/2,1

convt1: [3,3,64,32]
convt2: [3,3,32,3]

Residual Connections 残差连接

残差网络Residual Network首次出现在ILSVRC大赛中。我们都知道，通常情况下来说越深的网络的性能将会越好。在残差网络出现在ILSVRC前，Alex Net通过ReLu来加速网络计算，并提出Dropout来防止过拟合，奠定了深度学习在机器视觉中的地位。其后的GoogleNet 和 VGG 其实只是通过加深网络的深度以及复杂度以追求更优的性能。然而，当我们尝试更深的网络时，会出现两个问题：

随着层数的增加, 会大大增加训练难度.
出现梯度消失或梯度爆炸的问题.
残差网络解决了以上两个问题，在ILSVRC中，ResNet的层数比VGG19多八倍。

以下是Residual Network的结构：

Residual Connection

上图中，我们设隐含层为H(x). 我们知道一个复杂函数能够通过多个非线性层组合近似, 因此我们可以令H(x)=F(x)+x. 即将非线性的输出F(x)和线性输入x相加作为总输出. 这样做的好处有:

比起原来的H(x), F(x)+x更易训练, 大大降低了学习难度.
没有增加额外的参数.

残差网络的tensorflow实现如下:

def res_block(x, shape, strides, padding='SAME', projection=True):
'''
    Args:
        x: Input Tensor with shape: [batch size, length, width, channels]
        shape: filter shape
        strides: Strides.
'''
    out = shape[-1]
    bs, w, l, c = x.get_shape().as_list()
    temp = conv_block(x, shape, strides, relu=False)
    if projection == True:
        x = conv_block(x, [1,1,c, out],strides, relu=False)
    else:
         x = tf.pad(x, [[0,0],[0,0],[0,0],[0,out-c]])
    return tf.nn.relu(x+temp)

其中conv_block是一个简单的卷积block，只需要使用tf.nn.conv2d即可，注意要设置relu的属性。

Down-sampling and Up-sampling

在这里我们使用一个转置卷积网络进行up-sampling。
虽然输入输出图片大小一致，先Down-sampling再Up-sampling还是有一定优点：

减少计算量。
增加有效感知区域大小。

关于转置卷积更直观的理解可以看这个网站中的动图。

转置卷积在tensorflow可以使用tf.nn.conv2d_transpose(...)模块，注意strides不需要写成分数形式。例如1/2的步长则可以写作strides=[1,2,2,1]

Loss Network 损失网络

Loss Network损失网络只用于训练过程计算loss。在训练过程，我们只对Image Transfer Network 进行训练，训练好的VGG网络参数不改变。在训练结束后，我们只需要Image Transfer Network即可以完成图像风格转换。
本文应用迁移学习，使用了已训练好的VGG16来计算loss。之所以使用已训练好的网络，是由于训练好的网络中已包含提取高维特征的能力。例如在以下图像风格转换实例中:

Examples

我们可以观察到，人物和沙滩，猫脸和猫身体的转换具有明显区别。我们可以猜想训练好的Image Transfer Network具有深度提取人物以及猫脸的特征的能力，这种能力来源于我们使用的VGG网络。
理解Loss Network为何使用已训练好的VGG后，Loss的具体计算如下：

Content Loss

Style Loss

其中Φj(y)代表输入y时第j层VGG网络的输出。G为前一章所讲解的Gram matrix。

最后编辑于：2018.03.28 14:44:05

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,723评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,485评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,998评论 0赞 344
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,323评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,355评论 5赞 374
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,079评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,389评论 3赞 400
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,019评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,519评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,971评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,100评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,738评论 4赞 324
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,293评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,289评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,517评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,547评论 2赞 354
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,834评论 2赞 345