Conditional Image Synthesis With Auxiliary Classifier GANs

用辅助分类器的GANs的条件图像合成

摘要
合成高分辨率并且真实的图片在机器学习是一个一直存在的挑战。在本文中我们引入新的方法，来提高用于图像合成的生成对抗网络（GANs）的训练。我们利用标签条件构造了GANs的变种，它产生了128128像素的样本并展示出了全局一致性。我们通过扩展之前用于图像质量评估的工作，来提供两种新的分析方法来评估以类为条件的图片合成模型中，生成样本的可分辨性和多样性。这些分析方法表明高分辨率的样本提供了低分辨率样本中没有的类别信息。在ImageNet的1000类别中，128128的样本比起人工变小的32*32大小的样本的分辨性的两倍以上。除此之外，比起真实的ImageNet数据，84.7%的这些类有样本显示出了多样性。

全文：https://arxiv.org/abs/1610.09585

本文提出了一个新的条件对抗生成网络的框架，其具体的网络结果如下图所示：生成器的输入除了GAN结构中常见的噪声Z以外，还加入了类标签，而分辨器的判别也不再仅限于输入数据真伪的判断，同时会给出数据所属类标签的判断，因而分辨器成了强化的分类器（虽然之前也是二分类的分类器，但是其监督信号并不是很强）。如此设计的GAN在文中被称作AC-GAN（auxiliary classifier GAN，有辅助分类器的GAN）。
因为修改了分辨器，所以AC-GAN的训练Loss更改如下：

其中分辨器的Loss为最大化Ls+Lc，生成器的Loss为最大化Lc-Ls，其中S表示判断图片的来源(Source)，C表示判断图片的类标签（Class Label），这样的描述可能比较复杂，因而转换成MaxMin Game描述Loss如下：

具体的网络构成，可以见文章的附录部分。

随后，本文就提出的图片生成模型，认为生成图片的网络，不能是将低分辨率的图片进行简单的线性插值而生成高分辨率的图片，与此同时，生成的图片不能犯GAN常见的模式崩塌的问题，产生单一并不多样化的图片。

测试生成的图片的分辨力
如上所述，生成高分辨率的图片，需要不是简单的将低分辨率的图片进行线性插值来生成，因而要量化的分析生成的图片的质量，可以从其分辨力。从低分辨率通过插值生成的高分辨率图片，其本质上没有增加多余信息，只是低分辨率的模糊版。结合这样的思路，高分辨率的图片提供了更多的信息，这些信息结合到AC-GAN结构，每个生成图片都有其对应的标签，因而这个更多的信息，可以通过分类来表明，也就是说更多的信息，可以用于分类，也就是文中所说的分辨力（Discriminability）。
因此，文中采用了Inception网络对于生成的图片进行分类，查看其被分类为正确类别的比率，以此来判定生成的图片质量。下图中，图中左下的图，黑色的线，是真实图片，因而其达到的准确率可以说是生成图片的准确率的上限，红色的线表示的是生成的128128分辨率的图片的准确率表现，蓝色的线是生成的6464分辨率的图片的准确率表现，对于比其高或低分辨率的图片的准确率，是通过插值的方式缩放以后得到的图片得出的准确率表现，可以看到，降低分辨率确实降低了准确率，明确表明低分辨率的类信息更少；同样通过插值方式提高分辨率并不会带来更多的类信息，同时也不会损害已有的类信息，因而准确率保持不变。图中右下的图，每个点代表不同的类别，其坐标分别代码不同的分辨率下的准确率，其中蓝色的线是y=x的函数线，也就表明位于蓝色线上方的点，含义是该类别的图片在3232分辨率条件下准确率高于128128条件下的准确率，反之，在下方的点表明3232的准确率低于128128的准确率。文中统计了在线下方的点的比例为84.4%，也可以说大部分的图片在高分辨率的情况下，用于分类准确率会高于低分辨率。

测试图片的多样性
GAN有个最常见的问题就是模式坍塌的问题，就是模型找到一种方式，无论输入的内容是什么，生成的图片都只有一种，然而这种图片能大概率欺骗过分辨器。因而，产生的图片具有多样性，也是可以评估GAN模型好坏的指标。文中采用了图片的多尺度结构相似度来衡量图片与图片之间的相似度（multi-scale structural similarity，MS-SSIM），这个相似度在0和1之间取值，越大说明图片之间越相似。文中在一个给定类中取图片对，计算两者之间的MS-SSIM，如果图片多样性程度越高，那么这个MS-SSIM的分数应该越低。ImageNet的训练数据的平均MS-SSIM值最高的为0.25，这部分的实验结果如下图所示，图中左下角的图，图中每个点代表一个类，分别对应训练数据和生成数据的MS-SSIM的数值，蓝色的线依旧为y=x的函数线。但是这块并不是看生成数据MS-SSIM比训练数据的MS-SSIM大或者小的部分（因为这并没有什么意义，生成的数据多样性比训练数据高或低没有太多意义），而是要看红色的分界线，红色的线为MS-SSIM为0.25，因而低于0.25的数据，可以说生成的数据是比较接近真实图片的，文中统计了这根红线下面的类的数量为847个，也就是说84.7%的AC-GAN生成的类数据的多样性超过了训练集中最小变化量的类（仔细思考下，这样的比较方式可能存在一点问题，个人觉得用所有类的MS-SSIM的平均值可能会更具有代表性）。图中右下角的图，文中表示红色的线是生成数据的MS-SSIM平均值在训练过程中的变化（一直在上升，是不是说明有崩塌的可能，而且接近1了）；同时图中黑色的线，应该是训练完成后生成的图片的多样性（文中提及同样标准测试了训练数据，和完成后的生成样本，但是这里存在问题的是，训练完成后的横坐标按理是不存在的，或者，这个缺陷应该不会波动很大，这里也可以理解为横坐标为训练最大次数，然后计算平均的MS-SSIM的数值，不过这里确实没交代太清楚）。

文中除了分开的探索生成图片的分辨力和多样性，也探索了生成图片的分辨力和多样性的相关性，如下图所示，文中得到两者相关性为负相关（相关系数r=-0.16），因此认为AC-GAN的模型并没有以分辨力为代价，来产生多样性的样本。（这里得注意，分辨力的参数是越大越好，多样性的参数是越小越好）。

除了说明生成的图片具有分辨力的同时也具有多样性外，文中通过Inception Score比较了AC-GAN生成的样本的质量，获得了8.25±0.07的分数。同时由于在生成ImageNet的1000个类的数据时，采用了100个AC-GAN来生成数据，每个AC-GAN只需要关注10个类的数据的生成（GAN在存在多个类的情况下，生成的样本效果并不好，这也是GAN的一个研究方向），因此在附录中，文中还探索了这样划分类是否会使得AC-GAN生成效果更好。

在探索AC-GAN是否存在过拟合的实验中，文中提出了两种思路，第一种思路是比较L1距离最近的生成的图片，看起是否类似于训练的数据，从而判定是否存在过拟合，给出的实验结果图比较，依旧是人为的评定是否相似。除此方法之前，文中提出了线性插值噪声z和类标签c，查看其变化，其认为如果是过拟合的模型，那么产生的图片在插值的输入面前会发生图片，结果依旧需要认为判断，不过这样判断是否发生突变会比之前的容易（感觉可以用MS-SSIM来确定插值后产生的图片是否依旧比较大之类的）。
总结
本文提出的GAN结构，修改了Generator，除了输入噪声z之外，还提供了需要生成数据的类标签c；修改了Discriminator，除了判断图片的真伪之外，还需要判断图片的类标签。这样，在加入了监督信号的情况下，提升了GAN生成图片质量，并且没有出现GAN容易出现的模式坍塌现象。在评估GAN生成的图片验证上，提出了采用生成图片分类结果准确性来证实生成图片的质量，与此同时采用MS-SSIM参数的评估，来检验AC-GAN生成数据的多样性，提出这些数值评估的情况，在某种程度上而言，这些量化的分析，都可以设计成对应的Loss近一步提升GAN的生成图片的能力。除此之外，还定性分析了AC-GAN模型的是否产生过拟合的问题。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,839评论 6赞 482
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,543评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 153,116评论 0赞 344
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,371评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,384评论 5赞 374
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,111评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,416评论 3赞 400
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,053评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,558评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,007评论 2赞 325
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,117评论 1赞 334
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,756评论 4赞 324
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,324评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,315评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,539评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,578评论 2赞 355
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,877评论 2赞 345

Conditional Image Synthesis With Auxiliary Classifier GANs

推荐阅读更多精彩内容