目的: 得到一个生成模型G, 可以用来生成图片。
简介
生成式对抗网络(GAN, Generative Adversarial Networks) 是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一, GAN是“生成对抗网络” (Generative Adversarial Networks)的简称,由2014年还在蒙特利尔读博士的lanGoodfellow引入深度学习领域。2016年,GAN热潮席卷AI领域顶级会议,从ICLR到NIPS,大量高质量论文被发表和探讨。Yann LeCun曾评价GAN是“20年来机器学习领域最酷的想法”, 机器学习的模型可大体分为两类,生成模型(Generative Model)和 判别模型(Discriminative Model). 判别模型需要输入变量,通过某种模型预测。生成模型是给定某种隐含信息,来随机产生观测数据。GAN 主要包括了两部分,即生成器generator 与 判别器 discriminator 。 生成器主要用来学习真实图像分布从而让自身生成的图像更加真实,以骗过判别器。判别器则需要对接收的图片进行真假判别。
原理
使得判别器无法判断,无论对于真假样本,输出结果概率都是0.5, 在训练过程中,生成器努力地让生成的图像更加真实,而判别器则努力地去识别出图像的真假,这个过程相当于一个二人博弈,随着时间的推移,生成器和判别器在不断的进行对抗,最终两个网络达到了一个动态均衡;生成器生成的图像接近于真实图像分布,而判别器识别不出真假图像,对于给定图像的预测为真的概率基本接近0.5。
举例
造假币的团伙相当于生成器,他们想通过伪造金钱来骗过银行,使得假币能够正常交易,而银行相当于判别器,需要判断进来的钱是真钱还是假币。因此假币团伙的目的是要造出银行识别不出的假币而骗过银行,银行则要想办法准确地识别出假币。
GAN原理的总结
对于给定的真是图片,判别器是要为其打上标签1,对于给定的生成图片,判别器是要为打上标签0, 对于生成器传给判别器的生成图片,生成器希望辨别器打上标签1, 训练过程中,生成网络G的目标就是尽量生成真实的图片去欺骗判别网络D。而D的目标就是尽量把G生成的图片和真实的图片分别开来, 这样,G和D构成了一个动态的“博弈过程”
博弈的结果是什么?
在最理想的状态下,G可以生成足以“以假乱真”的图片G(z)。 对于D来说,它难以判断G生成的图片究竟是不是真实的,因此D(G(z))= 0.5
GAN的应用领域
a、图像生成, b、图像增强 c、风格化 d、艺术的图像创造
下面使用keras生成mnist数据
初始化数据
def __init__(self):
# 初始化一个长度为100的变量用于初始化图片向量
self.randomLength = 100
# (self.train_images, train_labels)的shape是(60000, 28, 28) (60000,)
(self.train_images, self.train_labels), (_, _) = keras.datasets.mnist.load_data()
# 类型的 train_images 类型 uint8-> float32 用self.train_images.dtype进行查看
self.train_images = tf.cast(self.train_images, tf.float32)
self.train_images = np.expand_dims(self.train_images, -1)
# 对train_images的取值返回映射到[-1. 1]
self.train_images = self.train_images/127.5 - 1
self.BATCH_SIZE = 256
self.BUFFER_SIZE = len(self.train_images)
# 将真实的训练数据转换成TensorSliceDataset
self.datasets = tf.data.Dataset.from_tensor_slices(self.train_images)
# 将真实的数据做一个乱序 并且处理成 BatchDataset
self.datasets = self.datasets.shuffle(self.BUFFER_SIZE).batch(self.BATCH_SIZE)
# loss
self.cross_entropy = keras.losses.BinaryCrossentropy(from_logits=True)
# 生成器的 optimazer
self.generator_optimizer = keras.optimizers.Adam(1e-4)
# 辨别器的optimazer
self.discriminator_optimizer = keras.optimizers.Adam(1e-4)
self.EPOCHS = 40
# 噪音的向量长度
self.noise_dim = 100
# 每个epochs生成的样本个数
self.num_exp_to_generate = 3
# 生成16个随机向量
self.seed = tf.random.normal([self.num_exp_to_generate, self.noise_dim])
self.generator = self.generator_model()
self.discriminator = self.discriminator_model()
1.生成器模型模型
def generator_model(self):
model = tf.keras.Sequential()
model.add(layers.Dense(256, input_shape=(self.randomLength,), use_bias=False))
model.add(layers.BatchNormalization())
model.add(layers.LeakyReLU())
model.add(layers.Dense(512, use_bias=False))
model.add(layers.BatchNormalization())
model.add(layers.LeakyReLU())
model.add(layers.Dense(self.train_images.shape[1]*self.train_images.shape[2]*self.train_images.shape[3],
use_bias=False, activation='tanh'))
model.add(layers.BatchNormalization())
model.add(layers.Reshape(self.train_images.shape[1:]))
return model
2.辨别器模型创建
def discriminator_model(self):
model = keras.Sequential()
model.add(layers.Flatten())
model.add(layers.Dense(512, use_bias=False))
model.add(layers.BatchNormalization())
model.add(layers.LeakyReLU())
model.add(layers.Dense(256, use_bias=False))
model.add(layers.BatchNormalization())
model.add(layers.LeakyReLU())
model.add(layers.Dense(1, use_bias=False))
return model
3.辨别器损失函数
def discriminator_loss(self, real_out, fake_out):
real_loss = self.cross_entropy(tf.ones_like(real_out), real_out)
fake_loss = self.cross_entropy(tf.zeros_like(fake_out), fake_out)
return real_loss + fake_loss
4.生成器损失函数
def generator_loss(self, fake_out):
return self.cross_entropy(tf.ones_like(fake_out), fake_out)
5.每次训练
def train_step(self, images):
# 长度为self.noise_dim的随机数
noise = tf.random.normal([self.BATCH_SIZE, self.noise_dim])
with tf.GradientTape() as gen_tape, tf.GradientTape() as disc_tape:
real_out = self.discriminator(images, training=True)
gen_image = self.generator(noise, training=True)
fake_out = self.discriminator(gen_image, training=True)
gen_loss = self.generator_loss(fake_out)
disc_loss = self.discriminator_loss(real_out, fake_out)
gradient_gen = gen_tape.gradient(gen_loss, self.generator.trainable_variables)
gradient_disc = disc_tape.gradient(disc_loss, self.discriminator.trainable_variables)
self.generator_optimizer.apply_gradients(zip(gradient_gen, self.generator.trainable_variables))
self.discriminator_optimizer.apply_gradients(zip(gradient_disc, self.discriminator.trainable_variables))
6.生成三张图片
def generate_plot_image(self, gen_model, test_noise, epoch):
pre_images = gen_model(test_noise, training=False)
fig = plt.figure(figsize=(3,1))
for i in range(pre_images.shape[0]):
plt.subplot(1,3,i+1)
plt.imshow((pre_images[i, :, :, 0] + 1)/2, cmap='gray')
plt.axis('off')
fig.savefig('./images/{}.png'.format(epoch))
7.训练
def train(self):
for epoch in range(self.EPOCHS):
for image_batch in self.datasets:
self.train_step(image_batch)
print('.', end='')
self.generate_plot_image(self.generator, self.seed, epoch)
训练
if __name__ == '__main__':
if not os.path.exists('./images'):
os.makedirs('./images')
GanHandleImage().train()
下面是我训练到第40次的一张图片 由于本人电脑配置比较低,训练的次数较少