GAN 鉴别器将真实图像与生成的图像区分开来。 在实践中,鉴别器通常表现得相当好。 但作为生成器的评判者,它有多大帮助? 作为 GAN 系列的一部分,我们研究了 LSGAN(最小二乘 GAN),以了解成本函数如何改进 GAN 训练。 当判别器最优时,生成器的目标函数变为(证明): 下面,我们绘制了具有不同高斯分布 q 的 p(均值 = 0 的高斯分布)的 JS 散度,均值范围为 0 到 30。 当 pr 和 pg(真实图像和生成图像的数据分布)相距很远时,它们的 JS-divergence 的梯度消失,梯度下降将无效。 简而言之,鉴别器表现良好,但它对生成器来说是一个糟糕的评判者。 最小二乘 GAN (LSGAN) 旨在更好地帮助生成器。 在数学上,让我们定义新的目标函数为 其中 a 和 b 是生成图像和真实图像的目标鉴别器标签,c 是生成图像的目标生成器标签。 现在,问题是 a、b 和 c 的值是多少,所以 pg 在训练期间会收敛到 pr。 我们在生成器方程中添加了一个额外的项。 由于 D(x)-c 与 G 无关,因此方程的最佳点保持不变。 具有固定 G 的最佳鉴别器将是: 如果没有证明,我们可以将生成器的成本函数转换为: 这是一个 Pearson χ2 散度。 重要的是我们可以在任何地方获得更平滑的渐变。 当 pg 和 pd 不同时,梯度不会消失,当 pg 接近 pd 时解会收敛。 通过选择 a = -1、b = 1 和 c = 0,我们得到 LSGAN 提出了另一个使用 c=b=1 和 a=0 的建议。 直观地说,LSGAN 希望真实图像的目标鉴别器标签为 1,生成图像为 0。对于生成器,它希望生成图像的目标标签为 1。 这是原始 GAN 的 LSGAN 论文中的实验证明了这两个方程的相似性能。 对于本文中的实验,使用了第二组方程。 网络设计 以下是生成器和判别器的网络设计。 对于带有标签的数据集,我们可以使用 CGAN 来生成图像。 特别是,如果有许多对象类,质量会提高。 这是一起使用 CGAN 和 LSGAN的网络架构。 结果 |