https://blog.csdn.net/liuxiao214/article/details/74502975
https://blog.csdn.net/liuxiao214/article/details/73500737
https://blog.csdn.net/czp_374/article/details/81199055
重点:DCGAN基本结构和最原始的GAN是类似的,不同点是:D和G中采用了较为特殊的结构,以便对图片进行有效建模。
对于原始的GAN
判别器D,它的输入是一张图像,输出是这张图像为真实图像的概率。在DCGAN中,判别器D的结构是一个卷积神经网络,输入的图像经过若干层卷积后得到一个卷积特征,将得到的特征送入Logistic函数,输出可以看作是概率。
G的输入时一个100维的向量z。它是之前所说的噪声向量。G网络的第一层实际是一个全连接层,将100维的向量变成一个4x4x1024维的向量,从第二层开始,使用转置卷积做上采样,逐渐减少通道数,最后得到的输出为64x64x3,即输出一个三通道的宽和高都为64的图像。
稳定的深度卷积GAN 架构指南:
所有的pooling层使用步幅卷积(判别网络)和微步幅度卷积(生成网络)进行替换。
在生成网络和判别网络上使用批处理规范化。
对于更深的架构移除全连接隐藏层。
在生成网络的所有层上使用RelU激活函数,除了输出层使用Tanh激活函数。
在判别网络的所有层上使用LeakyReLU激活函数。