DCGAN

    xiaoxiao2025-01-19  22

    https://blog.csdn.net/liuxiao214/article/details/74502975

    https://blog.csdn.net/liuxiao214/article/details/73500737

    https://blog.csdn.net/czp_374/article/details/81199055

     

    重点:DCGAN基本结构和最原始的GAN是类似的,不同点是:D和G中采用了较为特殊的结构,以便对图片进行有效建模。

    对于原始的GAN

    判别器D,它的输入是一张图像,输出是这张图像为真实图像的概率。在DCGAN中,判别器D的结构是一个卷积神经网络,输入的图像经过若干层卷积后得到一个卷积特征,将得到的特征送入Logistic函数,输出可以看作是概率。

     

    G的输入时一个100维的向量z。它是之前所说的噪声向量。G网络的第一层实际是一个全连接层,将100维的向量变成一个4x4x1024维的向量,从第二层开始,使用转置卷积做上采样,逐渐减少通道数,最后得到的输出为64x64x3,即输出一个三通道的宽和高都为64的图像。

    稳定的深度卷积GAN 架构指南:

    所有的pooling层使用步幅卷积(判别网络)和微步幅度卷积(生成网络)进行替换。

    在生成网络和判别网络上使用批处理规范化。

    对于更深的架构移除全连接隐藏层。

    在生成网络的所有层上使用RelU激活函数,除了输出层使用Tanh激活函数。

    在判别网络的所有层上使用LeakyReLU激活函数。  

    最新回复(0)