一、本周工作
-
关于GAN音频实现,训练集是音乐,通过实验结果发现,效果并不是如期那么理想,合成之后断断续续,且没有音乐的特征,就目前GitHub上关于音频仅有的实验结果,效果不理想。
-
查阅资料时,忽然看到一篇文章,是关于Wasserstein GAN的,据文章中的介绍,WGAN比DCGAN(目前应用和代码使用率最高)的结果更优质,但WGAN和DCGAN到底区分何处,正在理解中。
-
通过查阅资料,进一步证明,DCGAN方式无法显示Pdata 的分布,也就是,没有办法将DCGAN的分布直观的表示出来,此为其一;
在训练过程中,并不是通过得到的概率进行下一次的训练,而是通过计算交叉熵作为下一次训练更新参数的依据,此为其二。
二、下周计划
-
把实用新型出现的个别问题进行仔细校正;
-
将WGAN的来龙去脉摸清楚;
-
试运行WGAN代码;