周报 1017.04.10-张猛

一、本周工作 由GAN训练完之后得到生成模型,其参数为每一层的权重,对于类型单一的训练集来说,生成模型单一,参数相当于一对一;对于多类型的训练集来说,参数相当于是多对多,意思是:随机输入一种分布,模型会分类到对应的子模型中,然后生成样本;生成模型会根据输入进行似分类处理,然后进行输出;到底是那些参数对应哪种类型的生成模型,无解,仅是黑盒子调控行为。 二、下周计划 将此前工作做下总结,看怎样结合应用 ...
Read More

周报2017.04.03-张猛

一、本周工作 自己简单做了一个小小的手写体汉字训练集,共122张图片,输入图像大小为9696;输出图像大小为6464,总共8*8=64张;进行了10000 epoch;有趣的是,最初64张图片中能产生4-5个汉字,随着迭代次数的不断增加,产生的64张图像多样性越来越差,迭代到1200次以后,这64张产生的都是同一个字;也印证了论文中提到的GAN在训练过程中的不稳定:判别器越来越好,生成器越来越差;多样性也不断减少。同时,在实验中也反映了另一个问题:生成器与判别器是否同时在进化,进化到什么程度,表现不出来,也就是可解释性差。更有趣的是:在6000次迭代之后,生成汉字的多样性又开始丰富,即使可解释性差,从实验结果来看,本实验最终的效果说明,生成器和判别器参数更新比较均衡,训练过程比较稳定。(注:仅代表个人实验观点) 目前在各种会议(ECCV、NIPS、ICIR、arXiv)上发表的GAN相关文章,涉及到的应用方向如下:对抗型自编码器、生成图像、图像修复、超分辨率、去遮挡、语义分割、目标检测、视频预测、纹理合成与风格转移、面部生成与编辑、对话生成。 二、下周计划 GAN可视化尝试 ...
Read More

2017.03.27 张猛

一、本周工作 关于图像修复,纹理生成,超分辨率三方面,了解了一下目前在论文中有记载的实现方式都有什么,其中, 图像修复实现的方式有:基于稀疏表示/纹理合成/局部结构信息/几何信息/马尔科夫随机场/全变分模型/压缩感知等,方式较多,实验结果也较成熟; 纹理生成实现的方法有:Arnold正反变换/特征匹配/马尔科夫模型/粒子群优化算法/块缝合/块采样等; 超分辨率实现的方式有:卷及神经网络/基于插值(传统插值/ 边缘指导插值) /基于建模/基于学习等; 总体来讲,以上方法在对应的功能实现方面做了更好的优化,实验效果也更逼真。若要相关方向的应用,可以考虑超分辨率,大概思路如下: 监控摄像头下,由于采集到的图像数据量非常大,但是存储空间有限,所以图像的分辨率也就变得低了;当我们需要某张图像的细节信息时,由于分辨率问题,图像并不是很清晰,也就往往捕捉不到关键信息。若是使用超分辨率,将图像中的细节丰富处理,可能就是某些人员的需求。 二、下周计划 将应用想法商讨,落实,并进行深入了解。 ...
Read More

周报-张猛 2017.03.20

一、本周工作 对于WGAN的大体结构已有初步了解,但是其中的对WGAN的深度解析,公式由来以及推导过程有一定难度,现在还没有真正理解。按照论文中对DCGAN不足之处的理解以及对应的做出对应的优化,可以看出,WGAN从结构上和从训练的难易程度上,比较DCGAN确实有些改进,也比较好训练,也更加稳定。 本周从GitHub上Down下来些源码,本想在机子上跑一下,看看结果咋样,但是代码基本上都是基于GPU运行的,由于本机的基本环境不支持,所以代码也没有跑成。 二、下周计划 想试试GAN的其他应用比如图像翻译,超分辨率应用,能有什么新结果。 ...
Read More