周报 2017.05.15 -张猛

一、上周工作 1. 把BEGAN的代码进行复现,由于机器配置与代码并不匹配,调整参数后成功运行; 2. 由于参数进行调整,得到的结果并不尽如人意,生成结果勉强,插值结果崩溃; 3. 为小论文做准备。 二、下周计划 1. 通读BEGAN论文,搞清楚到底是个什么意思; 2. 理解BEGAN关键性代码,了解插值形成以及结果。 ...
Read More

第十周周报——王佳琦

完成了专利的收尾工作,报发明专利的话需要将查新报告打印出来交到世纪楼,实用新型直接发kjcq@ysu.edu.cn这个邮箱就可以了。周五去交专利,办公室的老师比较看重查新报告,我的查新报告没有加入相关已有技术或专利的对比,这一点一定要写在查新报告上,回来改了一下,今天下午再去投一次。 ...
Read More

2017.04.24 周报-张猛

一、 上周工作 1. 手写汉字训练集,通过65000次的迭代,结果已然显现,但是清晰度和训练集的清晰度并不是很匹配,主要是因为训练集数量太少,到不到效果; 2. 虽然清晰度有些差别,但汉字本身还是清晰可辨的,笔画也很清晰; 3. 搭载GTX1050显卡,进行了代码的测试,速度明显提升; 4. 阅读BEGAN的论文,了解基本框架和和经典算法之间的区别; 5. 准备开题报告。 二、 下周计划 1. 实用新型回复; 2. 另实用新型整理; 3. 论文准备工作。 ...
Read More

周报 2017.04.17 – 张猛

一、本周工作 由于生成模型内部并不像想象中的可以人为控制,所以把训练过程通过Tensorboard可视化,得到几个参数: d_loss : 判别器的损失函数,是d_loss_fake与d_loss_real之和; d_loss_fake :生成图片输入到判别器中的结果和预期为0的结果的交叉熵; d_loss_real : 真实图片输入到判别器中的结果和预期为1的结果的交叉熵; g_loss : 生成器损失函数,生成器生成的图片输入到判别器中的结果和预期为1的交叉熵。 但是可视化出来的结果显示的训练过程结构图太复杂,需要对代码的完全理解和过程的准确掌握,打算深度研究。 二、下周计划 将参数的意义和表达的信息掌握准确; 显卡接上,跑一下代码,试试效率。 ...
Read More

第七周周报——王佳琦

本周完成的工作: 一、和老师交流专利的问题,重新写了交底书。 二、测试问题: 星期六下午和两个大四的同学在实验楼下测试,布好网络后开始测试。服务器抛出异常“线程间操作无效: 从不是创建控件“XXX”的线程访问它”。当时没有解决,只好先结束测试。晚上找了一下解决办法,(http://m.blog.csdn.net/article/details?id=44927271)成功解决。 星期日上午继续测试。简要说一下存在的问题: 1.客户端刚连上服务器时定位服务开启需要1~2s,这段时间定位丢失会造成误报,需要屏蔽。 2.一开始加入加速度约束并不会报警,人的运动不能很好地模拟轿厢,人需要跑起来才会报警。后几次实验没有加入加速度,仅靠距离判断结果还不错,距离误差在1~2M左右。 下周工作: 写申请书、分析数据、改程序 ...
Read More

周报2017.04.03-张猛

一、本周工作 自己简单做了一个小小的手写体汉字训练集,共122张图片,输入图像大小为9696;输出图像大小为6464,总共8*8=64张;进行了10000 epoch;有趣的是,最初64张图片中能产生4-5个汉字,随着迭代次数的不断增加,产生的64张图像多样性越来越差,迭代到1200次以后,这64张产生的都是同一个字;也印证了论文中提到的GAN在训练过程中的不稳定:判别器越来越好,生成器越来越差;多样性也不断减少。同时,在实验中也反映了另一个问题:生成器与判别器是否同时在进化,进化到什么程度,表现不出来,也就是可解释性差。更有趣的是:在6000次迭代之后,生成汉字的多样性又开始丰富,即使可解释性差,从实验结果来看,本实验最终的效果说明,生成器和判别器参数更新比较均衡,训练过程比较稳定。(注:仅代表个人实验观点) 目前在各种会议(ECCV、NIPS、ICIR、arXiv)上发表的GAN相关文章,涉及到的应用方向如下:对抗型自编码器、生成图像、图像修复、超分辨率、去遮挡、语义分割、目标检测、视频预测、纹理合成与风格转移、面部生成与编辑、对话生成。 二、下周计划 GAN可视化尝试 ...
Read More