张涛周报20190414

按照事件顺序一一记录: 1 装发项目: a) 本周共开会四次。前两次为电话会议,与程老师和宇涵一起商讨指令集的制定。周四下午三个人见面开会,制定详细的指令集与指令流程,并由宇涵制作PPT准备汇报。周六上午项目组核心成员开会,讨论整体方案。在整体方案讨论中,对于摇荡预测部分目前无修改,但建议多传感器冗余可以暂缓,同时在预测训练中加入气象与航行数据。 重点讨论了关于语音指令部分的内容,对于仅仅利用科大讯飞完成语音识别的计划感觉相对单薄,而且指南中要求有语义部分。因此,周六晚上针对自然语言理解部分展开前期调研。 b)语音指令。本周初步制定语音指令集,马天宇调试科大讯飞离线任务有了进展,这些都为后期研究奠定了基础。此处重点阐述关于NLP部分的内容。 目前该内容可以分为三个部分:第一部分为语音预处理,负责减小强干扰环境对语音识别形成的影响,该部分交给张亚娟负责。第二部分为语音识别,目前借助科大讯飞完成了初步的语音转文字工作,后期可能需要加入声纹识别,该部分目前马天宇负责。这一部分内容偏工程和基础,根据新的方案无法形成亮点。第三部分为本任务的亮点,即自然语言理解,需要从语音文本中理解指令。针对本次特定应用,该部分至少需要分为词干提取、word2vec、语义组合三部分,重点内容为同义词等识别。 c) 摇荡。本周并未取得明显进展,和晓晴微信上简单讨论了一次小波分解问题,没有结果。 2 雷达项目: 目前该项目接近节点考核,本周工作内容主要针对多目标分析。周一查找相关资料,并阅读西电电子科技大学的硕士论文,虽然梳理了思路,但并未发现十分有用的内容。周二蒋培培提供了matlab中关于自动驾驶部分的示例,该例程中包括了原来代码中未见到的恒虚警检测等内容,而且提供了相角识别和轨迹描述,更符合我们的目标。目前该代码在matlab上已经跑通,蒋培培正在开展代码理解和提取工作。 另外,本周针对目标识别问题专门向史老师请教了一次,梳理了一些疑问,比如分辨率问题和加窗问题,同时也关注到雨天等影响电磁波传播情况下的问题处理。下次再整理一些继续请教。 关于道路分析问题本周未能有专门时间思考。 3 索道项目: 本周没能拿出专门时间跟进索道项目,指导孙浩如何与对方合作,希望能尽快多方位成长吧。 4. FPGA项目: a) 处理对外合同与付款。由于学校处于没有法人的特定时期,与财务部分多方联系确认了付款的合法性,并成功付款。 b) 重新梳理了5G项目需求,并安排撰写测试大纲,以防被突然袭击。 5. 研三: 本周安排集中看了一轮PPT,整体来看没有大的跑偏同时也不出彩,想顺利通过还需努力。 6. 审稿: 为知识发现年会审稿4篇。其中一篇利用复杂关系网络进行癌症基因分析的论文比较吸引我,其结论与属性拓扑的概念结构十分类似。可惜目前没有那么多的时间来深入研究了。 7. GNN学习: 本周主要针对图网络基本思路做了一次学习(https://www.bilibili.com/video/av37250492/?spm_id_from=333.788.videocard.1)。这个视频讲解比较清楚,推荐所有同学看一下。具体学习心得在周五组会上说过,再次不多啰嗦了。 8. 中医: 本周又一家中医机构联系希望我去做顾问,但对于中医资历尚浅,仅仅是和对方聊了一下,并不打算更深层合作。 ...
Read More

2019.4.14孙浩周报

0405-0408 1.将原来数据、语音两套系统合二为一 进行逻辑调整。 2.做了音频文件选择及选用com组件中windows media player类进行播放测试功能。(与广播独立) 目前功能:多种音频文件选择和本地播放,暂停播放及恢复播放,自动下一首播放以及循环播放 客户端: 0409 1.学习客户端调用系统电量状态,进行发包测试 2.VR接口第二版说明书 0410 1.与VR进行交谈,约定0411带实验室看系统流程以及数据打包和解析 2.交谈过程中,告知VR方需添加什么界面 可见“新需求20190410(1).docx” 3.系统将客户端来的数据整合打包转发VR一份,像接近,坠落,姿态报警等信息,由socket进行异常信息传输。 4.关于语音方面,为了避免监控系统的负荷以及健康性,暂定通话以及语音由VR直接与客户端进行通信,不在利用系统进行中转和判断。 5.将姿态角的计算放到客户端来做,减轻服务器压力。 6.改变打包规则,新加三个float型状态,一个int型状态,数据包大小变为65字节。 0411 1.于501A与杜全工程师对数据交互进一步交流,目前需要确定VR系统也作为一个客户端,监控系统收到数据,整理后转发给VR系统。 2.根据之前数据做一份满足现在字节要求的数据,交付杜全工程师进行验证数据是否可用,以及VR系统验证将数据拆分是否可行。 3.将姿态预警放到客户端来做,缓解服务器压力,这样在服务器管理者模式中添加不了姿态阈值的判断。 0412 1.debug:电量传递过程中,context参数从主界面获取不到,将DEVICEDATA中构造函数修改 传递context值获取主界面上的电量值。 0414 1.修改项目计划书 确定vr任务和性能指标。 ...
Read More

2019.4.14薛在发周报

1.修改论文,第一阶段是在原论文基础上删删减减,总是有原论文的影子在,第二阶段是把深度学习作为重要标签,将两种神经网络RNN和LSTM对比就有一定的意义。在做实验时,调整RNN的参数,与LSTM相比,会出现耗时多但精度高和耗时少但精度低两种情况。所以调整参数时怎么调是个问题,是根据经验调还是通过算法算,有最佳参数吗,需要调出最佳参数吗 2.组会上一个重点是强调意识和态度问题,平时效率低下或者方向感不足可能都源于这两个问题。学校环境和公司不一样,怎么在学校里提高做事效率也是值得思考的问题。大家推荐的书也看了一些,数学之美里出现最多的一句话是用数学将复杂问题简单化,这可能是数学美的体现之一吧。 ...
Read More

4.13周报马天宇

1.初步开展了老师交代的构建语音识别系统的任务,拟采用科大讯飞的成型语音识别技术。 2.一开始我Linux虚拟机使用的是32位的Fedora14系统,glibc版本过低导致SDK运行失败,按网上教程安装glibc2.20仍失败。已浪费太多时间,故放弃此系统,转投64位Ubuntu。 3.使用乌班图系统比较顺畅,只遇到一些诸如主机与虚拟机间的复制粘贴、chmod修改文件夹权限之类的小问题,解决后运行SDK成功,得到初步结果。 4.然而,本周工作中最大的难点来了——运行成功后的第二天,我再次测试的时候显示错误“找不到.so文件”,明明与昨天相比没做任何改动,库文件的路径也定义准确。百思不得其解中,查阅多方平台,最终在简书上找到了问题所在——库文件路径的定义是在一个“64-bit_make.sh”文件中的,要想成功读取路径,必须在每次重启虚拟机后重新编译一次该.sh文件。故问题解决。 5.当前代码的局限性在于:并非使用者实时用麦克风进行语音输入,而是使用固定的已经录制好的pcm文件作为音源,也就是说目前只能识别科大讯飞官方已经录制好的两段语音。我用FFmpeg尝试了一下自主录音,发现可以成功录取.wav格式的音频。我下阶段的工作可能集中在:将录好的音频转为pcm格式进而在程序中加以识别。 ...
Read More

2019.4.8周报蒋培培

1.雷达方面,主要做的是多目标检测相关实验,前期做的主要是如何区分多个目标,多个目标回波明显有延拓现象,如果目标的速度距离相近,则延拓十分严重,无法区分。后期加入了加权思想,在老师的建议下,再后来又加了窗。目前测试最多的为10个目标,可以检测出来。多目标峰值检测,目前没找到相关资料,自己根据自己的想法,写了个检测方法,针对目前的情况还没出问题,后期需要验证。 2.论文投出,下一步打算写帕金森的小论文。 ...
Read More

2019.04.08周报-荣美

这周没干啥,帮着师姐改大论文,整合了一下减量式的论文,因为是和梦奇师姐两个人翻译的,还需要溜一遍整篇文章的专业名词解释的一样不一样,还需要过一遍,然后就是查到GCN不能用于同秩图(这个称呼可能不太专业),于老师的那个听老师顺了一遍,但之后自己想怎么办还是没思路。。。 ...
Read More

薛在发周报2019.4.8

1.整理准备投出的论文,因论文格式没有明确的要求,主要靠师兄的经验在修改整理。 2.程序跑通,出图,整体一句句读了代码 3.去图书馆看到一本用道家思想编写的全栈的书,大略看了一下,觉得很有意思,实际东西没学到多少,看了一些道理。 ...
Read More

郑晓晴周报2019.4.7

1.小波滑窗问题用matlab的一个函数解决了,本来以为要学习matlab比较麻烦,没想到很快程序就跑通了,果然语言还是有很多共通之处。 2.小波+lstm预测目前有三种方案,第一种,将原始序列三层分解,训练一个低频三个高频四个模型。第二种,将分解得到的高频信号整合,训练一个低频一个高频两个模型。第三种,小波包分解,把每次分解的低频高频数据都进行分解,三层分解需要训练八个模型。目前实验结果,三种方法预测纵摇的RMSE都为0.14左右,不如只用lstm预测的0.06左右。 3.开始写预测演示系统的软著。 ...
Read More