0
本文作者: 杨文 | 2017-08-09 22:09 | 专题:CVPR 2017 |
CVPR(国际计算机视觉与模式识别会议)是IEEE 举办的年度学术性会议,会议主要关注计算机视觉与模式识别等方面的技术内容。在各种学术会议统计中,CVPR 有着非常强的影响力和高排名。在美国夏威夷刚刚结束的CVPR 2017大会上,学术界和工业界都给予了极高的关注度,无论是收录的论文数和参会人数都刷新了CVPR 的历史纪录。
对于这样一场顶尖学术会议,广大没有机会出席活动现场的同学们除了阅读相关文章之外,还能如何更深度地了解CVPR 2017的学术成果呢?
8月12日下午,由雷锋网主办的“GAIR大讲堂CVPR 上海交大专场”将在上海交通大学正式开幕。作为雷锋网旗下高端学术分享品牌,GAIR 大讲堂将通过举办高频次的线下校园学术分享活动,实现学术专家、AI业者与学校同学们之间的深度交流。本次活动中,雷锋网特地邀请5位CVPR 2017的前方论文讲者,邀请他们讲解各自的论文,同时分享CVPR 的参会心得。相信5位学术青年原汁原味的分享,将会为大家带来关于CVPR 更生动的介绍。
主办方:雷锋网
合作单位:上海交通大学、AI研习社、阿里AI 实验室、AI MOOC 学院
指导单位:中国计算机学会(CCF)
合作媒体:AI科技评论
时间:8月12日下午2:00-6:30
地点:上海交通大学(闵行校区)电信三号楼200号报告厅
2:00-2:05 主办方介绍本次活动
2:05-2:15 校方领导致辞
2:15-2:55 MIT EECS系三年级博士生 吴佳俊
分享主题:用于从单张图像中重建三维物体的点云生成网络
A Point Set Generation Network for 3D Object Reconstruction from a Single Image
2:55-3:35 阿里巴巴人工智能实验室资深算法工程师 汪洋
分享主题:Contextual Attention-based Memory Networks for Scene Labeling
3:35-4:15 上海交通大学研究生 杨蕊
分享主题:Video Segmentation via Multiple Granularity Analysis
4:15-4:30 现场休息
4:30-5:10 上海交通大学研究生 林天威
分享主题:Single Shot Temporal Action Detection
5:10-5:50 上海交通大学博士生 王敏思
分享主题:Recurrent Modeling of Interaction Context for Collective Activity Recognition
5:50-6:20 现场统一提问问答
6:20 活动结束
吴佳俊,MIT EECS系三年级博士生,导师Bill Freeman教授和Josh Tenenbaum教授。 他的研究兴趣在于计算机视觉,机器学习,和计算认知科学的交叉。 在此之前,他于2014年在清华大学交叉信息院获得学士学位。 他曾在微软,Facebook和百度的研究实验室实习。
主题:A Point Set Generation Network for 3D Object Reconstruction from a Single Image(用于从单张图像中重建三维物体的点云生成网络)
分享内容:通过深层神经网络生成三维数据在学术界越来越受到关注。现存的大多数方法都采取常规的三位数据表示,例如三位体素或图像集合。在这篇CVPR文章里,作者试图从单张图像中直接生成三维点云坐标,并进行三维重建。作者针对问题设计了相应的神经网络架构,损失函数和学习范式。实验结果也证明了所提出的方法的良好性能。
汪洋,阿里巴巴人工智能实验室资深算法工程师。2014年毕业于电子科技大学电子工程学院,期间研究方向为信号与信息处理。同年加入阿里巴巴,先后从事数据挖掘、机器学习、计算机视觉等方面的工作,目前主要研究兴趣为目标检测与跟踪、语义分割以及深度网络压缩与加速等。
主题:Contextual Attention-based Memory Networks for Scene Labeling(上下文注意力机制记忆网络在场景标记中的应用)
分享内容:场景标注旨在解决的问题是预测图像每个像素所属的类别,实际上它可视为一个序列到序列的预测任务。因此,如何充分利用相关上下文信息是提高标注效果的关键所在。论文提出了一种Episodic CAMN方法,并在该方法的基础上定义了一种由全卷积神经网络(Fully Connected Network,FCN)和带有反馈连接的注意力机制记忆网络(Attention-based Memory Network with Feedback Connections)构成的统一框架来实现上下文信息的选择和调整。在PASCAL Context,SIFT Flow和PASCAL VOC 2011等场景标注数据集上进行一系列评测,取得了不错的效果。
杨蕊,上海交通大学研究生。
主题:Video Segmentation via Multiple Granularity Analysis(基于多粒度分析的视频分割)
分享内容:视频目标分割是指讲视频中的目标物体在每一帧中沿轮廓进行分割。采用一个多粒度框架可以通过从粗到细的方式对视频进行精准分割。视频分割可以被理解为一个时序上的超像素打标过程,在精准的视频跟踪技术的帮助下,时空上的多实例学习算法可以将超像素进行二分类,并紧接着用图割的方式在像素级别进行细化,最终实现准确的分割。
林天威,上海交通大学自动化系计算机视觉实验室的研一学生,导师为赵旭老师。主要关注计算机视觉,深度学习,视频分析等方向的工作,主要研究视频动作分析领域中的时序动作检测问题。
主题: Single Shot Temporal Action Detection(单镜头时序行为检测)
分享内容:时序行为检测是要在视频序列中确定动作发生的时间区间(包括开始时间与结束时间)以及动作的类别。与其关系紧密的一个领域是基于图像的物体检测(object detection),物体检测是检测物体在图像中的位置,包括长和宽两个维度,而时序行为检测则只需要确定时间维度上动作的位置。本论文投稿于ACM multimedia 2017
王敏思,上海交通大学博士生。
主题:Recurrent Modeling of Interaction Context for Collective Activity Recognition(通过对互动信息的递归建模来进行群体行为识别)
分享内容:群体行为识别旨在判断场景中整个人群的行为。群体行为通常包括多个层次的互动信息(Interaction Context),包括单个人的运动信息,局部群组内人与人的互动信息,以及局部组群与组群之间的互动信息。针对此现象,论文提出了一个基于多层次递归神经网络的群体行为识别算法,该算法在每个层次的互动信息建模中,使用LSTM节点,低级层次的信息会聚后作为高级层次的信息节点输入,主要分为person-level,group-level, scene-level三个不同层次的LSTM。最终通过多层次的LSTM结构,实现跨层次的群体行为识别。该方法在群体行为数据库Collective-Activity获得了目前很好的识别精度。
以上就是本次活动的简要介绍,想要近距离了解更多论文投稿细节,就快来报名参会吧。另外,本次活动全程免费,现场还有送书活动,奖品就是最近卖到脱销的《Deep Learning》一书。还等什么?扫描下方活动海报二维码即可报名参加,也可以点击活动链接报名。
往期活动直播回顾:http://www.mooc.ai/course/151/lesson/list
雷峰网原创文章,未经授权禁止转载。详情见转载须知。