雷锋网 AI 科技评论按:计算机视觉的顶级会议 CVPR 2017 已经开始了,AI 研究巨头 Facebook 今天也发出一篇博文介绍自己都将在本届 CVPR 中展现哪些成果。博文中主要内容编译如下。
Facebook 连接性实验室研究员 Ilke Demir、Ramesh Raskar 等人与 MIT 媒体实验室共同完成的论文「Robocodes: Towards Generative Street Addresses from Satellite Imagery」(用卫星图像生成街道地址的 Robocodes 系统)获得了本届 CVPR 的最佳 workshop 论文奖。这项研究会在 EarthVision Workshop 中展示,这个 workshop 关注的内容就是用于遥测感知图像的大规模计算机视觉。
这篇论文的主要内容是:随着全球地理空间内容的数量不断增长,地图的作用越来越重要。然而世界上仍然有高达70%的区域尚未详细绘制在地图中,而且也没有什么生成式的方法可以自动绘制这些未知区域。目前的方法都还依靠准确的路面几何特征,而论文中的新方法就解决了地理特征标识的语义问题,能够基于 5m x 5m 的网格为街道生成地址。
计算机视觉和遥测感知研究社区近期开始把注意力转向从卫星照片中学习重要特征。有许多研究成果以前看起来理论性很强,现在都可以用来对世界产生实实在在的影响。
“这个世界以及用于理解这个的技术正在从信号、文本、语音这样的单维度数据转变为多维度的,比如图像、视频和三维空间。计算机视觉技术就正在缩小这个真实的多维世界和我们个人的Facebook世界之间的距离。我们的研究就是为了让用户与世界之间的距离更小。”Facebook的博士后研究员 Ilke Demir 如此说道。“获得这项最佳论文奖也让我们更加坚信我们的系统完成以后可以为世界上的其它区域进行不重复的定位,尤其是在自然灾害高发区、地图上未绘制的地区这样的缺乏城市基础设施的地方。”
训练、部署人工智能模型经常需要和大规模数据中心甚至超级计算机联系起来,为了能够连续地处理、创建和优化模型,这样的资源往往是必须的,这样模型才有能力处理海量的图像、视频、文字和语音信息。如果想要在移动设备上部署这些模型,还要足够快、轻量,同样对许许多多的研究人员来说是个大麻烦。为了解决这些麻烦,Facebook 几个月前发布了 Caffe2,为以上的问题提供了一个鲁棒的、灵活的、可移动的深度学习框架。Caffe2的轻量、模块式的结构不仅大幅度提高了可移动性,而且还保持了同等的可拓展性和计算性能。
在此次 CVPR 中,Facebook 就会在7月24号下午5点到6点举行一个见面会,会上关注的主要内容是各方对于Caffe2的反馈。Facebook 同时还鼓励研究人员们运用 Caffe2 进行智能理解、构建智能系统的研究,并申请 Caffe2 研究奖(https://research.fb.com/programs/research-awards/proposals/caffe2-rfp/ )。大家的老熟人、Facebook 研发科学家贾杨清也说:“我们会一直致力于为人工智能研究社区提供高性能的机器学习工具,这样每个人都能够创建属于自己的智能应用和服务。”
让计算机理解图像中的东西是什么,然后把它和聊天机器人对话联系起来,这种任务对内容理解的要求达到了新的高度。在本届 CVPR 中,Facebook 的研究员们就会带来数篇这方面的论文。
另外,7月26日那天 Facebook 还会与乔治亚理工大学、弗吉尼亚理工大学一起主持一场视觉问题问答 Workshop (Visual Question Answering),到时会有很多对视觉问题问答感兴趣的专家共同分享他们眼中最优秀的方案、最佳的实验经历以及多模态人工智能的未来方向。
这个 workshop 的目的是带来第二版的视觉问题问答挑战赛,这个挑战赛基于的是 CVPR 2017论文「Making the V in VQA Matter: Elevating the Role of Image Understanding in Visual Question Answering」中提出的 VQA 数据集的2.0版本。这项比赛给基于 VQA 2.0版本数据集的算法提供了一个测试机会,并且要从中发现能够真正理解 VQA 数据集中的图像内容从而发挥出良好表现的最先进的算法。
Facebook 希望 CVPR 的参会者们到时候可以留意一下 Facebook 的研究人员和工程师们的最新成果,最好也能在 session 结束以后一起在展厅聊聊。
此次 CVPR 中 Facebook 将要展示的研究成果有如下这么多,感兴趣的读者可以具体关注一下。
Aggregated Residual Transformations for Deep Neural Networks
CLEVR: A Diagnostic Dataset for Compositional Language and Elementary Visual Reasoning
Densely Connected Convolutional Networks
Feature Pyramid Networks for Object Detection
Hard Mixtures of Experts for Large Scale Weakly Supervised Vision
Learning Features by Watching Objects Move
Link the Head to the “Beak”: Zero Shot Learning From Noisy Text Description at Part Precision
Relationship Proposal Networks
Robocodes: Towards Generative Street Addresses from Satellite Imagery
Semantic Amodal Segmentation
Visual Dialog
另外,雷锋网 AI 科技评论记者已经到达 CVPR 会场,并将全方位地报道此次 CVPR 大会。请继续关注雷锋网(公众号:雷锋网) AI 科技评论对近期各大学术会议的报道文章。
相关文章:
CVPR第一天前线速报:展台布置紧锣密鼓,tutorial和workshop紧凑而充实|CVPR 2017
本次CVPR上,李飞飞团队都中了哪8篇论文? | CVPR 2017本文作者:杨晓凡 本文转自雷锋网禁止二次转载,原文链接