VALSE论文速览第81期:图像拼接矩形化新基线
(2022-06-24 17:32:28)
标签:
it |
为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展,VALSE最新推出了《论文速览》栏目,将在每周发布一至两篇顶会顶刊论文的录制视频,对单个前沿工作进行细致讲解。本期VALSE论文速览选取了来自北京交通大学和电子科技大学的图像拼接矩形化方面的工作。该工作由林春雨教授指导,论文第一作者聂浪博士录制。
论文题目:Deep Rectangling for Image Stitching: A Learning Baseline
作者列表:聂浪 (北京交通大学),林春雨 (北京交通大学,通讯作者),廖康 (北京交通大学),刘帅成 (电子科技大学),赵耀 (北京交通大学)
B站观看网址:
https://www.bilibili.com/video/BV1cW4y1z7Q1/
论文摘要:
图像拼接提供了更大的FOV,但却带来了不规则的边界,不仅影响了视觉体验,也为下游任务带来了负面影响。为了解决这个问题,传统的图像矩形化方法致力于搜索初始mesh并优化目标mesh来找到矩形化的warp映射。但这种方法严重依赖于线段检测的性能,在一些具有丰富非线性结构的场景下 (如风景、人像)容易产生畸变。
在本文中,我们提出第一个图像矩形化的深度学习baseline来解决这些问题。具体来说,我们预先定义了一个规则的目标mesh,然后利用神经网络预测对应的初始mesh,将原来两阶段的传统矩形化pipeline简化为了一阶段的回归问题。为了预测得到更合适的warp映射,我们在网络中设计了残差渐进式的回归策略并提出了一个综合性的目标函数,同时鼓励边界矩形、mesh形状保持和内容自然。此外,我们构建了第一个包含了大量不规则边界和丰富场景的图像矩形化数据集。实验证明了所提出的方法在定量比较和定性评估上都远远优于传统算法。
论文信息:
[1]
论文链接:
[https://arxiv.org/abs/2203.03831]
代码链接:
[https://github.com/nie-lang/DeepRectangling]
视频讲者简介:
聂浪,北京交通大学2021级博士研究生。目前以第一作者发表论文5篇,含3篇IEEE Trans/ CCF A类论文。研究兴趣为计算机视觉,包括计算摄影学,全景图像理解等,详情可见个人主页:https://nie-lang.github.io。
特别鸣谢本次论文速览主要组织者:
月度轮值AC:赵文达 (大连理工大学)、任文琦 (中山大学)
季度责任AC:魏秀参 (南京理工大学)
活动参与方式
1、VALSE每周举行的Webinar活动依托B站直播平台进行,欢迎在B站搜索VALSE_Webinar关注我们!
直播地址:
https://live.bilibili.com/22300737;
历史视频观看地址:
https://space.bilibili.com/562085182/
2、VALSE Webinar活动通常每周三晚上20:00进行,但偶尔会因为讲者时区问题略有调整,为方便您参加活动,请关注VALSE微信公众号:valse_wechat
*注:申请加入VALSE QQ群时需验证姓名、单位和身份,缺一不可。入群后,请实名,姓名身份单位。身份:学校及科研单位人员T;企业研发I;博士D;硕士M。
3、VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。
4、您也可以通过访问VALSE主页:http://valser.org/