VALSE论文速览第60期:ExploitingInvarianceofMiningFacialLandmarks
(2022-04-06 18:10:22)
标签:
it |
为了使得视觉与学习领域相关从业者快速及时地了解领域的最新发展动态和前沿技术进展,VALSE最新推出了《论文速览》栏目,将在每周发布一至两篇顶会顶刊论文的录制视频,对单个前沿工作进行细致讲解。本期VALSE论文速览选取了来自宁夏大学等高校的自监督人脸关键点挖掘的工作。该工作由刘昊教授指导,论文第一作者施江鸣同学录制。
论文题目:Exploiting Invariance of Mining Facial Landmarks
作者列表:施江鸣 (宁夏大学),高子贤 (宁夏大学),刘昊 (宁夏大学),于泽宽 (复旦大学),李风军 (宁夏大学)
B站观看网址:
https://www.bilibili.com/video/BV1G44y1K7im/
论文摘要:
人脸关键点检测旨在从人脸图像中精准地识别出关键点结构,其在人脸识别、人脸编辑、年龄估计等任务中有至关重要的作用。然而,目前多数方法都基于数据 (人脸、关键点样本对)均匀分布这一与现实不符的假设。同时,在充分的训练下,深度学习模型仍存在面对大姿态、遮挡脸样本时泛化能力有限的问题。本文试图通过探索关键点的结构不变性属性,来解决这些问题。针对上述问题,受条件变分编码器的启发 (Conditional Variational Autoencoder,CVAE),本文提出一种基于人脸关键点结构全局不变性的自监督方法,构建基于关键点结构分布的人脸图像,来学习决定关键点位置的本质因素。出于这一目标,本文的自监督框架分为三个模块,即检测模块、生成模块和重建模块。首先,通过生成模块的构建基于关键点数据分布的方法,更贴近真实的数据分布,在减轻数据偏差影响的同时,使数据扩增N2倍用于训练。其次,生成、重建模块提供了探索关键点结构不变性的可能,迫使模型专注于学习深层语义信息 (与传统方法不同)。最后,从信息论角度出发,设计了度量、约束各模块的自监督损失函数。
论文信息:
[1]
论文链接:
[https://dl.acm.org/doi/abs/10.1145/3474085.3475582]
视频讲者简介:
施江鸣,宁夏大学硕士研究生,研究方向为计算机视觉,目前专注于人脸对齐。
特别鸣谢本次论文速览主要组织者:
月度轮值AC:彭春蕾 (西安电子科技大学)、丁长兴 (华南理工大学)
季度责任AC:杨猛 (中山大学)
活动参与方式
1、VALSE每周举行的Webinar活动依托B站直播平台进行,欢迎在B站搜索VALSE_Webinar关注我们!
直播地址:
https://live.bilibili.com/22300737;
历史视频观看地址:
https://space.bilibili.com/562085182/
2、VALSE Webinar活动通常每周三晚上20:00进行,但偶尔会因为讲者时区问题略有调整,为方便您参加活动,请关注VALSE微信公众号:valse_wechat
*注:申请加入VALSE QQ群时需验证姓名、单位和身份,缺一不可。入群后,请实名,姓名身份单位。身份:学校及科研单位人员T;企业研发I;博士D;硕士M。
3、VALSE微信公众号一般会在每周四发布下一周Webinar报告的通知。
4、您也可以通过访问VALSE主页:http://valser.org/