基于条件随机森林的非约束环境自然笑脸检测
引用本文
罗珍珍, 陈靓影, 刘乐元, 张坤. 基于条件随机森林的非约束环境自然笑脸检测. 自动化学报, 2018, 44(4): 696-706. doi: 10.16383/j.aas.2017.c160439
LUO Zhen-Zhen, CHEN Jing-Ying, LIU Le-Yuan, ZHANG Kun. Conditional Random Forests for Spontaneous Smile Detection in Unconstrained Environment. ACTA AUTOMATICA SINICA, 2018, 44(4): 696-706. doi: 10.16383/j.aas.2017.c160439
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2017.c160439
关键词
笑脸检测,条件随机森林,头部姿态估计,K-Means聚类
摘要
为减少非约束环境下头部姿态多样性对笑脸检测带来的不利影响,提出一种基于条件随机森林(Conditional random forests,CRF)的笑脸检测方法.首先,以头部姿态作为隐含条件划分数据空间,构建基于条件随机森林的笑脸分类器;其次,以K-Means聚类方法确定条件随机森林分类器的分类边界;最后,分别从嘴巴区域和眉眼区域采集图像子块训练两组条件随机森林构成层级式结构进行笑脸检测.本文的笑脸检测方法在GENKI-4K、LFW和自备课堂场景(CCNU-Classroom)数据集上分别取得了91.14%,90.73%和85.17%的正确率,优于现有基于支持向量机、AdaBoost和随机森林的笑脸检测方法.
文章导读
笑脸是人类最常见的面部表情之一, 反映了人的心理状态, 传递着丰富的情感和意向信息.笑脸检测在用户体验感知[1]、学生心理状态分析[2]、照片增强处理[3]、相机微笑快门[4]等领域有广泛的应用.近年来, 国内外的学者在笑脸检测方面开展了大量的研究工作[5-6].随着研究的深入和实际应用要求的提高, 笑脸检测的研究热点逐步从约束环境转移到非约束环境[7].非约束环境(Unconstrained environment)是指主体意识想法和行为不受规定约束的环境.在非约束环境下, 人的头部姿态、环境光照、背景以及图像分辨率等环境因素不受约束.由于这些不利环境因素的影响, 约束环境下的笑脸检测算法通常不能在非约束环境下保持良好的正确率.非约束环境下的笑脸检测在计算机视觉领域仍然是一项富有挑战性的工作[5-6].
依据特征采样方式的不同, 可将现有笑脸检测算法粗略分为基于面部运动单元(Action
units, AUs)的方法[7-13]和基于内容(non-AUs)的方法[4,
基于内容的方法通常不再分析面部运动单元, 而是在对人脸进行对齐(Face
registration)后, 直接从人脸提取特征并通过机器学习方法建立图像到笑脸表情的映射.
Shimada等[14]在提取局部强度直方图(Local intensity histogram, LIH)和中心对称局部二值模式(Center-symmetric local
binary pattern, CS-LBP)两种特征后, 采用层级式支持向量机(Support vector machine,
SVM)进行笑脸分类.该方法对高分辨率正脸图像具备良好的检测效果和效率,
但没有考虑头部姿态变化的情况.
Whitehill等[4]从互联网上收集了头部水平偏向角为−20
在任意头部姿态下进行笑脸检测主要面临两方面的困难: 1)当前缺少任意头部姿态下的自然笑脸数据集; 2)当头部姿态变化范围较大时人脸对齐较为困难, 巨大的类内差异会导致难以设计高正确率和高效率的分类器[4].为更好地在任意头部姿态、低分辨率图像上实现自然笑脸的检测, 本文对LFW数据集[24]做了头部姿态和笑脸的标注, 采集了自然课堂场景下的CCNU-Classroom数据集, 并给出一种基于条件随机森林的自然笑脸检测方法.本文的主要贡献: 1)以头部姿态作为隐含条件, 提出了基于条件随机森林的笑脸检测方法, 降低了非约束环境下头部姿态对笑脸检测带来的不利影响. 2)在使用随机森林建构笑脸分类器时, 给出了一种基于K-Means聚类的决策边界确定方法, 提高了笑脸分类器的准确率. 3)由分别从嘴巴区域和眉眼区域训练的条件随机森林组成层级式检测器, 提高了笑脸检测的准确率.

图

图

图
本文提出一种基于条件随机森林的自然笑脸检测方法.以头部姿态作为隐含条件划分数据空间, 构建了基于条件随机森林的笑脸检测模型, 降低了数据的内类差异, 因此有效抑制了非约束环境下头部姿态多样性对笑脸检测带来的不利影响.提出了一种基于K-Means的分类边界决策方法.相比随机森林算法常用的平均值法或多高斯法等投票方法, 基于K-Means的分类边界法考虑了数据在决策空间的分布, 因此具备更高的笑脸分类准确率.同时, 分别从嘴巴区域和眉眼区域采集图像子块训练两组条件随机森林构成层级式结构进行笑脸检测, 提高了准确率.实验结果表明, 本文方法对非约束环境下的自然笑脸检测具备较好的准确性和鲁棒性.在未来的工作中, 将尝试结合基于AUs的方法来自动选取对笑脸检测最有效的区域, 以进一步提高笑脸检测的准确率.
作者简介
罗珍珍
华中师范大学国家数字化学习工程技术研究中心博士研究生.主要研究方向为计算机视觉, 模式识别, 图像处理.E-mail:andrealoves@163.com
陈靓影
华中师范大学国家数字化学习工程技术研究中心教授.主要研究方向为计算机视觉, 模式识别, 多模态人机交互.E-mail:chenjy@mail.ccnu.edu.cn
张坤
华中师范大学国家数字化学习工程技术研究中心讲师.主要研究方向为计算机视觉, 模式识别, 多模态人机交互.E-mail:zhk@mail.ccnu.edu.cn
刘乐元
华中师范大学国家数字化学习工程技术研究中心讲师.主要研究方向为计算机视觉, 模式识别, 多模态人机交互.本文通信作者.E-mail:lyliu@mail.ccnu.edu.cn

加载中…