本文章是由来自某985在校研究生Coder_W同学投稿在我们《读者也是作者》专栏,在此非常感谢你对“计算机视觉战队”平台的支持,希望今天的分享可以给大家带来一些帮助,也希望更多的读者在本专栏分享更多的知识和感想,谢谢!
这次主要分享一个比较热门的话题,但是使用的传统方法的人脸检测,并且是在遮挡情况下的人脸检测,希望可以给大家带来一些帮助,谢谢!
文章参考:Efficient Detection of Occlusion prior to Robust Face Recognition
主要内容:
在现实生活中,人脸会有部分遮挡(例如眼镜和围巾)的情况,在这种情况下的遮挡,会给人脸检测带来一定的困扰。所以,有提出一个有效的识别方法,由以下三个部分组成。
- 遮挡检测部分。首先将给定图像分割为上下两个相等块,进行不同尺度和方向的Gabor小波变换产生特征,使用PCA降维后并用SVM对图像进行分类,判断图像的是否遮挡以及遮挡类型。
- 遮挡分割。对于第一步检测到的遮挡,利用马尔科夫随机场增强其结构信息,并产生一个二进制掩膜(遮挡像素为1,非遮挡为0)。
- 提取图像的局部Gabor二进制模型直方图序列(LGBPHS)特征用于人脸识别。对给定图像精确检测遮挡后,对于分遮挡部分提取出LGBPHS特征。
Gabor小波特征提取
选择Gabor小波变换的原因:
因为其具有判别性强和计算性能好的优势。
其中,μ和γ分别表示Gabor核的方向和尺度。
本次选取μ∈[0,7],γ∈[0,4],八个方向四个尺度的Gabor小波变换,其余参数根据经验选择。
因为相位是随时间变化的,所以选择幅度值作为特征矢量。
Ω={Cμγ,μ∈[0,7],γ∈[0,4]},这里的Gabor变换不仅用于遮挡检测而且用于LGBPHS的计算。
基于马尔科夫随机场遮挡分割
从图中可以看出,上层图像为观察场,表示观察者用肉眼看到的图像,也就是实际的图像,那么下层图像为标签场,它是通过对观察场中不同区域赋予不同的标签得到的,所以图像分割问题变为图像标记问题。
假设像素点个数是M*N,平面像素点集合为:S={s1,s2,...,sm*n},观测数据为F,p(F)为观测场的概率分布。ω记为图像的标记场,ω={ωs1,...,ωsM*N},ωs∈∧={0,1,...,L-1}为类别总数,p(w)是先验概率满足MRF模型。P(F/w)是观察场F对于标记值w的条件概率,也就是说,表示的是特定标记像素包含的灰度概率分布,明显是属于高斯分布的。
达到最大值,这样表明对于每个像素都得到最适宜的标签,即标签场和观察场最大限度地符合,意味着分割完成,这就是后验概率最大估计(MAP)估计。
实验
人脸遮挡检测
数据集:AR库分别随机选取150张无遮挡人脸,150张围巾遮挡以及150张眼镜遮挡人脸训练SVM。用720张图片用于检测分类效果。
实验结果:
遮挡人脸识别
实验数据:AR库上选取80个人(男女各一半)的240张无遮挡人脸,每人三张图像分别为自然表情,微笑和生气。选取三种光照条件下240张围巾遮挡图像和眼镜遮挡图像。
预处理:原图像大小768*576,归一化为128*128,并将图像分为64个16*16块用来提取LGBPHS特征。
实验结果:
- 在面部表情为尖叫下实验结果
总结
这种在遮挡情况下精确检测的人脸识别框架,使用马尔科夫随机场模型精确定位遮挡位置,然后从非遮挡位置提取特征用于人脸识别。实验结果表明该框架的方法要优于其他传统方法。在未来研究研究方向上,在通常情况下的遮挡(包括眼镜,围巾也,胡须,长头发,戴帽子等)检测至关重要。
注:改文章已经共享在“计算机视觉战队”平台的《读者也是作者》专栏,如果有感谢的同学朋友,可以在该栏目里下载相关学习论文(有可能包含代码)。
作者介绍:
来自985高校的在读研究生,他不愿透露个人信息,但是他主要方向是目标检测。他希望通过本平台的《读者也是作者》共享栏目,将自己平时的积累,读后感,总结分享给其他人,在此向Coder_W表示感谢!在此,也希望更多的同学朋友来我们《读者也是作者》专栏,分享您们平时的小总结,小分析,小感想。谢谢!