科技通报

字典学习优化结合HMAX模型的鲁棒人脸识别

点击数:10    日期:2016-10-24 08:59:54

针对人脸识别中由于姿态、光照等变化而影响识别性能的问题,提出了字典学习优化结合HMAX模型的人脸识别方法
  

 摘 要: 针对人脸识别中由于姿态、光照等变化而影响识别性能的问题,提出了字典学习优化结合HMAX模型的人脸识别方法。首先,使用样本图像和从样本获得的仿射包模型联合表示一幅图像;然后,利用HMAX模型提取C2特征,并利用字典学习优化特征矩阵;最后,将视觉注意模型与原始模型的C2特征进行组合,并利用支持向量机完成分类。在Caltech和AR人脸数据库上的实验结果表明,相比其他几种较新的人脸识别方法,提出的方法取得了更好的识别性能,对人脸表情和光照变化具有鲁棒性。
关键词: 人脸识别; HMAX模型; 鲁棒性; 支持向量机(SVM); 字典学习优化
本文引用《现代电子技术
0 引 言
人类视觉系统可识别人脸,尽管光照、大小、位置、表情和视角有变化[1]。最近几年,人脸识别及其在生物特征识别、模式识别和计算机视觉上的应用成为研究的热点[2]。基于人脸识别发展的需求,最近关于人类视觉系统和视觉注意的大脑机制引起了很多关注[3]。
视觉系统划分为两个主要处理流[4]:背侧流(从主视觉皮层到顶叶皮层),其用于控制眼睛运动和视觉注意;腹侧流(从主视觉皮层朝颞叶,包括V1,V2,V4,后颞(PIT)和前颞(AIT)),其处理目标和人脸的细节。背侧和腹侧流并不完全独立,且在更高区域,例如前额叶皮层(PFC)和V4,通过相互影响连接交互[5]。
腹侧流皮层的部分比喻已经用于典型计算机视觉中的许多计算模型中,但是,大部分模型仅模仿腹侧流,而不考虑视觉注意和腹侧流区域之间的连接。因此,改进必须集成视觉注意模型和分层腹侧流模型[6]。这些模型中,基于特征组合的物体识别框架(HMAX)[7]是一种强大的计算模型,其建模视觉皮层中人类腹侧视觉流的目标识别机制。文献[8]中提出了具有学习能力的HMAX模型,增强了模型的性能。腹侧流HMAX模型的C2特征用于人脸识别和手写识别。近几年,开发出了各种腹侧流HMAX模型以增强该模型的效率,所有这些模型中,已有许多特征选择方法[9?11]。文献[9]提出了稀疏局部特征模型(SLF),是HMAX模型的扩展版本,该模型相比HMAX模型具有更好的性能,更加依赖视觉皮层。文献[10]提出了视觉注意的基本计算模型,是大部分新模型的基础模型,文献[11]提出了基于HMAX模型和频谱剩余方法的混合C2特征,增强了目标识别系统中HMAX模型的性能。上述方法在一定程度上改善了识别性能,然而,当姿态、光照、表情变化较大时,识别率却严重下降,且很难同时对姿态、光照、表情等具有鲁棒性[12]。
基于上述分析,本文提出了字典学习优化结合HMAX模型的人脸识别方法,创新点为:将HMAX模型提取的特征与原始C2特征进行组合,以通过视觉注意模型访问人脸图像显著点的关键位置,从这些区域提取有效C2特征进行鲁棒性人脸识别;提出的方法利用字典学习优化,可对HMAX模型提取的特征进行最优化,保留更多的有用信息。
1 人脸表示
使用样本图像和从样本获得的仿射包模型联合表示一幅图像,因为同时包括样本和结构信息,所以该联合表示更具鲁棒性。令[Xc=[x1,x2,…,xnc]]表示第[c]个图像集,其中,[xi]是第[i]幅图像的特征向量,类的仿射包估计为:
2 人脸学习
2.1 利用HMAX模型提取特征
C1特征模拟皮层的V1&V2区域中的复杂细胞,具有相同特征类型(方向)作为S1,这些特征集中附近的S1特征(具有相同方向),以实现较大局部区域上位置和尺度不变,其结果也可子采样S1,以减少特征数。C1特征的值是(方向)落在最大滤波器内的最大S1特征的值[8]。S1特征模拟视觉区域V4和后路推断时间(PIT)皮层,包含调整目标?部分的类RBF单元并计算输入C1块和存储的原型之间的距离函数。S2特征从随机位置具有各种[n×n]([n×n]=4[×]4,8[×]8,12[×]12和16[×]16)大小和四个方向的[K(P=1,2,…,K)]个块的训练集学习(因此,大小为[n×n]的块[P]包含[n×n][×]4个元素)。然后,S2特征扮演高斯RBF单元,计算输入模式[X]和存储的原型[P]之间的相似度分数(即欧氏距离):[f(X)=exp-X-P2(2σ2),]选择的[σ]与块大小成比例。C2特征模拟颞皮层(IT)并在整个视野执行最大运算,提供刺激的中间编码。因此,对于每幅人脸图像,计算C2的特征向量并用于人脸识别。这些特征具有鲁棒性,C2特征的长度等于从图像中提取的随机块数,平滑且具有尺度不变性。
2.2 非约束字典学习优化
得到最优[X∈RK×N]后,利用单独的优化程序对[D]的每个原子项进行优化,令[dj∈Rm]为[D]的第[j]原子项,定义[xj?∈R1×N]的行向量为[X]的第[j]行,将[X]和所有原子项固定,改写式(6),构建优化问题:
3 分 类
为了建模人脸识别系统,将HMAX提取的特征与原始模型C2特征合并,以增强用于人脸识别的C2特征,并使用支持向量机(SVM) [14]分类,完成人脸识别。本文提出的人脸识别方法框架,如图1所示。
提出的人脸识别方法的过程如下:
(1) 从数据库读取人脸图像并预处理;
(2) 对于每幅人脸图像,用式(8)整合颜色显著点、强度显著点和方向显著点,并选择[N]个注意点;
(3) 从每幅人脸图像创建S1和C1特征;
(4) 利用字典学习优化,获取最优特征矩阵;
4 实验评估
所有实验均在64位Matlab 2012实验环境下完成,计算机系统的配置为:英特尔酷睿2双核处理器,2.66 GHz主频和4 GB RAM。
4.1 人脸数据集
Caltech人脸数据集[15]包含450张人脸图像具有不同光照和表情的27个对象。实验使用18个人每人20幅图像(Caltech人脸数据集的360张人脸图像),随机选择每个人5张(90张人脸图像)作为训练样本,剩下的用于测试(270张人脸图像)。预处理方法中,图像裁剪为228×228的尺寸,然后全部调整为140×140尺寸的图像。图2所示为Caltech人脸库中某人的20种不同光照和表情下的人脸图像示例。
4.2 参数变化分析
首先对参数[γ]和[λ]对识别率的影响进行分析,维度设为220,原子项数设为7,[λ]分别取1,0.1,0.01,0.001,[γ]分别取1,2,3,4,5,结果如图4所示。
从图4可以看出,在[γ]和[λ]变化幅度很大的情况下,提出的方法可以一直保持较高的识别率,表明提出的方法识别率受参数变化影响很小,即提出的方法对人脸表情和光照变化具有鲁棒性。
4.3 识别结果比较
4.3.1 识别率比较
将提出的方法与文献[7],文献[10],文献[11]方法进行比较,原子项设为7,记录不同维度下各个方法的识别率,如图5所示。
从图6可以看出,随着原子项总数的变化,提出的方法可以保持最高的识别率,表明提出的方法建立的字典既具有代表性,又具有局部保持性。
4.3.2 执行时间比较
为了评估本文方法的效率,对其执行时间进行评估。以全部样本都用于训练时的执行时间为基准,在执行时间、速度提升倍数方面将提出的方法与其他几种方法进行对比,执行时间为字典学习和训练数据投影的时间之和,如表1所示。
5 结 论
本文提出了字典学习优化结合HMAX模型的人脸识别方法,利用字典学习优化,可对HMAX模型提取的特征进行最优化,可保留更多的有用信息。将HMAX模型提取的特征与原始C2特征进行组合,通过视觉注意模型访问人脸图像显著点的关键位置,从这些区域提取有效C2特征进行鲁棒性人脸识别。参数分析表明本文方法对光照和表情变化具有鲁棒性,不同原子项和不同维度下的识别结果表明,本文方法的识别率高于其他几种较新的人脸识别方法。此外,本文方法的执行时间也明显低于其他的方法,相比基准执行速度,最高可提升6.2倍。
未来会将本文方法应用于复杂和多样背景下的人脸识别。此外,本文方法只使用SVM分类器,未来会利用其他的分类器,如人工神经网络、模糊分类等,通过实验进一步改善识别性能。
参考文献
[1] 胡正平,李静.基于低秩子空间恢复的联合稀疏表示人脸识别算法[J].电子学报,2013,31(5):987?991.
[2] YANG A Y, ZHOU Z, BALASUBRAMANIAN A G, et al. Fast ?1?minimization algorithms for robust face recognition [J]. IEEE transactions on image processing, 2013, 22(8): 3234?3246.



王编辑
中联论文网编辑
刘编辑
中联论文网编辑
赵编辑
中联论文网编辑
孙编辑
中联论文网编辑
电话
18931176030
固话
0311-80693734
投稿邮箱
ttqikan@163.com
99期刊承诺发表不成功无条件退款!
客服系统