基于内唇轮廓标定的唇印提取算法(唇印设计)
moboyou 2025-04-30 11:33 10 浏览
摘要:针对现有特征唇印提取中信息处理量较大、识别率不高等问题,本文提出了基于内唇轮廓的特征唇印提取算法。算法首先在基元图像上对内唇轮廓特征点进行标定,建立基元唇印模型,然后通过均值计算构造普通模型,并利用Gabor变换对基元唇印和普通模型进行联合特征信息提取,最后通过相似度对比选择出特征唇印,以实现身份识别。仿真实验验证,本文的特征唇印提取算法在较低时空消耗下,具有较高的识别率,具有有效性和可用性。
0引言
特征唇印的提取是动态唇形身份识别技术中的核心环节,主要分为基于像素、基于模型以及混合型三类特征提取算法。基于像素的特征提取是直接对唇部的灰度图像进行特征提取。如文献[1]采用主成分分析法对唇部的灰度图像进行特征提取,虽然算法对唇部的灰度图像的质量要求较低,但易受其他因素的影响致使识别率有所差异。基于模型的特征提取通过对唇部建立相应的模型,以模型参数作为特征信息。文献[2]将自适应的均值模板引入到ASM中,虽然对唇部轮廓有更强的描述能力,但算法复杂,实用性较差。混合型的唇印提取算法结合了上述两种算法的优点。文献[3]采用AAM(Active Appearance Model)来提取特征,算法将轮廓模型与主成分分析法相结合,具有较好的效果,但过程较复杂。文献[4]提出了基于唇色滤波器的嘴唇特征提取, 适用于口型识别的实时唇定位。文献[5]运用DCT+LDA 的方法提取唇读视觉特征,但现有特征唇印提取中信息处理量较大、识别率不高。针对嘴唇的外沿变化不是特别明显、需要对大量数据进行验证和概括的问题,本文采用模型点和Gabor变换相融合的唇印提取算法,利用内唇轮廓上关键点建立唇印模型,利用Gabor变换进行特征提取,算法在一定程度上降低了复杂度,同时具有较高的特征表征能力。
1特征唇印提取模型及相关规定
11提取模型的相关规定
(1)为了便于叙述,设{a;o;i;u;sh;z}为关键基元,这6个声、韵母充分涵盖了说话人的唇型特征。
(2)对每个关键基元进行图像标定特征点、边,构造不同关键基元的唇部模型,称为基元唇印。
(3)对所有基元唇印进行多次训练,对标定的特征点、边取平均值计算得唇部均值模型,称为普通模型。
(4)将以身份识别的唇动特征模型称为特征唇印。
12特征唇印的提取模型
特征唇印的提取主要由基元唇印建立、普通模型构造、特征唇印选择等几个阶段组成。
(1)基元唇印的建立:从待识别的基元图像中选出一幅尚未提取特征的图像,对其内唇轮廓进行特征点标定,得到特征点的坐标及欧氏距离;(2)普通模型的构造:在基元唇印库中随机选择一定数量的基元唇印作为训练集,并根据基元类型分类,对每一类每个特征点求取平均坐标,构造六组普通模型;(3)特征唇印选择:将讲话人的六个基元唇印及六组普通模型对应起来,然后利用Gabor变换进行特征点抽取,计算相似度,选择相似度最小的作为特征唇印。流程如图1所示。
2基于内唇轮廓的特征唇印提取算法
内唇特征提取算法需要经过基元唇印建立和普通模型构造两个子过程。
21基元唇印算法
基元唇印的建立是特征唇印提取的前提,算法通过对嘴部图像集进行操作得到基元唇印库和6个基元唇印。基元唇印(Primitives Lipstick(P))算法流程如下图2所示。
设每个讲话人6个基元唇印相应嘴部图像集为P={Pi|P1,P2,P3…Pi},每个Pi中标定9个特征点,分别是左右嘴角各1个,内唇上沿3个,内唇下沿4个,从左嘴角起顺时针标定,从而得到Pi的特征点集T={Tj| 1≤j≤9}。然后计算特征点之间的欧氏距离,这里规定从Pi的特征点集中选择编号相邻的特征点,连接为特征边,设Dmn为Tm、Tn间欧氏距离。
22普通模型构造
普通模型在一定程度上反映了基元唇印库中的平均唇形,是内唇特征提取的基础环节。流程为:首先随机选择N个基元唇印作为训练集TtrainingSet={TSi| 1≤i≤N};然后根据{a;o;i;u;sh;z}对训练集TtrainingSet进行分类得到六个集合Ki={TSj| 1≤j≤Ni};再者根据公式(1)和(2)分别求出第i类集合Ni个基元唇印特征点的坐标平均值Xij和Yij。
普通模型构造(AverageMouth(TtrainingSet))算法流程图如图3所示。
23内唇特征唇印提取
在基元唇印建立和普通模型构造两个子过程的基础上,构造内唇特征唇印提取算法。
首先根据基元唇印算法建立讲话人的6个基元唇印;然后在基元唇印库中随机选择N个基元唇印作为训练集,接着利用式(3)对6个基元唇印以及训练集的6个普通模型的9个特征点进行5个频位、8个相位的Gabor分解变换,得到特征点的特征向量[6]。
Cj=Ajexp(iφj)(1≤j≤40)(3)
其中Cj为卷积结果,Aj为幅值,φj为相位。
设J为基元唇印第i个特征点的Gabor变换系数集合{Cj|(1≤j≤40)},J′为对应的普通模型第i个特征点的Gabor变换系数集合{Jj|(1≤j≤40)},Si为J与J’之间的相似度值,Aj和Aj ′分别为J、J′的幅值,利用角度无关的相似度计算公式(4)可得每个特征点的相似度。
计算9个特征点相似度的平均值,以sk作为基元对应的基元唇印与普通模型之间的相似度。
相似度越小表明识别率越高,对sk进行排序,选择相似度最小的基元唇印作为特征唇印。
根据以上思想并结合基元唇印和普通模型算法,可设计出完整的内唇特征唇印提取算法Lipstick Extract (K, P),算法的流程如图4所示。
3仿真验证
为了验证本算法的可行性,利用MATLAB进行仿真实验,实验选取32个不同讲话人拼读6个关键基元的视频帧,每个讲话人对应6个关键基元。
31特征点标定
本文选用内唇轮廓线上的9个特征点标定模型特征,如图5所示的9特征点B,用点c捕获[a]、[o]发音过程中嘴唇的高度,用a、e两点捕获[o] 、[u]发音时嘴角位置,用b、d两点捕获嘴唇在发[o]、[u]、[sh]等音时的形变,用f、g、h、i四点来反映嘴唇上下开合时的距离及[i]、[sh]、[z]发音时唇部特征。
32与普通模型间的相似度水平
将文献[7]、文献[8]以及本算法所构造的基元唇印与普通模型间相似度均值进行比对,从图6中可看出,由于特征点比文献[7]减少了将近一半,本算法平均相似度值略高于文献[7],但与文献[8]相比,具有较低的相似度,说明本算法的捕获信息的能力更强。
33时间效率
针对时间效率,将本文算法与文献[7]、文献[8]以及不提取特征唇印直接进行识别的文献[9]算法进行比对,时间效率比对结果如表1。
从表1可以看出,本算法在身份识别中时间耗费最小,有更好的时间性能,虽然文献[9]节省了提取特征唇印所耗费的时间,但在整个识别过程中耗费时间较多。
34识别率
针对识别率,将本算法与文献[7]、文献[8]以及文献[9]算法进行了对比,结果如表2所示。
从表2中可知,本算法的识别率仅略低于文献[7],但拒识率最低。说明本算法能够在较低时空消耗下,保证较高的识别率。表2不同算法的识别率对比本文算法文献[7]文献[8]文献[9]识别率/%7885798272246385拒识率/%08311178
4结论
针对现有特征唇印提取中信息处理量较大、识别率不高等问题,本文提出了基于内唇轮廓的特征唇印提取算法,算法首先在基元图像上对内唇轮廓特征点进行标定,建立基元唇印模型,然后通过均值计算构造普通模型,并利用Gabor变换对基元唇印和普通模型联合特征信息提取,最后通过相似度对比选择出特征唇印,最终实现身份识别。仿真实验验证本文所提出的算法不仅耗时低,还具有较高的识别率。
参考文献
[1] Yang Jian,ZHANG D, Yang Jingyu. Constructing PCA baseline algorithms to rreevaluate ICAbased facerecognition performance[J]. IEEE Transactions on Systems,Man and Cybernetics,2007,37(4):1015-1021.
[2] KIM H C, KIM H J, HWANG W,et al.Facial feature point extraction using the adaptive mean shape in active shape model[C].Computer Vision/Computer Graphics Collaboration Techniques, France, 2007: 421-429.
[3] KATSAMANIS A, PAPANDREOU G, MARAGOS P. Face active appearance modeling and speech acoustic information to recover articulation[J],IEEE Tr.on Acoustics,Speech and Lang,2009,17(3):411-422.
[4] 姚鸿勋,高文,李静梅.用于口型识别的实时唇定位方法[J],软件学报,2000,11(8):1126-1132.
[5] NEFTAN A V, Liang Luhong, Liu Xiaoxing, et al. A coupled HMM for audio-visual speech recognition[C]. International Confzerence on Acoustics Speech and Signal Processing,2002,5(2):2013-2016.
[6] WISKOTT L,FELLOWS J M, N KRUK ger,et al.Face recognition by elastic bunch graph matching[J].IEEE Trans on Patern.Anal Mach Intell, 1997(19): 775-779.
[7] TIDDEMAN B, PERRETT D.Prototyping and transforming visemes for animated speech[C].IN Proceedings of Computer Animation,Geneva,Switzer-land,2002:248-251.
[8] Meng Yingjie, Li Zhaoxia,Hu Yingjie, et al. Speaker identification based on feature mouth shapes [J]. Journal of Information and Computational Science,2009(6): 1209-1216.
[9] POTAMIANOS G, Graf H. P, COSATTO E. An image transform approach for HMM based aotumatic lipreading [C]. Proceeding of the International Conference on Image Processing,Chicagao,1998(3):173-177.
相关推荐
- 声学EI要完稿?十步速写法
-
【推荐会议】国际声学与振动会议(ICAV)会议号:CFP23112A截稿时间:2025年4月20日召开时间/地点:2025年8月15-17日·新加坡论文集上线:会后3个月提交EiComp...
- 结构力学!EI会议图表规范秘籍
-
推荐会议:国际结构与材料工程进展大会(ISME2026)会议编号:EI#73521截稿时间:2026年3月10日召开时间/地点:2026年8月15-17日·德国柏林论文集上线:会后4...
- 傅里叶级数物理意义的直观理解:利用傅里叶级数逼近方波信号
-
上篇文章将向大家介绍频谱的概念,对傅里叶级数、傅里叶积分、傅里叶变换进行了数学的推导,并解释了它们各自的物理意义。推导过程见我的上一篇文章:频谱分析——频谱概念(傅里叶变换、级数、积分及物理意义)如下...
- 通过对航空发动机整机振动进行分析,有何控制方法?
-
前言针对航空发动机整机振动问题的复杂性和多样性,以整机振动的振源分析为出发点,总结国内外关于转子系统故障、气流激振、轴承故障、齿轮故障和结构局部共振等引起的整机振动的研究情况。结合航空发动机整机结构动...
- MATLIB中使用PCA
-
主成分分析PCA(PrincipalComponentsAnalysis),奇异值分解SVD(Singularvaluedecomposition)是两种常用的降维方法降维致力于解决三类问题:降维...
- 数据处理|软件:让科研更简单2
-
书接上回,继续介绍免费的数据处理软件。eGPS一款热图绘制专用软件,热图就是用颜色代表数字,让数据呈现更直观,对比更明显。优点:小巧方便,基本功能齐全,包括数据转换、聚类分析、颜色调整等等缺点:常见的...
- 电力系统常用的通讯协议及其在Speedgoat系统中的实现
-
在电力系统中,IEC61850协议、DNP3协议、ModbusTCP广泛应用于远程终端设备(RTU)、智能电子设备(IED)交互以及监控和数据采集(SCADA)系统。一、IEC61850协议IE...
- 电子工程师的常用仿真软件
-
不知道从事电子行业的工程师,有没有使用模拟仿真工具,仿真软件网上又有很多,初学者,可能只知道Multisim和Proteus。一般Multisim适合在学习模拟电路和电路分析原理课程时使用,便于理解电...
- 技术论文|异结构混沌系统的组合同步控制及电路实现
-
欢迎引用[1]李贤丽,马赛,樊争先,王壮,马文峥,于婷婷.异结构混沌系统的组合同步控制及电路实现[J].自动化与仪器仪表,2022,No.276(10):80-84.DOI:10.14016/j.cn...
- 现场︱某110KV主变事故过程仿真分析
-
三峡电力职业学院、河南省电力公司洛阳供电公司的研究人员李莉、任幼逢、徐金雄、王磊,在2016年第6期《电气技术》杂志上撰文,针对某110KV变电站主变差动保护跳闸事故,结合事故相关检测数据,通过MAT...
- 光伏发电系统篇:单级式并网系统实时仿真
-
在全球积极推动清洁能源转型的大背景下,光伏发电作为重要的可再生能源利用方式,得到了广泛关注和迅猛发展。目前常用的光伏并网及光伏电站主要拓扑结构有单级式和双级式。相较于传统的多级式系统,单级式光伏发电并...
- 光伏发电系统篇:三电平并网逆变器实时仿真
-
一、三电平并网逆变器在能源转型加速的当下,分布式能源接入电网需求大增。三电平并网逆变器凭借低谐波、高功率密度等优势,有效提升电能转换效率,于新能源并网发电中担当关键角色。常见的三电平电路拓扑结构包括二...
- 自制3.5KW大功率逆变器,很简单,看过这个电路原理就懂了
-
前言拿下8000元奖金的项目,是什么水平?本项目经过联合湖南科技大学光伏逆变以及电力电子研究生团队共同探讨方案。项目成本:1200元,获得奖金:8000元!参加赛事:立创开源硬件平台_星火计划·外包赛...
- 圈内分享:电容式加速度计接口电路非线性建模与仿真设计
-
摘要:非线性是Sigma-Delta(ΣΔ)加速度计系统的关键指标之一。基于一个五阶ΣΔ加速度计结构,分析了其主要的非线性模块,在MATLAB中建立了整体结构的行为级模型,并利用根轨迹法进行了稳...
- 基于Matlab/Simulink建立一种Thevenin/RC电池模块仿真模型
-
本文以锂电池数学模型为基础,在Matlab/Simulink的仿真系统中,建立了一种Thevenin/RC电池模块仿真模型,通过实际工况试验,测试精度在允许误差范围内,为电池SOC/SOH研究提供了极...
- 一周热门
- 最近发表
- 标签列表
-
- curseforge官网网址 (16)
- 外键约束 oracle (36)
- oracle的row number (32)
- 唯一索引 oracle (34)
- oracle in 表变量 (28)
- oracle导出dmp导出 (28)
- oracle 数据导出导入 (16)
- oracle两个表 (20)
- oracle 数据库 使用 (12)
- 启动oracle的监听服务 (13)
- oracle 数据库 字符集 (20)
- powerdesigner oracle (13)
- oracle修改端口 (15)
- 左连接 oracle (15)
- oracle 标准版 (13)
- oracle 转义字符 (14)
- asp 连接 oracle (12)
- oracle安装补丁 (19)
- matlab三维图 (12)
- matlab归一化 (16)
- matlab求解方程 (13)
- matlab坐标轴刻度设置 (12)
- matlab脚本 (14)
- matlab多项式拟合 (13)
- matlab阶跃函数 (14)