百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

SVD分解和离散小波域特征值量化的安全数字语音水印算法

moboyou 2025-05-04 15:27 31 浏览

摘 要:针对传统数字语言水印算法鲁棒性较差、复杂度较高等问题,提出一种基于SVD分解和离散小波域特征值量化的安全水印算法。该算法以离散小波变换的特征值量化为基础,利用离散小波变换将每帧数字语音转化到小波域,再利用SVD奇异值分解计算近似系数特征值,而不是细节系数部分;最后,使用量化后的特征值嵌入水印比特位信息。实验结果表明,当量化步长和所选帧长较高时,该算法能有效抵御过滤攻击、加性高斯白噪声攻击、重采样攻击和剪切攻击,其中高斯白噪声攻击和剪切攻击的误码率几乎为0。相比其他优秀算法,该算法具有更好的鲁棒性。

0 引言

近年来,社会上很多企业、组织和用户通过互联网对数字媒体进行传播,数字媒体的版权保护等安全问题已成为社会关注的焦点。而数字水印是保护和监控数字媒体的最好方法之一[1]。数字水印的思想是将水印信息直接嵌入到载体,同时不影响原载体的性能和使用价值[2],在版权保护、商标隐藏和通信安全等方面应用十分广泛[3]。如何在水印信息载入到载体后,保证载入后的宿主拥有尽可能多的原属性、扩大载入容量以及对外界攻击的鲁棒性是现代水印技术主要目标[4]

数字水印以图像水印和音频水印最为常见,本文讨论音频水印。音频水印可以分为变换域听觉屏蔽[5,6]、相位调制[7,8]和参数化建模[9,10]等主要类别。

文献[7-8]利用一帧储存所有的水印数据。在对数谱域的倒谱系数中嵌入水印信息,仅对不可听性具有一定鲁棒性。

参数化建模利用极点滤波器(如自回归模型)对语音信号进行建模及嵌入水印,有线性预测编码(Linear Predictive Coding,LPC)[9]或线谱对系数(Line Spectrum Pair,LSP)间接修改或量化参数[10]等算法。然而,该类算法容易受到在语音压缩期间或其后分流语音期间进行压缩攻击。

虽然利用离散小波变换和奇异值分解技术嵌入水印[11]并不是一个新的想法,但本文相比于其他文献有其独特之处,主要创新点如下:(1)本文的水印是嵌入在离散小波变换的近似系数中,而不是离散小波变换的细节系数。研究表明,将水印嵌入近似系数鲁棒性更强;(2)本文主要讨论的语音水印是一种盲算法,即这种算法在水印提取或水印检测过程中不需要原始信号,增大了容量,提高了隐蔽性;(3)本文音频水印的量化指数调制(Quantization Index Modulation,QIM)选择简单,所需运行时间更少。

1 分解技术

图1显示了单层离散小波变换(Discrete Wavelet Transformation,DWT)的一般过程,分别利用低通滤波器和高通滤波器将信号分解为近似系数(低频部分)和细节系数(高频部分),然后将其结果发给另一组低通滤波器和高通滤波器,作进一步分解。

奇异值分解作用于对角矩阵,以最优方式将信号分解为基本态。N×N的矩阵A奇异值分解如式(1)和式(2)。矩阵S的对角线元素是矩阵A的奇异值,按照σ(i)>σ(i+1)降序排列。矩阵U和矩阵V的纵列分别是A的左奇异向量和右奇异向量。

通常, 矩阵S各元素的细微变化不会改变观众对信号质量变化的感知,这个特点主要用于音频水印。因此,水印信息可以被简单添加到对角矩阵S的奇异值中,同时不会严重影响信号的感知性或可听性[11]

2 提出的数字语音水印算法

2.1 嵌入过程

(1)将原始语音信号分成帧;

(2)对每帧进行第一级离散小波变换,计算近似系数和细节系数;

(3)通过近似系数使用二维矩阵公式;

(4)对矩阵进行奇异值分解,找到右特性向量V、奇异值S和左特性向量U;

(5)基于式(3)的每个特征值利用奇或偶调制函数嵌入水印,奇或偶调制函数能够保存原始信号的直方图,同时还能确保信号统计数据的改动较小,因为修改发生在小范围内,宿主信号失真较少;

(6)运用逆奇异值分解计算修正矩阵;

(7)将修正矩阵转换为修正近似系数;

(8)细节系数和近似系数进行逆小波变换,获得修正框架;

(9)以修正框架为基础重构信号,得到有水印的语音信号。

2.2 提取过程

(1)利用同步位寻找水印的初始位置;

(2)将有水印的语音信号分成帧;

(3)对每帧进行第一级离散小波变换,计算近似系数和细节系数;

(4)通过近似系数使用二维矩阵公式;

(5)对矩阵进行奇异值分解,找到右特征向量V、奇异值S和左特征向量U;

(6)对每个特征值应用逆奇或逆偶调制函数,提取水印,如式(4)所示:

3 实验结果与讨论

3.1 本文算法的实验结果

本文采用模拟方法研究提出的数字语音水印的鲁棒性、隐蔽性和容量,仿真实验在Intel i5双核处理器、内存为4.0G、2.93 GHz主频、Windows7操作系统的笔记本电脑上进行,使用的平台为MATLAB2011b,实验材料为两组语音数据。

第一组采用交错正交幅度调制(SQAM)的6个信号,指数49~54,抽样频率44.1 kHz,平均时长大约22 s,分辨率16 bit。第二组采用ATCOSIM语音语料库的20个语音数据[12],抽样频率32 kHz,分辨率12 bit,平均时长3.8 s。图2所示的二值水印标志的尺寸为22×31,用于本文实验。

表1显示了本文所提出盲数字语音水印的多种因素。分别运用式(5)的误码率(BER)、位秒(BPS)、式(6)的信噪比(SNR)来测量本文算法的鲁棒性、容量和隐蔽性:

式中,w是原始信号,

是水印信号,

是OX(XOR)运算子,N是信号长度。

表1给出了增加容量对隐蔽性的影响。嵌入原始数据的水印越多,失真就越大,进而影响语音的隐蔽性。

表2 给出了不同量化步长的误码率和信噪比。可以看出,量化步长越少,有水印信号的隐蔽性越强。

表3给出了在不同攻击之下的误码率。可以看出,带通滤波器降低了一半的误码率,因为很多水印被嵌入低频区域。当加性高斯白噪声的信噪比增加时,误码率随之降低。

3.2 与其他算法的比较

本文的对比算法与文献[5]和文献[11]算法作比较,选择的原因如下:在信号嵌入水印方面应用类似离散小波变换和奇异值分解的技术可以以相同的方式改变水印强度因子(Δ和α),且这些技术都流行且简单。设置Δ=0.2,α=0.2。

表4从误码率和信噪比方面,对各算法的不同量化步长进行比较。可以看出,本文的平均误码率高于文献[11]和文献[5]的平均误码率,表现出了更强的鲁棒性。另外,本文算法的信噪比也高于文献[5]和文献[11],即本文算法的隐蔽性更强。

表5给出了本文算法与文献[5]和文献[11]在误码率方面的鲁棒性表现,测试了5种不同情况,包括无攻击、添加高斯白噪声使信号SNR为35 dB、低通滤波使截止频率为22 kHz、随机设置嵌入水印和信号重采样然后恢复。当处于这些不同攻击下,本文算法的鲁棒性更强,这是因为水印是嵌入语音近似系数部分,该部分的能量多于语音细节系数部分的能量。

图3是各算法在不同攻击下提取出来的水印标志,为了进行公平有效的比较,所有条件完全相同。可以看出,与文献[5]和文献[11]的算法相比,运用本文算法所提取出来的水印最为清晰,这也印证了表4和表5的数据结论。

表6为各算法嵌入和提取水印的运行时间,可以看出本文算法明显快于其他两种算法,这是由于本文在量化特征值方面只修改了较小范围的统计数据,而且嵌入的系数部分是离散小波域的近似系数部分。而文献[5]和文献[11]均需要原始信号,水印嵌入在细节系数部分。

3.3 信噪比、误码率与帧长、量化步长的关系

实验中帧长和量化步长的设置直接关系实验结果,故这节讨论信噪比、误码率与帧长、量化步长关系。

图4给出了信噪比和帧长之间的关系,从图中可以看出,帧尺寸增大时,信噪比也会随之增加,其原因在于水印嵌入时,水印的语音信号失真较少。此外,选择较少的量化步长会提高语音信号的质量。

图5给出了信噪比和量化步长之间的关系,很明显,增加量化步长会减少信噪比,信噪比的减少会降低语音信号的质量。而在量化步长非常小时,误码率并非都是零,较小的量化步长不适用于较大的帧尺寸,因为这样的量化步长无法改变特征值,会在水印提取过程中产生错误。

图6给出了处于不同攻击下误码率与量化步长之间的关系。从图中可以看出,量化步长增加时,误码率会降低。因此,选择较高的量化步长会提高鲁棒性,但也会降低质量。图6还表明,选择较高的量化步长并不会提高使用低通滤波器的鲁棒性。使用低通滤波器时,小波的许多能量将会丧失,这会直接影响水印载体的特征值。

4 结论与展望

本文提出了一种盲数字语音水印技术,在离散小波变换域进行特征值量化。实验表明,当量化步长和所选帧长较高时,该算法能够抵御多种攻击,鲁棒性很强,否则,水印就会减弱。而且,将水印嵌入细节系数中能够提高隐蔽性,但也会降低鲁棒性。未来工作主要研究自适应量化步长和同步技术,进一步改善水印提取过程。

参考文献

[1] PHADIKAR A.Multibit quantization index modulation:A high-rate robust data-hiding method[J].Journal of King Saud University Computer and Information Sciences,2013,25(2):163-171.

[2] 王新宇,詹永照.构造顶点分布特征的三维模型数字水印算法[J].计算机辅助设计与图形学学报,2014,26(2):272-279.

[3] 尹浩,林闯,邱锋,等.数字水印技术综述[J].计算机研究与发展,2005,42(7):1093-1099.

[4] 秦树东.音频数字水印算法的研究[D].南京:南京邮电大学,2014.

[5] 王飞.基于SVD和预测错误扩展的数字音频水印算法研究[D].长沙:湖南大学,2014.

[6] 谢斌,肖玲玲,吴君钦.一种抗剪切的DWT域多重音频数字水印算法[J].电子技术应用,2010,36(4):138-140.

[7] GOPALAN K.A unified audio and image steganography by spectrum modification[C].Industrial Technology.ICIT 2009.IEEE International Conference on.IEEE,2009:1-5.

[8] 侯剑,付永生,郭恺.基于相位调制的立体声音频数字水印[J].电子技术应用,2006,32(6):49-51.

[9] 高裴裴,朱耀庭,张世涛,等.基于数字水印载体的图像语音判读方法研究[J].激光与红外,2012,42(10):1187-1190.

[10] Nematollahi Mohammad Ali,Al-Haddad S A R.An overview of digital speech watermarking[J].Int.J.Speech Technol.2013,17(8):1-18.

[11] LEI B,SOON I Y,LI Z.A robust audio watermarking scheme based on lifting wavelet transform and singular value decomposition[M].Berlin:Digital Forensics and Watermarking,2012:1985-2001.

[12] HOFBAUER K,PETRIK S,HERING H.The ATCOSIM corpus of non-prompted clean air traffic control speech[J].Sixth International Conference on Language Resources & Evaluation Lrec,2008,24(1):2147-2152.

相关推荐

黄道十二宫杀手密码51年后被破解,来自两位程序员和数学家合作

杨净边策发自凹非寺量子位报道|公众号QbitAI黄道十二宫杀手(ZodiacKiller)可能是世界上最知名的高智商连环杀手,52年来从未被抓获。他的事迹已被改编成了多部好莱坞电影。△...

深入剖析MediaCodec解码器的基本原理及使用「建议新手收藏」

一,MediaCodec工作原理MediaCodec类Android提供的用于访问低层多媒体编/解码器接口,它是Android低层多媒体架构的一部分,通常与MediaExtractor、MediaMu...

Retrofit WebService 实践

前言作为Android开发,平时和后端聊得最多的除了喝酒就是接口。常用语:Restful和WebService,前者现在聊得多,后者以前聊得多。默认含义分别为:Restful:HTTP协议...

建议收藏!175部4K UHD版本经典高分电影洗版参考目录(2015之前)

本内容来源于@什么值得买APP,观点仅代表作者本人|作者:1L789近两年很多经典高分老电影陆续开始重制成4KUHD版本,虽然我早已将这些电影的BD蓝光版收入,但纠结一番后还是花了不少时间将其全部...

2 个月的面试亲身经历告诉大家,如何进入 BAT 等大厂?

这篇文章主要是从项目来讲的,所以,从以下几个方面展开。怎么介绍项目?怎么介绍项目难点与亮点?你负责的模块?怎么让面试官满意?怎么介绍项目?我在刚刚开始面试的时候,也遇到了这个问题,也是我第一个思考的问...

详解Android官推Kotlin-First的图片加载库

前言Coil是一个非常年轻的图片加载库,在2020年10月22日才发布了1.0.0版本,但却受到了Android官方的推广,在AndroidDevelopersBackst...

webview 渲染机制:硬件加速方式渲染的Android Web

webview渲染是什么?webview渲染是用于展现web页面的控件;webview可以内嵌在移动端,实现前端的混合式开发,大多数混合式开发框架都是基于webview模式进行二次开发的w...

因为我对Handler的了解,居然直接给我加了5K

1Handler是什么?android提供的线程切换工具类。主要的作用是通过handler实现从子线程切换回主线程进行ui刷新操作。1.1为什么Handler能实现线程切换?在创建Handler的...

「经典总结」一个View,从无到有会走的三个流程,你知道吗?

前言一个View,从无到有会走三个流程,也就是老生常谈的measure,layout,draw三流程我们都知道Android视图是由一层一层构成的层级结构,直白点说,就是父View包含子View而子V...

这些垃圾代码是谁写的?哦,原来小丑竟是我自己

程序员是最喜欢自嘲、自黑的群体之一,比如他们常常称自己是“码农”、“程序猿”,再比如他们的工作明明是写代码、修Bug,也有人调侃说:“明明我们是修代码、写Bug!”本文整理了一些程序员“修代码、写...

手把手教你爬取天堂网1920*1080大图片(批量下载)——理论篇

/1前言/平时我们要下载图片,要要一个一个点击下载是不是觉得很麻烦?那有没有更加简便的方法呢?答案是肯定的,这里我们以天堂网为例,批量下载天堂网的图片。/2项目准备工作/首先我们第一步我们要安装...

音视频开发需要你懂得 ffmpeg 开源库的编码原理

引言音视频开发需要你懂得音视频中一些基本概念,针对编解码而言,我们必须提前懂得编解码器的一些特性,码流的结构,码流中一些重要信息如sps,pps,vps,startcode以及基本的工作原理,...

「8年老 Android 开发」最全最新 Android 面试题系列全家桶(带答案)

下面跟大家分享的这些面试题都是互联网大厂真实流出的面试内容,每个问题都附带完整详细的答案,不像网上的那些资料三教九流有的甚至还没答案,这些面试题我也是经过日积月累才整理出来的精品资料。这些面试题主要是...

手把手教你爬取天堂网1920*1080大图片(批量下载)——实战篇

/1前言/上篇文章手把手教你爬取天堂网1920*1080大图片(批量下载)——理论篇我们谈及了天堂网站图片抓取的理论,这篇文章将针对上篇文章的未尽事宜进行完善,完成图片的批量抓取。/2图片网址解...

PHP 8.1.9 更新发布

CLI:修复了内置服务器通过PHP_CLI_server_WORKERS环境变量的潜在溢出。修正了GH-8952(不再可能有意关闭std句柄)。Core:修复了GH-8923的错误(Windows上的...