一种加密语音信号的感知哈希特征提取方法及系统
张秋余; 周亮; 张其文; 晏燕; 葛子贤; 李改莉; 李昱州; 张登海
2020-07-07
专利权人兰州理工大学
公开日期2020-07-07
授权国家中国
专利类型授权发明
摘要本发明公开了一种加密语音信号的感知哈希特征提取方法及系统,该方法包括:对加密语音信号分帧,计算每个加密语音帧与相邻加密语音帧的短时互相关系数,得到互相关系数矩阵。将互相关系数矩阵每行中前N个数值大的短时互相关系数确定为特征系数矩阵的元,得到特征系数矩阵。采用非负矩阵分解方法对特征系数矩阵进行分解,得到特征参数矩阵;利用哈希函数对特征参数矩阵进行二进制哈希构造,得到加密语音信号的感知哈希值。采用本发明的方法或系统可以将从加密语音信号中提取的短时互相关系数作为加密语音信号的感知特征,并通过哈希构造生成加密语音信号的感知哈希值,提高了从加密语音信号中直接提取语音感知特征时的鲁棒性、区分性和摘要性。
申请日期2018-08-24
优先权日2018-08-24
预估到期日2038-08-24
语种中文
专利状态授权
申请号CN201810971905.1
公开(公告)号CN109036439B
IPC 分类号G10L19/00 ; G10L19/02
专利代理人王戈
代理机构北京高沃律师事务所
CPC分类号G10L19/0017 ; G10L19/02
权利要求1.一种加密语音信号的感知哈希特征提取方法,其特征在于,包括: 获取初始时域语音信号; 对所述初始时域语音信号进行置乱加密处理,得到加密语音信号; 采用窗函数对所述加密语音信号进行分帧,得到多个加密语音帧; 根据公式计算每个加密语音帧与相邻加密语音帧的短时互相关系数,得到互相关系数矩阵;其中,Ri(k)为第i个加密语音帧的短时互相关系数,Pi-1(m)为第i-1个加密语音帧,Pi(m+k)是第i个加密语音帧的移位序列,k为延迟量,L为加密语音帧的长度,m={1,2,…,L},i={2,3,…,fn},fn为加密语音帧的总帧数; 将互相关系数矩阵每行中的短时互相关系数按从大到小排列; 将互相关系数矩阵每行中前N个数值大的短时互相关系数确定为特征系数矩阵的元,得到特征系数矩阵,其中1≤N≤fn; 采用非负矩阵分解方法对所述特征系数矩阵进行分解,得到特征参数矩阵; 利用哈希函数对所述特征参数矩阵进行二进制哈希构造,得到所述加密语音信号的感知哈希值。 2.根据权利要求1所述的方法,其特征在于,所述对所述初始时域语音信号进行置乱加密处理,得到加密语音信号,具体包括: 对所述初始时域语音信号进行不重叠分帧处理,得到多个初始时域语音分帧信号;所述初始时域语音分帧信号的长度为256; 分别对每个所述初始时域语音分帧信号进行一维离散余弦变换,得到多个频域语音分帧信号; 利用随机数生成器为每个频域语音分帧信号生成一个唯一的整数,对频域语音分帧信号按随机分配的整数的大小进行排列,得到多个置乱后的频域语音分帧信号,其中1≤所述随机分配的整数的个数≤fn; 对多个置乱后的频域语音分帧信号进行离散余弦反变换,得到多个置乱后的时域语音分帧信号; 将所述多个置乱后的时域语音分帧信号顺序连接,得到所述加密语音信号。 3.根据权利要求1所述的方法,其特征在于,所述采用窗函数对所述加密语音信号进行分帧,得到多个加密语音帧,具体包括: 采用窗函数对所述加密语音信号进行分帧,得到多个加密语音帧Pn(m)=ω(m)×Xe((n-1)×inc+m); 其中,Pn(m)是第n个加密语音帧,1≤n≤fn,ω(m)为窗函数,inc为后一帧对前一帧的位移量,m为加密语音帧的帧内样点数,Xe(.)为加密语音信号。 4.根据权利要求1所述的方法,其特征在于,所述将互相关系数矩阵每行中前N个数值大的短时互相关系数确定为特征系数矩阵的元,得到特征系数矩阵,具体包括: 将互相关系数矩阵每行中前22个短时互相关系数确定为特征系数矩阵的元,得到特征系数矩阵。 5.根据权利要求1所述的方法,其特征在于,所述利用哈希函数对所述特征参数矩阵进行二进制哈希构造,得到所述加密语音信号的感知哈希值,具体包括: 利用哈希函数对所述特征参数矩阵进行二进制哈希构造,得到所述加密语音信号的感知哈希值;其中,Hx(i)为加密语音信号的感知哈希序列的第i个感知哈希值,H1(i)为特征参数矩阵的第i个值,H1(i+1)为特征参数矩阵的第i+1个值。 6.一种加密语音信号的感知哈希特征提取系统,其特征在于,包括: 初始时域语音信号获取模块,用于获取初始时域语音信号; 加密语音信号生成模块,用于对所述初始时域语音信号进行置乱加密处理,得到加密语音信号; 加密语音帧生成模块,用于采用窗函数对所述加密语音信号进行分帧,得到多个加密语音帧; 互相关系数矩阵生成模块,用于根据公式计算每个加密语音帧与相邻加密语音帧的短时互相关系数,得到互相关系数矩阵;其中,Ri(k)为第i个加密语音帧的短时互相关系数,Pi-1(m)为第i-1个加密语音帧,Pi(m+k)是第i个加密语音帧的移位序列,k为延迟量,L为加密语音帧的长度,m={1,2,…,L},i={2,3,…,fn},fn为加密语音帧的总帧数; 排序模块,用于将互相关系数矩阵每行中的短时互相关系数按从大到小排列; 特征系数矩阵生成模块,用于将互相关系数矩阵每行中前N个数值大的短时互相关系数确定为特征系数矩阵的元,得到特征系数矩阵; 特征参数矩阵生成模块,用于采用非负矩阵分解方法对所述特征系数矩阵进行分解,得到特征参数矩阵; 加密语音信号的感知哈希值生成模块,用于利用哈希函数对所述特征参数矩阵进行二进制哈希构造,得到所述加密语音信号的感知哈希值。 7.根据权利要求6所述的系统,其特征在于,所述加密语音信号生成模块具体包括: 初始时域语音分帧信号生成单元,用于对所述初始时域语音信号进行不重叠分帧处理,得到多个初始时域语音分帧信号;所述初始时域语音分帧信号的长度为256; 频域语音分帧信号生成单元,用于分别对每个所述初始时域语音分帧信号进行一维离散余弦变换,得到多个频域语音分帧信号; 置乱后的频域语音分帧信号生成单元,用于利用随机数生成器为每个频域语音分帧信号生成一个唯一的整数,对频域语音分帧信号按随机分配的整数的大小进行排列,得到多个置乱后的频域语音分帧信号,其中1≤所述随机分配的整数的个数≤fn; 时域语音分帧信号生成单元,用于对多个置乱后的频域语音分帧信号进行离散余弦反变换,得到多个置乱后的时域语音分帧信号; 加密语音信号生成单元,用于将所述多个置乱后的时域语音分帧信号顺序连接,得到所述加密语音信号。 8.根据权利要求6所述的系统,其特征在于,所述加密语音帧生成模块得到的多个加密语音帧为Pn(m)=ω(m)×Xe((n-1)×inc+m); 其中,Pn(m)是第n个加密语音帧,1≤n≤fn,ω(m)为窗函数,inc为后一帧对前一帧的位移量,m为加密语音帧的帧内样点数,Xe(.)为加密语音信号。 9.根据权利要求6所述的系统,其特征在于,所述特征系数矩阵生成模块生成的特征系数矩阵每行中元的个数为22,即N=22。 10.根据权利要求6所述的系统,其特征在于,所述加密语音信号的感知哈希值生成模块利用的哈希函数为其中,Hx(i)为加密语音信号的感知哈希序列的第i个感知哈希值,H1(i)为特征参数矩阵的第i个值,H1(i+1)为特征参数矩阵的第i+1个值。
引用专利CN102457428A;CN102881291A;CN104462196A;CN104615629A;CN107480273A;US20170026075A1
被引用专利数量0
简单法律状态有效
文献类型专利
条目标识符https://ir.lut.edu.cn/handle/2XXMBERH/108449
专题计算机与通信学院
推荐引用方式
GB/T 7714
张秋余,周亮,张其文,等. 一种加密语音信号的感知哈希特征提取方法及系统[P]. 2020-07-07.
条目包含的文件
条目无相关文件。
个性服务
查看访问统计
谷歌学术
谷歌学术中相似的文章
[张秋余]的文章
[周亮]的文章
[张其文]的文章
百度学术
百度学术中相似的文章
[张秋余]的文章
[周亮]的文章
[张其文]的文章
必应学术
必应学术中相似的文章
[张秋余]的文章
[周亮]的文章
[张其文]的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。