一种加密语音信号的感知哈希特征提取方法及系统

IR > 计算机与通信学院

	一种加密语音信号的感知哈希特征提取方法及系统
	张秋余; 周亮; 张其文; 晏燕; 葛子贤; 李改莉; 李昱州; 张登海
	2020-07-07
专利权人	兰州理工大学
公开日期	2020-07-07
授权国家	中国
专利类型	授权发明
摘要	本发明公开了一种加密语音信号的感知哈希特征提取方法及系统，该方法包括：对加密语音信号分帧，计算每个加密语音帧与相邻加密语音帧的短时互相关系数，得到互相关系数矩阵。将互相关系数矩阵每行中前N个数值大的短时互相关系数确定为特征系数矩阵的元，得到特征系数矩阵。采用非负矩阵分解方法对特征系数矩阵进行分解，得到特征参数矩阵；利用哈希函数对特征参数矩阵进行二进制哈希构造，得到加密语音信号的感知哈希值。采用本发明的方法或系统可以将从加密语音信号中提取的短时互相关系数作为加密语音信号的感知特征，并通过哈希构造生成加密语音信号的感知哈希值，提高了从加密语音信号中直接提取语音感知特征时的鲁棒性、区分性和摘要性。
申请日期	2018-08-24
优先权日	2018-08-24
预估到期日	2038-08-24
语种	中文
专利状态	授权
申请号	CN201810971905.1
公开（公告）号	CN109036439B
IPC 分类号	G10L19/00 ; G10L19/02
专利代理人	王戈
代理机构	北京高沃律师事务所
CPC分类号	G10L19/0017 ; G10L19/02
权利要求	1.一种加密语音信号的感知哈希特征提取方法，其特征在于，包括：获取初始时域语音信号；对所述初始时域语音信号进行置乱加密处理，得到加密语音信号；采用窗函数对所述加密语音信号进行分帧，得到多个加密语音帧；根据公式计算每个加密语音帧与相邻加密语音帧的短时互相关系数，得到互相关系数矩阵；其中，Ri(k)为第i个加密语音帧的短时互相关系数，Pi-1(m)为第i-1个加密语音帧，Pi(m+k)是第i个加密语音帧的移位序列，k为延迟量，L为加密语音帧的长度，m＝{1,2,…,L}，i＝{2,3,…,fn}，fn为加密语音帧的总帧数；将互相关系数矩阵每行中的短时互相关系数按从大到小排列；将互相关系数矩阵每行中前N个数值大的短时互相关系数确定为特征系数矩阵的元，得到特征系数矩阵，其中1≤N≤fn；采用非负矩阵分解方法对所述特征系数矩阵进行分解，得到特征参数矩阵；利用哈希函数对所述特征参数矩阵进行二进制哈希构造，得到所述加密语音信号的感知哈希值。 2.根据权利要求1所述的方法，其特征在于，所述对所述初始时域语音信号进行置乱加密处理，得到加密语音信号，具体包括：对所述初始时域语音信号进行不重叠分帧处理，得到多个初始时域语音分帧信号；所述初始时域语音分帧信号的长度为256；分别对每个所述初始时域语音分帧信号进行一维离散余弦变换，得到多个频域语音分帧信号；利用随机数生成器为每个频域语音分帧信号生成一个唯一的整数，对频域语音分帧信号按随机分配的整数的大小进行排列，得到多个置乱后的频域语音分帧信号，其中1≤所述随机分配的整数的个数≤fn；对多个置乱后的频域语音分帧信号进行离散余弦反变换，得到多个置乱后的时域语音分帧信号；将所述多个置乱后的时域语音分帧信号顺序连接，得到所述加密语音信号。 3.根据权利要求1所述的方法，其特征在于，所述采用窗函数对所述加密语音信号进行分帧，得到多个加密语音帧，具体包括：采用窗函数对所述加密语音信号进行分帧，得到多个加密语音帧Pn(m)＝ω(m)×Xe((n-1)×inc+m)；其中，Pn(m)是第n个加密语音帧，1≤n≤fn，ω(m)为窗函数，inc为后一帧对前一帧的位移量，m为加密语音帧的帧内样点数，Xe(.)为加密语音信号。 4.根据权利要求1所述的方法，其特征在于，所述将互相关系数矩阵每行中前N个数值大的短时互相关系数确定为特征系数矩阵的元，得到特征系数矩阵，具体包括：将互相关系数矩阵每行中前22个短时互相关系数确定为特征系数矩阵的元，得到特征系数矩阵。 5.根据权利要求1所述的方法，其特征在于，所述利用哈希函数对所述特征参数矩阵进行二进制哈希构造，得到所述加密语音信号的感知哈希值，具体包括：利用哈希函数对所述特征参数矩阵进行二进制哈希构造，得到所述加密语音信号的感知哈希值；其中，Hx(i)为加密语音信号的感知哈希序列的第i个感知哈希值，H1(i)为特征参数矩阵的第i个值，H1(i+1)为特征参数矩阵的第i+1个值。 6.一种加密语音信号的感知哈希特征提取系统，其特征在于，包括：初始时域语音信号获取模块，用于获取初始时域语音信号；加密语音信号生成模块，用于对所述初始时域语音信号进行置乱加密处理，得到加密语音信号；加密语音帧生成模块，用于采用窗函数对所述加密语音信号进行分帧，得到多个加密语音帧；互相关系数矩阵生成模块，用于根据公式计算每个加密语音帧与相邻加密语音帧的短时互相关系数，得到互相关系数矩阵；其中，Ri(k)为第i个加密语音帧的短时互相关系数，Pi-1(m)为第i-1个加密语音帧，Pi(m+k)是第i个加密语音帧的移位序列，k为延迟量，L为加密语音帧的长度，m＝{1,2,…,L}，i＝{2,3,…,fn}，fn为加密语音帧的总帧数；排序模块，用于将互相关系数矩阵每行中的短时互相关系数按从大到小排列；特征系数矩阵生成模块，用于将互相关系数矩阵每行中前N个数值大的短时互相关系数确定为特征系数矩阵的元，得到特征系数矩阵；特征参数矩阵生成模块，用于采用非负矩阵分解方法对所述特征系数矩阵进行分解，得到特征参数矩阵；加密语音信号的感知哈希值生成模块，用于利用哈希函数对所述特征参数矩阵进行二进制哈希构造，得到所述加密语音信号的感知哈希值。 7.根据权利要求6所述的系统，其特征在于，所述加密语音信号生成模块具体包括：初始时域语音分帧信号生成单元，用于对所述初始时域语音信号进行不重叠分帧处理，得到多个初始时域语音分帧信号；所述初始时域语音分帧信号的长度为256；频域语音分帧信号生成单元，用于分别对每个所述初始时域语音分帧信号进行一维离散余弦变换，得到多个频域语音分帧信号；置乱后的频域语音分帧信号生成单元，用于利用随机数生成器为每个频域语音分帧信号生成一个唯一的整数，对频域语音分帧信号按随机分配的整数的大小进行排列，得到多个置乱后的频域语音分帧信号，其中1≤所述随机分配的整数的个数≤fn；时域语音分帧信号生成单元，用于对多个置乱后的频域语音分帧信号进行离散余弦反变换，得到多个置乱后的时域语音分帧信号；加密语音信号生成单元，用于将所述多个置乱后的时域语音分帧信号顺序连接，得到所述加密语音信号。 8.根据权利要求6所述的系统，其特征在于，所述加密语音帧生成模块得到的多个加密语音帧为Pn(m)＝ω(m)×Xe((n-1)×inc+m)；其中，Pn(m)是第n个加密语音帧，1≤n≤fn，ω(m)为窗函数，inc为后一帧对前一帧的位移量，m为加密语音帧的帧内样点数，Xe(.)为加密语音信号。 9.根据权利要求6所述的系统，其特征在于，所述特征系数矩阵生成模块生成的特征系数矩阵每行中元的个数为22，即N＝22。 10.根据权利要求6所述的系统，其特征在于，所述加密语音信号的感知哈希值生成模块利用的哈希函数为其中，Hx(i)为加密语音信号的感知哈希序列的第i个感知哈希值，H1(i)为特征参数矩阵的第i个值，H1(i+1)为特征参数矩阵的第i+1个值。
引用专利	CN102457428A;CN102881291A;CN104462196A;CN104615629A;CN107480273A;US20170026075A1
被引用专利数量	0
简单法律状态	有效
文献类型	专利
条目标识符	https://ir.lut.edu.cn/handle/2XXMBERH/108449
专题	计算机与通信学院
推荐引用方式 GB/T 7714	张秋余,周亮,张其文,等. 一种加密语音信号的感知哈希特征提取方法及系统[P]. 2020-07-07.