资源类型

期刊论文 168

年份

2024 1

2023 6

2022 16

2021 12

2020 4

2019 7

2018 9

2017 10

2016 6

2015 2

2014 21

2013 9

2012 1

2011 2

2010 8

2009 4

2008 5

2007 7

2006 10

2005 6

展开 ︾

关键词

吸附 4

信息处理 3

反渗透 3

预处理 3

印染废水 2

图像分析 2

图像处理 2

废水 2

2 1

2 Mb/s高速信令 1

4-二硝基茴香醚 1

6016 合金 1

AD9954 1

BPSK 1

CCS 1

CO2分离 1

DPP);分布式功率转换器;开关电容转换器 1

EMD距离 1

HY-2A卫星 1

展开 ︾

检索范围:

排序: 展示方式:

鸡尾酒会问题的技术回顾、当前进展及未来挑战 Review

Yan-min QIAN, Chao WENG, Xuan-kai CHANG, Shuai WANG, Dong YU

《信息与电子工程前沿(英文)》 2018年 第19卷 第1期   页码 40-63 doi: 10.1631/FITEE.1700814

摘要: 鸡尾酒会问题即在多人同时说话的场景下追踪并识别某一个特定说话人的语音。在自动语音识别技术大规模推广应用中,鸡尾酒会问题是亟待解决的关键问题之一。主要讨论在鸡尾酒会问题中扮演中心角色的语音分离问题。此外,介绍了在鸡尾酒会环境下针对改善多说人语识别和说话人识别精度的相关技术。笔者认为,利用一个更加强大的模型来有效地开发和利用来自麦克风阵列、声学训练集合以及语言本身的知识非常重要。

关键词: 鸡尾酒会问题;计算听觉场景分析;非负矩阵分解;排列不变性训练;多说人语处理    

EMD-Tnorm得分规整策略在说话人确认中的应用

李燕萍,丁辉,唐振民

《中国工程科学》 2010年 第12卷 第2期   页码 95-100

摘要:

从两个方面对确认系统进行了改进,在模型方面,扩展了MixMax模型,对复杂的背景噪声等干扰因素在训练说话人模型的同时也进行了建模,最大程度上消除噪声的影响,对说话人的特征分布进行了更真实的表征;在得分方面,提出了一种改进的得分规整策略,基于EMD距离从所有背景说话人集合中自适应选择最接近的一定数量的模型构成说话人特定的背景集合,从而进行得分归一化。实验结果表明,该方法能够同时针对说话人和测试环境的不同进行补偿,进一步降低了误识率和漏警率,获得了很好的确认性能。

关键词: 说话人确认     鲁棒性     EMD距离     MixMax模型    

利用脑机接口技术帮助失语患者“说话

Chris Palmer

《工程(英文)》 2022年 第9卷 第2期   页码 3-5 doi: 10.1016/j.eng.2021.12.004

一种基于子带激励替换的窄带语音水印算法 Article

Wei LIU, Ai-qun HU

《信息与电子工程前沿(英文)》 2017年 第18卷 第5期   页码 627-643 doi: 10.1631/FITEE.1601503

摘要: 本文建议了一种新的窄带语音水印算法,该算法将部分语音信号替换为一个经过幅度调节和频谱成形的隐蔽信号。文中从理论上证明了若仅对一小部分载体语音作修改,则不但可以建立一个用于隐蔽通信的理想信道模型,而且还能确保隐藏信号的不可感知性和带水印信号的可懂度。在此基础上,文中建议了一个实际的系统模型。在嵌入器中,使用了能量规范化准则,使得通带水印信号的能量与原始通带语音激励信号的能量相等,然后使用合成滤波器来对该水印信号进行频谱成形。

关键词: 分析滤波器;线性预测;窄带语音水印;通带激励替代;能量规范化;谱包络成形;合成滤波器    

用于说话人识别的潜在可区分性表征学习 Research Articles

黄多林1,毛启容1,2,马忠臣1,郑智燊1,Sidheswar ROUTRAY1,Elias-Nii-Noi OCQUAYE1

《信息与电子工程前沿(英文)》 2021年 第22卷 第5期   页码 615-766 doi: 10.1631/FITEE.1900690

摘要: 语音信号中提取特定说话人的可区分性表征,并将其转换为固定长度的向量是说话人识别和验证系统的关键步骤。提出一种潜在的可区分性表征学习方法,用于说话人识别。具体来说,引入附加说话人嵌入查找表以探索同一说话人不同语音之间的相关性。此外,引入一个重构约束用于学习线性映射矩阵,使表征更具可区分性。

关键词: 说话人识别;潜在可区分性表征学习;说话人嵌入查找表;线性映射矩阵    

多带同步模型用于噪声环境下语音识别

孙暐,吴镇扬

《中国工程科学》 2006年 第8卷 第3期   页码 31-34

摘要:

根据人耳听觉特性,提出新的同步多带最大似然线性回归算法用于噪声环境下语音识别。该算法采用最大似然作为参数估计准则,利用各频带信号同步感知和噪声污染假定的方法进行语音模型补偿,有效地提高了识别系统在噪声环境下的识别性能。

关键词: 隐马尔可夫模型     最大似然     多带同步模型     语音识别    

无线局域网上IP语音传输的容量分析

陈立全,胡爱群,周雪莉

《中国工程科学》 2005年 第7卷 第7期   页码 81-85

摘要:

由于无线媒介的易变性,IP语音在无线局域网上传输受到极大的限制。通过对无线局域网媒体接入层机制的分析,考虑了碰撞概率因素,提出了采用马尔可夫链模型来推导在IEEE 80211b/a/g标准下单个接入点同时支持IP语音用户最大容量的方法,计算出针对不同IP语音编码标准如

关键词: 无线局域网     IP语音     容量     马尔可夫链    

用于语音识别的二值神经网络 Regular Papers

Yan-min QIAN, Xu XIANG

《信息与电子工程前沿(英文)》 2019年 第20卷 第5期   页码 701-715 doi: 10.1631/FITEE.1800469

摘要: 近年来,在语音识别的声学建模中,深度神经网络(DNNs)明显优于高斯混合模型。然而,推断阶段巨大的计算量使其难以部署在低功耗的嵌入式模型上。为此,稀疏性和低精度定点量化技术被广泛使用。为降低推理阶段计算量,本文开发了用于语音识别的二进制神经网络,并实现了高速的二值矩阵乘法。在中央处理器(CPU)和图形处理单元(GPU)上,二值矩阵乘法的运行速度是浮点矩阵乘法的5–7倍。针对大规模连续语音识别的声学建模,提出多种二值神经网络及相关模型优化算法。为提高二值模型的精度,探索了从浮点模型到二值模型的知识蒸馏技术。在标准的Switchboard语音识别任务上,该二值神经网络模型比浮点神经网络模型速度提高3–4倍。

关键词: 语音识别;二值神经网络;二值矩阵乘法;知识蒸馏;位1计数    

采用背景人声简化特征集的说话人识别直方图均衡化方法 Article

Myung-jae KIM, Il-ho YANG, Min-seok KIM, Ha-jin YU

《信息与电子工程前沿(英文)》 2017年 第18卷 第5期   页码 738-750 doi: 10.1631/FITEE.1500380

摘要: 本文提出了一种用于说话人识别技术的直方图均衡化方法。该方法采用了一套增补简化特征集,用以在训练数据和测试数据较短时改进说话人识别的效果。该增补特征集采用选择算法或聚类算法从背景人声中派生得到。当输入语音数据样本不足时,本文提出的方法可作为构建直方图的特征归一化方法使用。该方法作为一种i-vector归一化方法,源于一种目前较为先进的基于i-vector的概率线性判别分析(Probabilistic linear discriminant analysis, PLDA)说话人识别系统在输入语音和增补集中,用于直方图均衡化的样本值序号均按升序进行估计。新的序列号则按不同种类的序号之和进行排列。随后,该方法采用最新的序列号得出了测试语音样本的累积分布函数。本文还采用了2008美国国家标准技术研究所说话人识别评测语料库对该i-vector系统进行了评测。试验结果表明,与传统特征归一化方法相比,当采用所提出的方法时,平均系统性能可得到有效提提升。

关键词: 说话人识别;直方图均衡化;i-vector    

一种端到端语音合成中的高效解码自注意力网络 Research Article

赵伟1,2,许力1,2

《信息与电子工程前沿(英文)》 2022年 第23卷 第7期   页码 1127-1138 doi: 10.1631/FITEE.2100501

摘要: 自注意力网络由于其并行结构和强大的序列建模能力,被广泛应用于语音合成(TTS)领域。然而,当使用自回归解码方法进行端到端语音合成时,由于序列长度的二次复杂性,其推理速度相对较慢。当部署设备未配备图形处理器(GPU)时,该效率问题更加严重。为解决该问题,提出一种高效解码自注意力网络(EDSA)作为替代。通过一个动态规划解码过程,有效加速TTS模型推理,使其具有线性计算复杂度。基于普通话和英文数据集的实验结果表明,所提EDSA模型在中央处理器(CPU)和GPU上的推理速度分别提高720%和50%,而性能几乎相同。此外,所提模型在域外语言处理上可能比基线Transformer TTS性能更好。

关键词: 高效解码;端到端;自注意力网络;语音合成    

交互式语音地球仪照明结构研究

郭阳宽,李颖晖,许玮,熊琦,马靖,王勇,宋宇

《中国工程科学》 2007年 第9卷 第5期   页码 50-52

摘要:

简述了交互式语音地球仪结构原理;研究了地球仪上首都的无歧义显示、发光二极管的布置以及首 都显示分辨率;制成了交互式语音地球仪。

关键词: 语音地球仪     结构设计     分辨率     束光筒     无歧义照明    

基于语音识别的电磁调控智能超表面 Article

柏林, 刘元可, 徐亮, 张政, 王强, 蒋卫祥, 仇成伟, 崔铁军

《工程(英文)》 2023年 第22卷 第3期   页码 185-190 doi: 10.1016/j.eng.2022.06.026

摘要:

本研究提出并实现了一种基于人类语音识别的智能超表面平台,用于对电磁波束进行可编程调控。该智能超表面平台由数字编码超表面、语音识别模块、单片机和数模转换器(DAC)电路组成,可根据预先存储的语音指令对电磁波进行智能控制。语音识别模块配合DAC和单片机对语音指令进行识别,并生成对应的电压序列来控制超表面。此外,在超表面的设计过程中引入遗传算法,可有效优化超表面相位分布。

关键词: 语音识别     可编程超表面     遗传算法     智能电磁调控    

基于人的信息处理模型分析操作人员视觉信息处理过程

金银花,李桢业,古辉,汤一平

《中国工程科学》 2007年 第9卷 第5期   页码 57-61

摘要:

报告了由知觉、思维、运动3个处理器和短期记忆、工作记忆和长期记忆构成的研究用计算机实现 人的信息处理模型;把人的信息处理模型安装在一台PC机上,模拟生产操作人员监视锅炉厂模拟机计算机屏幕 的过程表明,视觉信息处理过程取决于画面因素、人的身心状态和知觉处理器参数等与实际生产操作人员的行 为特征相符。

关键词: 人的信息处理模型     知觉处理    视觉信息处理     心理状态     人为操作失误    

并联机床后置处理器的开发及实验研究

李铁民,叶佩青,汪劲松

《中国工程科学》 2003年 第5卷 第12期   页码 80-86

摘要:

以六自由度6-TPS型并联机床为模型,阐述了机床控制数据的生成原理和流程;以此为基础,规划了后置处理器的功能和整体结构。对若干关键技术进行了研究和探讨,包括基于参数化二进制格式的内部数据传输,基于刀轴矢量的笛卡儿空间粗插补算法,三维和二维刀具半径补偿,刀位文件的预处理以及加工代码的词法和语法检查等。

关键词: 并联机床     后置处理算法     后置处理   

6016铝合金热处理工艺研究

张钧萍,金庆生,马鸣图

《中国工程科学》 2014年 第16卷 第1期   页码 103-107

摘要:

通过硬度测试、力学性能测试和烘烤硬化性能测试,研究了6016 铝合金冷轧板材的热处理工艺,结果表明:合金的硬度随着固溶温度升高和固溶时间延长而增加;合金进行预时效处理时,随着预时效时间的增加硬度出现先降低后升高的现象,且预时效温度越高,硬度下降值越大;在本试验条件下,满足覆盖件性能要求的6016合金的热处理工艺为:540 ℃×20 min固溶水淬+120 ℃×10 min预时效处理

关键词: 6016 合金     固溶处理     预时效处理     烘烤硬化    

标题 作者 时间 类型 操作

鸡尾酒会问题的技术回顾、当前进展及未来挑战

Yan-min QIAN, Chao WENG, Xuan-kai CHANG, Shuai WANG, Dong YU

期刊论文

EMD-Tnorm得分规整策略在说话人确认中的应用

李燕萍,丁辉,唐振民

期刊论文

利用脑机接口技术帮助失语患者“说话

Chris Palmer

期刊论文

一种基于子带激励替换的窄带语音水印算法

Wei LIU, Ai-qun HU

期刊论文

用于说话人识别的潜在可区分性表征学习

黄多林1,毛启容1,2,马忠臣1,郑智燊1,Sidheswar ROUTRAY1,Elias-Nii-Noi OCQUAYE1

期刊论文

多带同步模型用于噪声环境下语音识别

孙暐,吴镇扬

期刊论文

无线局域网上IP语音传输的容量分析

陈立全,胡爱群,周雪莉

期刊论文

用于语音识别的二值神经网络

Yan-min QIAN, Xu XIANG

期刊论文

采用背景人声简化特征集的说话人识别直方图均衡化方法

Myung-jae KIM, Il-ho YANG, Min-seok KIM, Ha-jin YU

期刊论文

一种端到端语音合成中的高效解码自注意力网络

赵伟1,2,许力1,2

期刊论文

交互式语音地球仪照明结构研究

郭阳宽,李颖晖,许玮,熊琦,马靖,王勇,宋宇

期刊论文

基于语音识别的电磁调控智能超表面

柏林, 刘元可, 徐亮, 张政, 王强, 蒋卫祥, 仇成伟, 崔铁军

期刊论文

基于人的信息处理模型分析操作人员视觉信息处理过程

金银花,李桢业,古辉,汤一平

期刊论文

并联机床后置处理器的开发及实验研究

李铁民,叶佩青,汪劲松

期刊论文

6016铝合金热处理工艺研究

张钧萍,金庆生,马鸣图

期刊论文