期刊首页 优先出版 当期阅读 过刊浏览 作者中心 关于期刊 English

《中国工程科学》 >> 2010年 第12卷 第2期

EMD-Tnorm得分规整策略在说话人确认中的应用

1. 南京邮电大学通信与信息工程学院,南京 210003 ;

2. 南京理工大学模式识别与智能系统实验室,南京 210094 ;

3. 嘉兴学院数学与信息工程学院,浙江嘉兴 314001

资助项目 :浙江省自然科学基金资助项目(Y1090649);浙江省教育厅科研资助项目(Y200805349) 收稿日期: 2008-04-18 发布日期: 2010-02-03 10:02:22.000

下一篇 上一篇

摘要

从两个方面对确认系统进行了改进,在模型方面,扩展了MixMax模型,对复杂的背景噪声等干扰因素在训练说话人模型的同时也进行了建模,最大程度上消除噪声的影响,对说话人的特征分布进行了更真实的表征;在得分方面,提出了一种改进的得分规整策略,基于EMD距离从所有背景说话人集合中自适应选择最接近的一定数量的模型构成说话人特定的背景集合,从而进行得分归一化。实验结果表明,该方法能够同时针对说话人和测试环境的不同进行补偿,进一步降低了误识率和漏警率,获得了很好的确认性能。

图片

图1

图2

图3

图4

参考文献

[ 1 ] Dijana P D, Asmaa E H, Gerard Chollet.Text -independent speaker verification state of the art and challenges [ J] .LNCS, 2007 , 135 -169 链接1

[ 2 ] Sturim D E, Reynolds D A.Speaker adaptive cohort selective for Tnorm in text -independent speaker verification [ J] .ICASSP, 2005 , 1 : 741 -744 链接1

[ 3 ] Daniel R C, Julian F A, Joaquin G R.Speaker verification using speaker -and test -dependent fast score normalization [ J] .Pat- tern Recognition Letters, 2007 , 28 : 90 -98 链接1

[ 4 ] Auckenthaler R, Carey M,Lloyd -Tomas H.Score normalization for text -independent speaker verification systems [ J ] .Digital Signal Process, 2000 , 10 :42 -54 链接1

[ 5 ] Reynolds D A, Quatieri T F.Speaker verification using adapted Gaussian Mixture Models [ J] .Digital Signal Process, 2000 , 10 : 19 -41 链接1

[ 6 ] Thilo Stadelmann, Bernd Freisleben.Fast and robust speaker clustering using the earth mover’ s distance and mixmax models [ J] .ICASSP, 2006 , 1 : 989 -992 链接1

[ 7 ] Rubner Y, Tomasi C, Guibas L J.The earth mover’ s distance as a metric for image retrieval [ J] .International Journal of Comput- er Vision, 2000 ,40 : 99 -121 链接1

[ 8 ] 郑榕,张树武,徐波.基于特征规整和评分规整的说话人确认研究[J].中文信息学报,2006,20(6):75-82 链接1

[ 9 ] 刘明辉,陈继旭,李辉,等.基于TZNormalization规整的话者确认阈值选取[J].数据采集与处理,2005,20(3):311-317 链接1

相关研究