您的位置: 专家智库 > >

戴蓓蒨

作品数:42 被引量:103H指数:6
供职机构:中国科学技术大学信息科学技术学院电子科学与技术系更多>>
发文基金:国家自然科学基金安徽省自然科学基金江苏省“六大人才高峰”高层次人才项目更多>>
相关领域:电子电信自动化与计算机技术更多>>

文献类型

  • 39篇中文期刊文章

领域

  • 31篇电子电信
  • 9篇自动化与计算...

主题

  • 13篇话者确认
  • 10篇语音
  • 10篇说话人确认
  • 10篇文本无关
  • 7篇高斯
  • 7篇GMM
  • 6篇说话人识别
  • 6篇SVM
  • 5篇支持向量
  • 5篇支持向量机
  • 5篇向量
  • 5篇向量机
  • 5篇混合模型
  • 5篇高斯混合
  • 5篇高斯混合模型
  • 4篇声音转换
  • 3篇音频
  • 3篇语音识别
  • 3篇鲁棒
  • 3篇鲁棒性

机构

  • 39篇中国科学技术...
  • 2篇中国电子科技...
  • 1篇深圳大学
  • 1篇浙江理工大学
  • 1篇浙江师范大学
  • 1篇中国地质大学

作者

  • 39篇戴蓓蒨
  • 17篇李辉
  • 7篇刘青松
  • 5篇周曦
  • 5篇孙俊
  • 5篇陆伟
  • 4篇姚志强
  • 4篇张剑
  • 4篇刘明辉
  • 4篇吴礼福
  • 4篇解焱陆
  • 4篇许东星
  • 3篇陈雁翔
  • 3篇许敏强
  • 2篇王海祥
  • 2篇吴德辉
  • 2篇陈继旭
  • 2篇黄伟
  • 1篇于俊朋
  • 1篇上官葳

传媒

  • 11篇中国科学技术...
  • 10篇数据采集与处...
  • 6篇模式识别与人...
  • 4篇电路与系统学...
  • 2篇信号处理
  • 1篇电子与信息学...
  • 1篇计算机工程
  • 1篇兰州大学学报...
  • 1篇信息与控制
  • 1篇小型微型计算...
  • 1篇现代雷达

年份

  • 1篇2011
  • 3篇2010
  • 7篇2009
  • 5篇2008
  • 7篇2007
  • 3篇2006
  • 5篇2005
  • 3篇2004
  • 3篇2003
  • 1篇1991
  • 1篇1990
42 条 记 录,以下是 1-10
排序方式:
声码器半解码参数用于说话人身份确认被引量:3
2005年
面向通信领域广泛使用的线性预测声码器,设计了一种不经过“解码-特征提取”过程,而直接由传输码流截取说话人特征的方法,并针对宽带自适应多码率声码器(AMRWB)建立了与文本无关的话者确认系统.系统采用基于概率统计模型的GMMUBM结构,以LPC倒谱作为主要的话者特征矢量,并加入基音衍生参数以提高确认性能.实验表明,该系统在运算速度提高一个数量级的情况下,达到了与基于重建语音的话者确认系统相接近的性能,且对码率失配具有良好的鲁棒性.
李晓先戴蓓蒨李辉
关键词:话者确认基音频率
基于HMM-UBM和短语音的说话人身份确认被引量:2
2004年
提出了一种简单有效的与说话人有关的阈值设置方法 ,同时在确认系统中采用高斯混合模型(GMM)作为背景模型来模拟未知的冒认者的语音 ,在冒认文本多样化的情况下获得了比用隐马尔可夫模型(HMM)作背景模型更好的性能 .本文在此基础上实现了一个基于Internet的与文本有关的远程语音身份认证系统 ,在实验测试和应用测试中均获得了满意的确认性能 .
李霄寒黄南晨戴蓓蒨姚志强
关键词:说话人确认
基于GMM多维概率输出的SVM话者确认被引量:2
2008年
提出一种结合统计模型与区分性模型优点的说话人确认方法:基于GMM多维概率输出的SVM话者模型的说话人确认.以目标说话人的GMM模型对一条语音的不同特征分量的概率输出作为特征参数,建立目标说话人的SVM模型.在NIST’05 8conv4w-lconv4w数据库上的实验表明该方法的有效性.
刘明辉戴蓓蒨解焱陆
关键词:说话人确认文本无关
结合谱减和缺失特征重建的鲁棒性话者识别被引量:2
2009年
针对加性噪声影响下文本无关说话人识别系统性能急剧下降的问题,提出谱减和缺失特征重建相结合的方法。该方法将被噪声严重污染的频段称为缺失特征,采用谱减法对语音信号进行前端处理,并检测缺失特征;利用基于聚类的重建方法,由可靠特征估计缺失特征。在YOHO数据库上信噪比(SNR)为5~20dB的实验表明,相对于单独的谱减法和缺失特征重建方法,该方法的识别性能有显著提高。
王宁陆伟戴蓓蒨李辉
关键词:说话人识别谱减鲁棒性
基于多微商核函数的SVM话者确认
2011年
给出了一种基于多微商核函数(MDK)的结合高斯混合模型(GMM)和支持向量机(SVM)的方法,并应用于SVM文本无关话者确认。从GMM话者语音特征概率分布出发,用多阶微商描述GMM概率分布,将GMM和SVM结合的问题转化为用多阶微商建立SVM话者模型的问题。首先对说话人语音进行基于因子分析的参数域失配补偿,用GMM描述失配补偿后的话者语音特征的概率分布;然后对GMM求多阶微商;最后构建多微商核函数,建立多SVM话者模型。在NIST’01 2min-1min话者确认数据库上的实验表明,基于多微商核函数的SVM话者确认系统性能优于基于失配补偿的GMM系统,也比基于失配补偿的Fisher核函数SVM话者系统和基于失配补偿的Kullback-Leibler(KL)距离SVM话者系统有较大的提高。
许敏强戴蓓蒨刘青松许东星
关键词:话者确认支持向量机
基于TZ Normalization规整的话者确认阈值选取被引量:6
2005年
针对说话人确认中,各目标话者模型输出评分分布不一致而导致系统确认阈值设置的困难,本文采取了通过评分规整确定系统最小检测代价函数(DCF)确认阈值的方法。在分析了已有的两种评分规整方法Z norm a l-ization和T norm a lization的基础上,提出了一种结合两者优点的组合规整方法——TZ norm a lization,并据此给出了一种阈值动态修正方法,有效地提高了系统的性能和阈值选取的鲁棒性。对历年的N IST(手机电话语音)评测语料库进行了实验,表明了该方法的有效性。
刘明辉陈继旭戴蓓蒨李辉
关键词:说话人确认NORMALIZATION
一种用于鲁棒性说话人确认的分段概率分布参数规整方法
2008年
目前与文本无关的话者确认系统大都是基于GMM-UBM模型结构的,为了精确的描述说话人语音特征空间的分布,模型混合度M通常都选的很大,因而模型训练需要大量的语音数据。本文提出了一种基于分段估计概率分布函数的规整方法,在概率分布的意义上降低特征参数偏离高斯分布的程度,从而可以用较低混合度的高斯混合模型对其建模。同时,这种映射也是一种无监督规整,因此可以提高系统的鲁棒性及其确认性能。在NIST'03数据库上的实验表明,在使用相同混合度模型的情况下,概率分布规整后的参数相对于变换前的参数系统性能可以提高11%左右。
解焱陆刘青松戴蓓蒨李辉
关键词:高斯分布MFCC说话人确认
基于共振峰参数和分类线性加权的源-目标声音转换被引量:1
2006年
源-目标说话人声音转换是一种变换说话人声音特征的技术,它将源说话人的声音转换成目标说话人的声音.其中,声道参数的转换是获得高质量重建语音的关键,所以选择声道共振峰参数作为待转换的特征参数,利用线性预测求根法提取共振峰参数.为了克服分类线性转换算法(CLT)中分类不准带来的误差,引入了分类线性加权转换的策略,给出了一种基于径向基函数神经网络的分类线性加权转换算法(WCLT).在微软汉语普通话语音数据库上对转换语音分别作了客观和主观评估,验证了分类数目和训练集对两种转换算法的影响.实验结果表明,WCLT算法的转换效果优于CLT算法,一定程度上克服了高斯混合模型的转换算法(GMM)转换语音时,频谱过分光滑的现象,并在只有较少训练集数据时也能得到较好的转换效果.
王海祥戴蓓蒨陆伟张剑
关键词:声音转换径向基函数神经网络
基于最小统计噪声估计的信号子空间语音增强被引量:7
2007年
针对传统子空间方法中,采用语音活动检测(Voice activity detection,VAD)估计噪声的缺陷,提出了一种基于子空间域的最小统计噪声估计算法。噪声估计通过跟踪带噪语音协方差矩阵用每个特征向量上的特征值的最小值来获得,该方法不需要VAD明确区分语音段和噪声段,能够在整个信号期间实现噪声的连续估计和不断更新。实验结果表明,相对于传统的基于VAD的子空间方法,本文提出的算法对语音增强效果有非常显著的提高。
赵胜跃戴蓓蒨
关键词:语音增强噪声估计信号子空间
用于文本无关的话者识别的超音段信息提取被引量:2
2005年
提出一种可用于较少语音数据量的文本无关的超音段信息提取方法。通过对基音和能量的轨迹动态分段,提取超音段信息,并使用异方差线性区分分析(HLDA)进行参数优化,克服超音段信息提取对数据量大小的依赖,同时采用混合高斯-统一背景(GMM-U BM)模型结构,建立文本无关话者识别系统。在N IST′01数据库上的实验表明,该系统性能优于基于短时帧的音源信息参数系统,更重要的是不需要大数据量的支持,且与基于短时帧倒谱参数的话者识别系统融合后,系统识别性能明显改善,等误识率相对下降10%。
姚志强吴礼福戴蓓蒨周曦
关键词:话者确认基音文本无关
共4页<1234>
聚类工具0