戴蓓蒨 作品数:42 被引量:103 H指数:6 供职机构: 中国科学技术大学信息科学技术学院电子科学与技术系 更多>> 发文基金: 国家自然科学基金 安徽省自然科学基金 江苏省“六大人才高峰”高层次人才项目 更多>> 相关领域: 电子电信 自动化与计算机技术 更多>>
声码器半解码参数用于说话人身份确认 被引量:3 2005年 面向通信领域广泛使用的线性预测声码器,设计了一种不经过“解码-特征提取”过程,而直接由传输码流截取说话人特征的方法,并针对宽带自适应多码率声码器(AMRWB)建立了与文本无关的话者确认系统.系统采用基于概率统计模型的GMMUBM结构,以LPC倒谱作为主要的话者特征矢量,并加入基音衍生参数以提高确认性能.实验表明,该系统在运算速度提高一个数量级的情况下,达到了与基于重建语音的话者确认系统相接近的性能,且对码率失配具有良好的鲁棒性. 李晓先 戴蓓蒨 李辉关键词:话者确认 基音频率 基于HMM-UBM和短语音的说话人身份确认 被引量:2 2004年 提出了一种简单有效的与说话人有关的阈值设置方法 ,同时在确认系统中采用高斯混合模型(GMM)作为背景模型来模拟未知的冒认者的语音 ,在冒认文本多样化的情况下获得了比用隐马尔可夫模型(HMM)作背景模型更好的性能 .本文在此基础上实现了一个基于Internet的与文本有关的远程语音身份认证系统 ,在实验测试和应用测试中均获得了满意的确认性能 . 李霄寒 黄南晨 戴蓓蒨 姚志强关键词:说话人确认 基于GMM多维概率输出的SVM话者确认 被引量:2 2008年 提出一种结合统计模型与区分性模型优点的说话人确认方法:基于GMM多维概率输出的SVM话者模型的说话人确认.以目标说话人的GMM模型对一条语音的不同特征分量的概率输出作为特征参数,建立目标说话人的SVM模型.在NIST’05 8conv4w-lconv4w数据库上的实验表明该方法的有效性. 刘明辉 戴蓓蒨 解焱陆关键词:说话人确认 文本无关 结合谱减和缺失特征重建的鲁棒性话者识别 被引量:2 2009年 针对加性噪声影响下文本无关说话人识别系统性能急剧下降的问题,提出谱减和缺失特征重建相结合的方法。该方法将被噪声严重污染的频段称为缺失特征,采用谱减法对语音信号进行前端处理,并检测缺失特征;利用基于聚类的重建方法,由可靠特征估计缺失特征。在YOHO数据库上信噪比(SNR)为5~20dB的实验表明,相对于单独的谱减法和缺失特征重建方法,该方法的识别性能有显著提高。 王宁 陆伟 戴蓓蒨 李辉关键词:说话人识别 谱减 鲁棒性 基于多微商核函数的SVM话者确认 2011年 给出了一种基于多微商核函数(MDK)的结合高斯混合模型(GMM)和支持向量机(SVM)的方法,并应用于SVM文本无关话者确认。从GMM话者语音特征概率分布出发,用多阶微商描述GMM概率分布,将GMM和SVM结合的问题转化为用多阶微商建立SVM话者模型的问题。首先对说话人语音进行基于因子分析的参数域失配补偿,用GMM描述失配补偿后的话者语音特征的概率分布;然后对GMM求多阶微商;最后构建多微商核函数,建立多SVM话者模型。在NIST’01 2min-1min话者确认数据库上的实验表明,基于多微商核函数的SVM话者确认系统性能优于基于失配补偿的GMM系统,也比基于失配补偿的Fisher核函数SVM话者系统和基于失配补偿的Kullback-Leibler(KL)距离SVM话者系统有较大的提高。 许敏强 戴蓓蒨 刘青松 许东星关键词:话者确认 支持向量机 基于TZ Normalization规整的话者确认阈值选取 被引量:6 2005年 针对说话人确认中,各目标话者模型输出评分分布不一致而导致系统确认阈值设置的困难,本文采取了通过评分规整确定系统最小检测代价函数(DCF)确认阈值的方法。在分析了已有的两种评分规整方法Z norm a l-ization和T norm a lization的基础上,提出了一种结合两者优点的组合规整方法——TZ norm a lization,并据此给出了一种阈值动态修正方法,有效地提高了系统的性能和阈值选取的鲁棒性。对历年的N IST(手机电话语音)评测语料库进行了实验,表明了该方法的有效性。 刘明辉 陈继旭 戴蓓蒨 李辉关键词:说话人确认 NORMALIZATION 一种用于鲁棒性说话人确认的分段概率分布参数规整方法 2008年 目前与文本无关的话者确认系统大都是基于GMM-UBM模型结构的,为了精确的描述说话人语音特征空间的分布,模型混合度M通常都选的很大,因而模型训练需要大量的语音数据。本文提出了一种基于分段估计概率分布函数的规整方法,在概率分布的意义上降低特征参数偏离高斯分布的程度,从而可以用较低混合度的高斯混合模型对其建模。同时,这种映射也是一种无监督规整,因此可以提高系统的鲁棒性及其确认性能。在NIST'03数据库上的实验表明,在使用相同混合度模型的情况下,概率分布规整后的参数相对于变换前的参数系统性能可以提高11%左右。 解焱陆 刘青松 戴蓓蒨 李辉关键词:高斯分布 MFCC 说话人确认 基于共振峰参数和分类线性加权的源-目标声音转换 被引量:1 2006年 源-目标说话人声音转换是一种变换说话人声音特征的技术,它将源说话人的声音转换成目标说话人的声音.其中,声道参数的转换是获得高质量重建语音的关键,所以选择声道共振峰参数作为待转换的特征参数,利用线性预测求根法提取共振峰参数.为了克服分类线性转换算法(CLT)中分类不准带来的误差,引入了分类线性加权转换的策略,给出了一种基于径向基函数神经网络的分类线性加权转换算法(WCLT).在微软汉语普通话语音数据库上对转换语音分别作了客观和主观评估,验证了分类数目和训练集对两种转换算法的影响.实验结果表明,WCLT算法的转换效果优于CLT算法,一定程度上克服了高斯混合模型的转换算法(GMM)转换语音时,频谱过分光滑的现象,并在只有较少训练集数据时也能得到较好的转换效果. 王海祥 戴蓓蒨 陆伟 张剑关键词:声音转换 径向基函数神经网络 基于最小统计噪声估计的信号子空间语音增强 被引量:7 2007年 针对传统子空间方法中,采用语音活动检测(Voice activity detection,VAD)估计噪声的缺陷,提出了一种基于子空间域的最小统计噪声估计算法。噪声估计通过跟踪带噪语音协方差矩阵用每个特征向量上的特征值的最小值来获得,该方法不需要VAD明确区分语音段和噪声段,能够在整个信号期间实现噪声的连续估计和不断更新。实验结果表明,相对于传统的基于VAD的子空间方法,本文提出的算法对语音增强效果有非常显著的提高。 赵胜跃 戴蓓蒨关键词:语音增强 噪声估计 信号子空间 用于文本无关的话者识别的超音段信息提取 被引量:2 2005年 提出一种可用于较少语音数据量的文本无关的超音段信息提取方法。通过对基音和能量的轨迹动态分段,提取超音段信息,并使用异方差线性区分分析(HLDA)进行参数优化,克服超音段信息提取对数据量大小的依赖,同时采用混合高斯-统一背景(GMM-U BM)模型结构,建立文本无关话者识别系统。在N IST′01数据库上的实验表明,该系统性能优于基于短时帧的音源信息参数系统,更重要的是不需要大数据量的支持,且与基于短时帧倒谱参数的话者识别系统融合后,系统识别性能明显改善,等误识率相对下降10%。 姚志强 吴礼福 戴蓓蒨 周曦关键词:话者确认 基音 文本无关