搜索到385篇“ 文本无关“的相关文章
- 一种与文本无关的声纹识别方法、装置、电子设备及介质
- 本发明涉及一种与文本无关的声纹识别方法、装置、电子设备及介质,属于生物特征识别技术领域,其中,该方法包括:对获取的声纹信号进行分帧处理,得到多个连续的声纹片段;对多个连续的声纹片段进行预处理后,采用预设Mel频率倒谱系数...
- 张华军 王淑琪张婉莹 罗崇欣
- 文本无关的说话者识别
- 本发明涉及文本无关的说话者识别。自动化助理可以利用文本无关说话者识别模型来验证特定用户说出了口头话语和/或识别说出了口头话语的用户。实施方式可以包括基于特定用户的先前话语自动更新所述特定用户的说话者嵌入。另外或可替代地,...
- 赵璞升迭戈·米伦多·卡萨多伊格纳西奥·洛佩斯·莫雷诺王泉
- 文本无关的说话者识别
- 自动化助理可以利用文本无关说话者识别模型来验证特定用户说出了口头话语和/或识别说出了口头话语的用户。实施方式可以包括基于特定用户的先前话语自动更新所述特定用户的说话者嵌入。另外或可替代地,实施方式可以包括使用由文本无关说...
- 赵璞升迭戈·米伦多·卡萨多伊格纳西奥·洛佩斯·莫雷诺王泉
- 一种文本无关、用户无关的中文手写字迹鉴别系统及方法
- 本发明公开了一种文本无关、用户无关的中文手写字迹鉴别系统及方法,涉及字迹鉴别技术领域内领域,本发明将手写中文字迹鉴别过程系统化,主要目的为解决用户相关算法产生的高计算开销问题、用户无关算法中需要字迹相关信息的不足,同时解...
- 陈希秦梦瑶徐兴文刘芳瑜唐珊
- 一种端到端的文本无关声纹识别方法及系统
- 本发明提供了一种端到端的文本无关声纹识别方法及系统,通过设计基于Sinc函数的滤波器对原始语音样本捕获重要的窄带扬声器特性;然后使用时延神经网络(TDNN)和门控循环单元(GRU)生成不同层次的互补说话人信息的混合神经网...
- 熊盛武字云飞冯莹王旭李涛
- 基于音素辅助的文本无关声纹识别方法、装置以及设备
- 本发明公开了一种基于音素辅助的文本无关声纹识别方法、装置以及设备。本发明分析了现有的文本无关声纹识别技术的缺陷,提出在音素信息上统计帧级别声纹信息分布,并与帧级别特征的第一统计信息进行结合,以此补偿第一统计信息中缺失的个...
- 张学阳高天
- 面向中文短语音的文本无关说话人确认新框架
- 2024年
- 相较于文本相关说话人确认,文本无关说话人确认由于验证文本内容不受限制,结合语音识别能够有效避免录音欺诈等常见攻击。然而,文本无关说话人确认系统在短语音验证上会出现严重的性能下降。为此,文章首先提出了一种改进的端到端模型,通过长、短语音说话人分类损失增强网络对不同时长语音段的说话人分类识别能力;同时,在嵌入码空间中增大同一说话人的短语音和长语音之间的相似度,减小不同说话人的短语音之间的相似度,增强网络对短语音的特征提取能力。此外,还提出了一种基于注意力机制的验证词选择方法,选择具有高注意力权重的中文词作为系统验证提示词。实验结果表明,文章提出的改进的端到端模型结合softmax预训练使得模型在短测试语音上的等错误率相对降低29%,基于注意力机制的验证词选择方法也能筛选出具有更好识别结果的验证词,二者结合能够有效提升说话人确认系统对于短中文语音的识别性能。
- 毛海全冯海泓洪峰马皓天徐楚林郑立通
- 关键词:说话人确认
- 一种基于LDA的文本无关声纹识别方法
- 本发明涉及一种基于LDA的文本无关声纹识别方法,包括:S1,提取待识别语音样本的声学特征序列,计算所述声学特征序列在预先构建的声学特征分布空间中的分布特征矢量;S2,对所述分布特征矢量进行模规整,使用LDA对模规整后的分...
- 贺前华吴克乾危卓
- 基于深度学习的文本无关说话人识别方法研究
- 说话人识别技术是一种利用说话人语音特征的差异来区分不同说话人的身份的技术。如今随着5G时代的到来,该技术在手机语音助手,智能家居等方面得到了广泛应用。随着人工智能技术的不断发展,基于深度学习的说话人识别成为研究者们的热门...
- 刘悦茹
- 关键词:说话人识别
- 基于深度学习的文本无关多标号说话人识别方法
- 本发明公开了一种基于深度学习的文本无关多标号说话人识别方法。该方法包括以下步骤:(1)将训练数据集中每个说话人的语音平均分成N份,每份标记上不同的标号;(2)构建相应的神经网络模型,并保证输出层维度与训练数据集标号数一致...
- 邓克琦卢晶
相关作者
- 戴蓓蒨

- 作品数:42被引量:103H指数:6
- 供职机构:中国科学技术大学信息科学技术学院电子科学与技术系
- 研究主题:话者确认 说话人确认 文本无关 GMM 高斯混合模型
- 张庆芳

- 作品数:50被引量:54H指数:3
- 供职机构:苏州经贸职业技术学院
- 研究主题:说话人识别 文本无关 单片机 高职 矢量量化
- 赵鹤鸣

- 作品数:279被引量:838H指数:14
- 供职机构:苏州大学
- 研究主题:耳语音 语音增强 语音识别 语音 神经网络
- 马占宇

- 作品数:119被引量:183H指数:6
- 供职机构:北京邮电大学
- 研究主题:图像 存储介质 电子设备 图像分类 细粒度
- 邓浩江

- 作品数:160被引量:491H指数:9
- 供职机构:中国科学院声学研究所
- 研究主题:信息隐藏 副本放置 副本 多核网络处理器 推荐系统