搜索到3494篇“ 自动语音识别“的相关文章
- 基于回音消除的自动语音识别方法和装置
- 本发明提供一种基于回音消除的自动语音识别方法和装置,包括:提取待识别语音信息的音频部分,并利用预设语音识别技术进行语音识别,得到语音识别结果;利用预设向量化算法将所述语音识别结果进行向量化,得到目标向量;利用预先构建的向...
- 查锦发
- 解决基于感知的对抗音频攻击的自动语音识别系统
- 本发明涉及解决基于感知的对抗音频攻击的自动语音识别系统。一种用于在语音识别系统中产生组合音频信号的计算机实施的方法,方法包括以下步骤:对音频输入信号进行采样,以生成时域采样的输入信号,然后将时域采样的输入信号转换为频域输...
- 杰里米·科尔特约瑟夫·苏里
- 自动语音识别中的词语增强
- 提供了用于执行自动语音识别的系统和方法。所述系统和方法执行操作,所述操作包括:访问包括多个n元组的语言模型,多个n元组中的每一个包括相应的词语序列和对应的LM分数;在语言模型中选择要增强的目标词语;接收针对目标词语的增强...
- 雅各布·阿萨艾伦·贝克尔扎克·摩西
- 面向自动语音识别系统的对抗样本生成方法
- 2025年
- 通过对系统进行对抗攻击可以检测系统漏洞,进而提高系统鲁棒性。然而,对抗攻击前往往需要系统的参数信息,这使得攻击条件受限。为此,结合一种新的量子粒子群优化算法,提出一种黑盒有目标对抗攻击方法。该方法通过在原始样本中添加微小噪声,构造差异化粒子群,作为初始对抗样本种群;基于记忆搜索的领域重分布策略得到当前种群的全局最优粒子,从而生成初始对抗样本;融入扩维和自适应权重位置更新,使得种群更接近目标;根据对抗样本与目标语句的编辑距离,继续优化初始对抗样本,生成最终对抗样本。为了验证方法的攻击效果,在GoogleSpeech、LibriSpeech以及CommonVoice数据集上,对语音识别模型DeepSpeech进行实验,将目标语句设置为不同场景中的常见语音指令。实验结果表明,提出的方法在三个数据集上成功率都优于对比方法,其中在Common Voice数据集上的成功率比对比方法提升了10个百分点。同时,召集志愿者对生成的对抗样本噪声强度进行主观评估,其中82.4%的对抗样本被志愿者判断为没有噪声或噪声很小。
- 于振华苏玉璠叶鸥丛旭亚
- 关键词:语音识别量子粒子群算法
- 多语种自动语音识别方法、装置、计算机设备及存储介质
- 本申请实施例属于人工智能领域,涉及一种多语种自动语音识别方法,包括对输入语音进行处理,得到语音嵌入向量序列;基于预训练的ByT5模型的编码器提取语音嵌入向量序列的特征,得到语音嵌入向量序列的比特编码;将语音嵌入向量序列的...
- 李俊杰刘航驿陈闽川王少军
- 一种基于图论的Transformer自动语音识别模型的性能分析方法
- 本发明涉及一种基于图论的Transformer自动语音识别模型的性能分析方法,属于人工智能与语音识别领域。包括:获取Transformer自动语音识别模型,获取音频数据;将音频数据输入Transformer自动语音识别模...
- 张欣陈芸张雨桐张艺颖钟天阳谢松云谢辛舟
- 一种自动语音识别方法和系统
- 本发明提供一种自动语音识别方法和系统,包括:采集并预处理原始音频信号;从预处理后的原始音频信号中提取信号特征;将信号特征转换为特征序列;基于连接时序分类解码器,利用特征序列生成第一结果;并基于注意力机制解码器,利用特征序...
- 杜量肖清马志豪许程冲黄莉梅李向欢
- 一种用于电网通信调度的自动语音识别方法及系统
- 本发明提供了一种用于电网通信调度的自动语音识别方法及系统,涉及语音识别技术领域。方法包括:获取用于电网通信调度的待识别语音数据并进行分段处理,得到多个待识别语音段落并输入到第一语音识别模型中,生成第一语音识别结果;计算每...
- 韩汶朔尤新雨张文博丁闯尹丽然韩思思陈锡瑞韩续李江曼魏涛郭沈阳
- 自动语音识别模型建立方法、语音识别方法及相关设备
- 本公开提供了一种自动语音识别模型建立方法、语音识别方法及相关设备,涉及语音识别技术领域。该方法包括获取训练数据集中的多个训练样本作为训练样本组和目标领域的多个语音数据;根据第一自动语音识别模型对各个训练样本和多个语音数据...
- 李思琪范璐吴友政何晓冬
- 一种针对语音唤醒后提升自动语音识别准确率的方法
- 本发明涉及智能语音交互技术领域,且公开了一种针对语音唤醒后提升自动语音识别准确率的方法,将N个语音采集设备以间距d线性排列构成语音采集模块,N为大于等于2的正整数,将采集到的多通道带噪语音数据经傅里叶变换后输入固定波束形...
- 尹钧赵亚丽缪炜
相关作者
- 徐波

- 作品数:439被引量:857H指数:15
- 供职机构:中国科学院自动化研究所
- 研究主题:语音识别 语音 电子设备 中文信息处理 语言模型
- 浦剑涛

- 作品数:41被引量:50H指数:3
- 供职机构:北京联合大学
- 研究主题:诊断信息 语音识别 非特定人 孤立词 自动语音识别
- 蔡铁

- 作品数:110被引量:118H指数:5
- 供职机构:深圳信息职业技术学院
- 研究主题:图像 语音识别 支持向量机 车联网 离散化
- 王建荣

- 作品数:173被引量:94H指数:6
- 供职机构:天津大学
- 研究主题:链系统 区块 语音 区块链 文本
- 岳帅

- 作品数:38被引量:0H指数:0
- 供职机构:深圳市腾讯计算机系统有限公司
- 研究主题:语音 声学模型 解码 标点 声纹