搜索到2408篇“ 连续语音识别“的相关文章
一种连续语音识别的空调控制方法、装置及计算机存储介质
本发明公开了一种连续语音识别的空调控制方法、装置及计算机存储介质,涉及空调控制技术领域,空调控制方法包括:获取语音识别单元上传的用户语音数据集,其中包含针对目标空调的语音命令数据;将这些数据输入到预先训练好的用户语音识别...
郭海峰明玥郑源
一种连续语音识别的特征缩减方法
一种连续语音识别的特征缩减方法,包括如下步骤:步骤1.准备训练集,计算语音特征维度均值;步骤2.使用倒谱均值归一化在单一语音样本的特征上减去倒谱系数特征的均值,剔除离群数据;步骤3.在剔除离散特征分布的数据后,使用全局特...
游萌高君效
基于深度学习的连续语音识别
随着半导体设计和制造技术的发展,计算机算力凭借硬件基础得到快速提高,连续语音识别领域的相关技术也得到快速突破。近些年在科研人员的不懈探索下,已有基于深度学习的网络架构被成功应用到语音识别系统中,但是语音识别任务在特征信息...
朱洋
关键词:连续语音识别声学模型
双通道解码的端到端连续语音识别
2024年
在端到端连续语音识别系统中,完全基于自注意力机制的Transformer模型相比传统的混合模型提高了准确率。Conformer模型是在Transformer模型基础上增加一个擅长提取局部特征的卷积模块,将该模型作为整个识别系统的编码器,解码器使用注意力机制,注意力模型只适合短句子识别,并且在数据集存在噪声时会导致网络训练不稳定,添加CTC模型的序列对齐特性辅助训练来帮助模型收敛更快。针对单通道解码可在识别准确率上进一步优化的问题,提出了CTC与Attention双通道解码模型,将双通道解码与单一的CTC解码和单一的Attention解码进行对比验证,结果表明双通道解码在识别性能上提升了1%。针对在噪声环境下识别效果降低的问题,提出对端到端网络添加语言模型的方法。将N-gram语言模型加入网络中进行验证,结果表明在信噪比为10 dB的高噪声环境下,语言模型能够使字错率下降3.5%,提高了语音识别系统的鲁棒性。
朱洋曾庆宁赵学军
关键词:语音识别解码器端到端双通道语言模型
基于改进卷积神经网络的汉语连续语音识别方法
2023年
根据当前的识别需求及标准,提取语音识别基元,采用多目标的方式,提高识别的效率,布设交叉多目标识别矩阵,同时改进卷积神经网络连续语音识别模型,采用动态识别规整完成语音识别处理。测试结果表明,与传统面向健壮自动汉语连续语音识别测试组和传统基于改进多带谱减汉语连续语音识别测试组相比,所设计的改进卷积神经网络汉语连续语音识别测试组语音误识率被较好地控制在20%以下,说明在改进卷积神经网络的辅助下,语音识别效果明显改善,针对性更强,具有实际的应用价值。
高适金宇黄宇
关键词:汉语语音连续语音语音识别识别方法
让人工神经网络学习语音识别(3) 探索连续语音识别的奥秘
2023年
如果不满足仅仅用语音控制机器,而是希望和语音助手、对话机器人进行语言交流,表达比较复杂的语义甚至情感,那么对基于孤立词语音识别技术的模型来说就太难了。想打造类似Windows操作系统或智能手机语音助手那样的语音识别系统,对于爱好者而言确实力不从心,因为获取海量语音语料就是一座不可逾越的高山。
赵竞成胡博扬
关键词:WINDOWS操作系统连续语音识别语音识别系统孤立词语音识别
低资源少样本连续语音识别最新进展被引量:4
2023年
低资源少样本语音识别是目前语音识别行业面临的迫切技术需求。首先,总结了低资源连续语音识别技术的框架技术,重点介绍了低资源语音在特征提取、声学建模和资源扩展等方面的若干关键技术研究进展。其次,在连续语音识别框架技术发展的基础上,重点阐述了生成对抗网络、自监督表示学习、深度强化学习和元学习等高级深度学习技术在解决少样本语音识别方面的最新发展,如FGSM、wav2vec、AMS等代表性方法。在此基础上,分析了目前该技术面临的互补有限、数据和任务不均衡与模型轻量化部署问题。最后,对低资源少样本连续语音识别进行了总结,提出未来少样本训练识别的研究方向可以朝着先验信息引入、假设空间约束条件设定等方向进一步研究。
屈丹杨绪魁闫红刚陈雅淇牛铜
关键词:连续语音识别元学习
一种连续语音识别的特征缩减方法
一种连续语音识别的特征缩减方法,包括如下步骤:步骤1.准备训练集,计算语音特征维度均值;步骤2.使用倒谱均值归一化在单一语音样本的特征上减去倒谱系数特征的均值,剔除离群数据;步骤3.在剔除离散特征分布的数据后,使用全局特...
游萌高君效
一种高精度连续语音识别的声学模型训练方法
本发明属于语音识别技术领域,公开了一种高精度连续语音识别的声学模型训练方法,包括如下步骤:步骤1.准备训练语料并提取语音特征;步骤2:计算声学模型;步骤3.声学模型初始化,步骤4.根据步骤4确定的训练迭代次数对步骤4的初...
游萌高君效
越南语连续语音识别系统关键技术研究及实现
语音识别就是利用计算机将语音波形信号转化为文字信号,近些年来随着深度学习的进步,这项技术得到了快速的发展,语音信号的识别率得到了很大的提升。在工业、通信、汽车电子等方面得到了广泛的应用。随着近年来中越关系的升温,对越南语...
刘佳文
关键词:越南语语音识别隐马尔可夫模型端到端转换器

相关作者

王作英
作品数:185被引量:517H指数:11
供职机构:清华大学信息科学技术学院电子工程系
研究主题:语音识别 语言模型 连续语音识别 HMM 汉语
吴文虎
作品数:110被引量:477H指数:12
供职机构:清华大学信息科学技术学院计算机科学与技术系
研究主题:语音识别 口语对话系统 汉语 连续语音识别 语音信号处理
蒋冬梅
作品数:66被引量:68H指数:5
供职机构:西北工业大学
研究主题:动态贝叶斯网络 语音识别 情感识别 连续语音识别 DBN
屈丹
作品数:106被引量:293H指数:9
供职机构:解放军信息工程大学
研究主题:语音识别 语言辨识 高斯混合模型 连续语音识别 神经网络
郭军
作品数:213被引量:812H指数:17
供职机构:北京邮电大学
研究主题:语音识别 爬虫系统 文字识别 模式识别 超链接