搜索到751篇“ 语种识别“的相关文章
一种语种识别方法及装置
本发明公开了一种语种识别方法和装置,其中,上述的语种识别方法,包括如下步骤:S1)对待识别语音信号按帧分别提取fbank特征和mfcc特征;S2)判断每帧是属于静音还是语音;S3)将属于语音的那些帧的fbank特征按照时...
薛文韬冯安洋张杰惠寅华孙暐
一种流式音频语种识别方法及系统
本发明公开的一种流式音频语种识别方法及系统,属于语种识别技术领域。本发明实现方法为:1、利用语音活性检测方法对原始音频数据进行预处理,得到语种识别训练数据;2、对语种识别训练数据进行特征提取;3、构建编码器解码器模型并进...
王旭东周吴夏朗杜晓祥
语种识别方法、装置、设备、介质及产品
本申请实施例提供一种语种识别方法、装置、设备、介质及产品。该方法包括:确定输入内容中的待识别对象;基于输入内容中已识别对象的语言元素等级,依次选择对应的语种对待识别对象进行语种识别,直至得到待识别对象的语种识别结果。该方...
张华正张春晓雷雪娇王恺廉士国
一种图像文字语种识别方法及系统
一种图像文字语种识别方法与系统,该方法通过对真实场景下的图像文字进行模拟,结合背景图片、字典库、词典库及各语种风格字体库,人工合成带标注的图像文字形成第一训练数据集;对真实场景下的图像文字进行搜集,对搜集的图像文字进行人...
姜孟源陈振标杜晓祥
文本行语种识别方法、装置、电子设备
本申请公开了一种文本行语种识别方法,属于计算机视觉技术领域,有助于提升图像中文本行语种识别的准确度。所述方法包括:分别确定目标文本图像中的文本行位置信息和每个像素点匹配的预设文本属性类别的概率值,其中,预设文本属性类别用...
黄荔刘正珍
语种分类模型训练方法、语种识别方法、装置及智能设备
本申请适用于智能语音处理技术领域,提供了一种语种分类模型训练方法、语种识别方法、装置及智能设备。所述语种分类模型训练方法包括:获取第一声学特征,所述第一声学特征是指音频片段的声学特征;将所述音频片段的声学特征依次输入初始...
谢旭康李文鹏
一种基于多任务学习的多语种识别模型的构建和训练方法
本发明涉及一种多任务的语种识别的模型构建方法和训练方法,包括:使用无监督预训练方式对wav2vec模型进行第一次预训练;根据包括语种识别和数据有效识别在内的任务要求建立包含多语种样本数据的训练样本集;采用训练样本集中的样...
陈玮冯少辉张建业
一种语种识别方法及装置
本申请提供了一种语种识别方法及装置。在本申请中,是根据待识别文本中的各个字符的编码获取各个字符的语言标签特征,然后将各个字符的语言标签特征输入语种识别模型中,以使语种识别模型基于各个字符的语言标签特征识别识别文本的语种...
竺晨曦
语种识别方法、装置、电子设备及可读存储介质
本申请涉及人工智能的自然语言处理技术领域,公开了一种语种识别方法、装置、电子设备及可读存储介质,语种识别方法包括:获取待识别的语言文本,确定与语言文本对应的语系类别;将语系类别对应的语种规则信息与语言文本进行匹配;语种规...
阿敏巴雅尔黄申
基于改进R2CNN算法的自然场景文本图像中文字语种识别研究
2025年
在自然场景图片文本分析领域,由于复杂的背景、多样的文本风格以及不同语言文字的相似性,文字识别问题一直是一个挑战。本文在已有的旋转卷积神经网络(R2CNN)算法基础上进行了改进,提出了一种更适应自然场景文本图像中识别语种的有效方法。通过修改区域提议网络(RPN)模型的最小尺寸和特征图池化的尺度大小,使其更加符合实际场景需求;同时,在特征图生成阶段引入了特征融合技术,显著提高了对模糊、较小文本的检测性能。实验结果表明,本方法在公开数据集的分类平均准确率为90.4%,有效解决了自然场景文本图像中语种识别问题。
张峰迪力扎提·伊力哈木
关键词:语种识别自然场景

相关作者

邵玉斌
作品数:523被引量:373H指数:9
供职机构:昆明理工大学信息工程与自动化学院
研究主题:语种识别 语音 相似度 认知无线电 汉字
龙华
作品数:574被引量:482H指数:9
供职机构:昆明理工大学信息工程与自动化学院
研究主题:语种识别 包装盒 语音 相似度 文本
刘加
作品数:221被引量:851H指数:16
供职机构:清华大学
研究主题:语音识别 说话人识别 语种识别 语音 语音信号处理
杜庆治
作品数:383被引量:330H指数:9
供职机构:昆明理工大学信息工程与自动化学院
研究主题:语音 语种识别 相似度 汉字 音频信号处理
张卫强
作品数:79被引量:227H指数:9
供职机构:清华大学信息科学技术学院电子工程系
研究主题:语种识别 语音 语种 计算机设备 语音数据