搜索到3264篇“ 中文分词“的相关文章
一种基于动态规划的中文分词方法
本发明公开了一种基于动态规划的中文分词方法,涉及自然语言处理技术领域,步骤S1,获取至少一个中文文本信息,分析中文文本信息的基本属性;步骤S2,收集所有词语构建基本词库,将各个领域的常用名字划分,并将常用词语划分为高频词...
邓志滔闫旭东
中文分词方法、装置、设备及存储介质
本发明实施例提供一种中文分词方法、装置、设备及存储介质。方法包括:获取目标文本,并对所述目标文本分别进行句法分析以及语义依存分析,得到对应的句法分析结果以及语义依存分析结果;对所述目标文本、所述句法分析结果以及所述语义依...
于凤英王健宗程宁
一种基于动态规划的中文分词方法
本发明公开了一种基于动态规划的中文分词方法,涉及自然语言处理技术领域,步骤S1,获取至少一个中文文本信息,分析中文文本信息的基本属性;步骤S2,收集所有词语构建基本词库,将各个领域的常用名字划分,并将常用词语划分为高频词...
邓志滔闫旭东
基于散列表和二叉查找树的中文分词方法、设备及介质
本申请公开了基于散列表和二叉查找树的中文分词方法、设备及介质,方法包括:获取待分词语句,并确定待分词语句中的首个字符,根据首个字符对应的第一unicode编码,确定其在预设的首字散列表中的索引值;确定待分词语句对应的字符...
张春德杨泉林魏文凤盛建鲁张建付港
中文分词的方法、装置及电子设备
本申请提供了一种中文分词的方法、装置、电子设备及存储介质,所述方法包括:通过获取待分词文本及领域词典,利用领域词典对待分词文本构建词图;利用预设分词模型对待分词文本进行分词处理,并依据得到的第一分词结果对词图进行修正;依...
叶松林王天祥刘楚雄胡昌菊
基于频繁项的中文分词边界修正方法
本发明涉及基于频繁项的中文分词边界修正方法。传统的基于词典的中文分词方法严格依赖于词典的质量,无法对未登录词进行识别。本发明从规范标准中抽取术语作为词典;将待处理的地铁设计规范文本作为输入文本S1,进行逆向最大匹配处理,...
任晓春王玮谢斯张雨朱磊
中文分词方法、电子装置及可读存储介质
本发明涉及数据分析技术领域,具体提供一种基于卷积神经网络模型的中文分词方法、电子装置及可读存储介质,该卷积神经网络模型的第四层卷积层构建有注意力机制,注意力机制用于调整各通道权重。本发明提供的中文分词方法,首先获取字向量...
金戈徐亮
中文分词的方法、装置及计算机设备
本申请公开了一种中文分词的方法、装置及计算机设备,涉及计算技术领域,可以解决在进行中文分词时,对基于分词离散序列预测的中文分词效果不佳,且分词成本较高的问题。其中方法包括:训练搭建符合预设标准的分词序列生成模型;利用所述...
陈梦霏
一种特种设备维护问答系统的中文分词方法
本发明公开了一种特种设备维护问答系统的中文分词方法,属于数据处理技术领域,包括:S1、构建特种设备维护问答系统中中文分词的训练数据集;S2、对训练数据集中的文本预处理,并定义其分词标签;S3、利用定义分词标签的训练数据集...
张展彬
基于多任务学习的多标准中文分词方法
本发明公开一种基于多任务学习的多标准中文分词方法,涉及自然语言处理技术领域。本发明充分利用不同标准的分词语料,将多个数据集共同训练充分学习其共享信息以提高OOV召回率;输入多个具有不同分词标准的数据集;利用BERT预训练...
黄于欣罗高生刘朋

相关作者

张旻
作品数:239被引量:225H指数:6
供职机构:杭州电子科技大学
研究主题:自适应能力 文本 向量 句子 图像
姜明
作品数:260被引量:450H指数:9
供职机构:杭州电子科技大学
研究主题:自适应能力 文本 图像 向量 句子
龙华
作品数:574被引量:482H指数:9
供职机构:昆明理工大学信息工程与自动化学院
研究主题:语种识别 包装盒 语音 相似度 文本
车万翔
作品数:91被引量:907H指数:13
供职机构:哈尔滨工业大学
研究主题:语义角色标注 中文信息处理 中文 中文分词 依存句法分析
刘挺
作品数:378被引量:3,794H指数:32
供职机构:哈尔滨工业大学
研究主题:自然语言处理 中文 中文信息处理 文本 计算机应用