搜索到65篇“ 中文文本挖掘“的相关文章
- 一种基于深度学习的电力中文文本挖掘方法及装置
- 本发明提出了一种基于深度学习的电力中文文本挖掘方法及装置,包括:对电力故障缺陷文本进行预处理,建立电网本体词典;利用中文文本扩增进行类别平衡化,得到数字化的故障文本,结合集成模型,以神经网络模型为元学习器,以随机森林模型...
- 王同磊李群杨景刚谢天喜蔚超吴鹏邵剑许建刚李建生陆云才石琦梁家碧李晓涵
- 基于中文文本挖掘与自然语言处理的中医药临床实体识别和知识图谱构建
- 中医药历史悠久,治疗成本较低,产生的副作用较小,在治疗一些特定疾病时往往有意想不到的效果。在信息爆炸的时代,中医药领域的文献数据也越来越多,如何通过文本挖掘等技术利用这些数据是挑战,同样也是机遇。目前开源的中医药临床知识...
- 朱骐虓
- 基于中文文本挖掘的邮件过滤系统的设计与实现
- 随着互联网的迅速发展和应用普及,电子邮件的广泛应用给我们的生产和生活带来了相当的便利,但是便利的同时也带来了许多风险,邮件的安全性也受到人们的关注,尤其是在涉及保密等级比较高的单位,针对邮件安全问题本文以文本挖掘的方式,...
- 林文鹏
- 关键词:邮件安全文本挖掘中文分词
- 中文文本挖掘的动态文摘建模方法被引量:1
- 2019年
- 中文文摘是自然语言处理领域的重要研究之一,尤其是基于理解的文摘中对时间特征的研究,更是引起了广泛的关注。本文抽取中文文本摘要的动态特征,进行文本挖掘和建模分析来体现时间特性。通过对中文动态多文档文摘系统框架和句子加权、特征抽取及句子选择等关键步骤的算法设计,实现动态文摘模型,并提出基于动态性能的中文文摘评测方法。实验证明该中文动态文摘技术及其评测算法在实际的文本挖掘过程中,能较好地获得可理解性的、具有时间延展性的摘要,具有一定的可行性和较高的研究价值。
- 刘美玲刘美玲王慧强陈广胜
- 关键词:文本挖掘中文摘要评测方法文本理解
- 中文文本挖掘的流程与工具分析被引量:2
- 2019年
- 文本挖掘技术在各行业的应用价值高、范围广,中文文本跟西方语言相比本身具有很大的特点,因此本文的研究内容是针对于中文文本展开的。首先对文本挖掘的基本含义和状况做了简要概述,对于中文文本挖掘的概念和流程做了详细介绍,对于其中所包含的重点步骤做了详细分析,包括特征提取以及算法等。介绍了R中文本挖掘相关的包,以及CHQ'S文本多分类系统。希望可以加强对于中文文本数据处理与使用的研究。
- 李果
- 关键词:中文文本挖掘
- 面向解决方案的中文文本挖掘平台研究
- 随着互联网技术的飞速发展,网络上“信息爆炸”的问题越来越严重。即信息越丰富,知识越贫乏。信息,作为互联网的核心,只有为用户带来有价值的信息,才能促进互联网的发展,所以,如何在浩瀚的信息海洋中找到有价值的信息,具有广泛的应...
- 李旭东
- 关键词:互联网络中文文本挖掘
- 统计模型在中文文本挖掘中的应用被引量:15
- 2017年
- 本文讨论了中文文本挖掘的三个问题:分词、关键词提取和文本分类。对分词问题,介绍了基于层叠隐马尔可夫模型的ICTCLAS分词法,以及将词与词之间的分隔视为缺失数据并用EM算法求解的WDM方法;对关键词提取问题,提出了贝叶斯因子法,并介绍了使用稀疏回归的CCS方法;对文本分类问题,介绍了根据关键词频率建立分类器的方法,以及先建立主题模型再根据主题概率建立分类器的方法。本文通过两组文本数据对上述方法进行比较,并给出使用建议。
- 王健张俊妮
- 关键词:中文分词关键词提取贝叶斯因子主题模型
- 基于在线网站评论的中文文本挖掘
- 随着电子商务的快速发展和不断普及,人们的消费习惯发生了深刻的变化,越来越多的消费和交易行为在网上进行。而这种频繁的网络活动产生了大量的网络评论,因而对于消费者与消费者、消费者与商家来说这是一个重要的渠道,能够快捷方便地交...
- 丁诗晴
- 关键词:电子商务网络评论文本挖掘情感倾向LDA模型
- 中文文本挖掘基本理论与应用
- 文本挖掘的应用前景十分广泛,中文文本较西方语言文本有其独特性,本文研究的对象是中文文本。此文首先对文本挖掘的背景和发展简要综述,并介绍中文文本挖掘的概念和流程,其中重点介绍了特征的提取、降维及分类算法。介绍了R中文本挖掘...
- 康东
- 关键词:中文文本挖掘文本分类开源工具
- 中文文本挖掘技术的研究与应用
- 数据挖掘已经是一个发展很成熟的研究领域,它给人们提供了一个从大量杂乱无章的信息中获取有用价值信息的方法。目前,对于非结构化数据的数据挖掘技术已有很多研究,而对于网络中出现的越来越多的文本数据的挖掘技术研究还较少。文本中包...
- 戚云霞
- 关键词:文本分类数据挖掘向量空间模型特征提取
相关作者
- 胥桂仙

- 作品数:43被引量:294H指数:7
- 供职机构:中央民族大学信息工程学院
- 研究主题:藏文 文本挖掘 中文文本挖掘 文本分类 藏文网页
- 高旭

- 作品数:19被引量:117H指数:6
- 供职机构:华北电网有限公司
- 研究主题:华北电网 继电保护 中文文本挖掘 整定方法 匝间保护
- 杨丹丹

- 作品数:18被引量:32H指数:3
- 供职机构:中央民族大学信息工程学院
- 研究主题:计算机基础教育 教学方法 文本挖掘 中文文本挖掘 教学
- 陈昊

- 作品数:19被引量:113H指数:6
- 供职机构:河北大学
- 研究主题:文本分类 决策树 查询 数据库 文本挖掘
- 苏筱蔚

- 作品数:3被引量:52H指数:2
- 供职机构:长春工业大学
- 研究主题:无词典分词 文本挖掘 中文文本挖掘 中文分词 遗传算法