搜索到799篇“ 关键词抽取“的相关文章
一种基于门控主题模型的无监督关键词抽取方法
本发明涉及一种基于门控主题模型的无监督关键词抽取方法,属于人工智能、大数据、自然语言处理领域。本发明提出了一种语义自适应的文档语义表示方法,在整个语料库上训练一个神经主题模型来挖掘该领域的相关主题,并采用门控机制对文档主...
刘琦杨雨婷余增文贺垚范昕煜田宗凯赵勤博
基于文本对的关键词抽取方法、装置、设备及存储介质
本发明涉及人工智能领域,公开了基于文本对的关键词抽取方法、装置、设备及存储介质,用于提高关键词的召回率,提高关键词抽取的准确率。本发明方法包括:获取原始问题语句,并基于原始问题语句生成原始语料库数据集;根据原始语料库数据...
金培根刘志慧何斐斐陆林炳林加新李炫
高校典礼致辞的关键词抽取方法研究
2025年
面向高校典礼教育价值探究的问题,引入自然语言处理技术中的关键词抽取方法,进而达到精准高效分析的目的。通过对131所“双一流”高校的439篇开学典礼致辞文稿结构和写作特点的分析,总结发现了7点规律,结合建立的6项统计特征提出了基于多特征融合的关键词抽取方法。相较传统关键词抽取方法,本文提出方法的关键词抽取效果,在精确率、召回率以及F1值三方面均有不同程度提升,最高F1值达75.51%,性能提升超20%。
贾隆嘉周婉婷成宇歌李博轩张邦佐
关键词:关键词抽取多特征融合教育信息化
一种基于病例的关键词抽取与匹配系统及方法
本发明属于医疗数据处理技术领域,公开了一种基于病例的关键词抽取与匹配系统及方法,方法包括以下步骤:S1、人工标记病例文本中的关键词,得到数字化数据文本;S2、审查步骤S1得到的数字化数据文本;S3、将数字化数据文本输入混...
肖中举谢笑黄国军刘智毅秦逍霞邓振鸿刘金华阳继鹏
基于关键词抽取和混合检索的领域问答对齐优化方法
2025年
针对目前基于检索增强生成技术的领域问答任务中由于用户查询和知识库中相关知识的语义差距导致回答效果差的问题,本文提出一种基于关键词抽取和混合检索的对齐优化方法。首先,利用大语言模型抽取用户查询中的关键词;其次,将用户查询拼接抽取后的关键词组成组合查询,将组合查询与用户查询分别输入稀疏检索模型和稠密检索模型召回相关文档;然后,将检索模型召回的文档做并集处理并重排;最后,将重排后的相关知识输入文本过滤器提取出关键信息文本,并与用户查询合并输入大语言模型生成答案返回给用户。实验结果表明,所提方法在公开的中医药问答数据集和通用领域问答数据集CMRC2018上相较于基于查询改写的对齐优化方法,Recall-Oriented Understudy for Gisting Evaluation Longest common subsequence(ROUGE-L)指标分别提高了9.9个百分点和2.3个百分点,F1指标分别提高了4.1个百分点和1.7个百分点。本文的实验结果验证了所提方法在提升领域问答准确度的有效性。
杨冬菊杨坤
关键词:关键词抽取
基于增强输出和同义拓展的无监督关键词抽取模型构建
2025年
文章构建了基于增强输出和同义拓展的无监督关键词抽取模型KEOE(Keyphrase Extraction Output Enhancer,增强输出器),用于提高无监督关键词抽取模型的可靠性与可用性。首先,以现具有无监督关键词抽取模型的YAKE!、KP-Miner和MultipartiteRank为对象,融合多模型结果进行输出优化;其次,结合WordNet同义知识库对关键词进行同义拓展,扩大关键词输出的语义范围;最后,在前述基础上搭建一套可复用的无监督关键词抽取算法。实验结果表明,利用KEOE模型在各实验数据集的平均抽取准确率达到最优,证明了该模型的有效性。
莫纯扬
关键词:无监督学习关键词抽取
基于关键词抽取和提示学习的藏语新闻稿件生成方法
2025年
本文提出了一种新的藏语新闻稿件生成方法,结合改进的TextRank算法进行关键词抽取和基于提示学习的输入模板设计。实验对比了LLaMa2-7B和BaiChuan2-13B两种大规模语言模型在基线和增强配置下的性能。结果显示,BaiChuan2-13B增强模型在BLEU、Perplexity、Distinct-1和Distinct-2等评估指标上均优于其他配置,相较于LLaMa2-7B基线模型分别提升23.4%、26.2%、26.9%和26.4%。这不仅验证了大规模模型的优势,也证实了本文所提增强方法的有效性。本方法为低资源语言的自然语言处理提供了可行方案,同时为后续研究指明了方向,如进一步提升汇多样性。研究成果在推进藏语自动新闻生成技术的同时,也为其他低资源语言的自然语言处理(NLP)任务提供了有价值的参考。
完玛道吉安见才让
关键词:抽取
关键词抽取方法、装置、设备及存储介质
本发明公开了一种关键词抽取方法、装置、设备及存储介质。该方法包括:对待抽取关键词的目标文档进行预处理,得到所述目标文档的语集合;求取所述语集合中各语的第一因子;基于各语的所述第一因子,选取所述目标文档中第二因子最...
李小涛游树娟
关键词抽取方法、装置、电子设备和存储介质
本发明实施例提供一种关键词抽取方法、装置、电子设备和存储介质,其中方法包括:确定待抽取文本;将所述待抽取文本输入至关键词抽取模型,得到所述关键词抽取模型输出的所述待抽取文本的关键词抽取结果;其中,所述关键词抽取模型是以样...
闫莉万根顺高建清刘聪王智国胡国平
基于改进TextRank的科技文本关键词抽取方法被引量:4
2024年
针对科技文本关键词抽取任务中抽取出现次数少但能较好表达文本主旨的语效果差的问题,提出一种基于改进TextRank的关键词抽取方法。首先,利用语的频-逆文档频率(TF-IDF)统计特征和位置特征优化共现图中语间的概率转移矩阵,通过迭代计算得到语的初始得分;然后,利用K-Core(K-Core decomposition)算法挖掘KCore子图得到语的层级特征,利用平均信息熵特征衡量语的主题表征能力;最后,在语初始得分的基础上融合层级特征和平均信息熵特征,从而确定关键词。实验结果表明,在公开数据集上,与TextRank方法和OTextRank(Optimized TextRank)方法相比,所提方法在抽取不同关键词数量的实验中,F1均值分别提高了6.5和3.3个百分点;在科技服务项目数据集上,与TextRank方法和OTextRank方法相比,所提方法在抽取不同关键词数量的实验中,F1均值分别提高了7.4和3.2个百分点。实验结果验证了所提方法抽取出现频率低但较好表达文本主旨关键词的有效性。
杨冬菊胡成富
关键词:科技文本关键词抽取

相关作者

李涓子
作品数:258被引量:1,034H指数:16
供职机构:清华大学
研究主题:电子设备 存储介质 知识图谱 知识库 本体
赵姝
作品数:216被引量:460H指数:11
供职机构:安徽大学
研究主题:商空间 多粒度 复杂网络 社团发现 网络
吕学强
作品数:410被引量:1,410H指数:17
供职机构:北京信息科技大学
研究主题:抽取方法 图像 搜索日志 中文 条件随机场
谢飞
作品数:41被引量:196H指数:8
供职机构:合肥师范学院
研究主题:通配符 文本分类 向量空间模型 关键词抽取 序列模式挖掘
张鹏
作品数:203被引量:286H指数:9
供职机构:清华大学
研究主题:电子设备 存储介质 知识库 知识图谱 透明介质