搜索到351篇“ CRF模型“的相关文章
一种基于BiLSTM-CRF模型的电网智能防误操作方法及系统
本发明公开了一种基于BiLSTM‑CRF模型的电网智能防误操作方法及系统,涉及智能电网调度领域,方法包括:从电网调度系统获取结构化数据集;基于结构化数据集和BiLSTM‑CRF模型,构建第一模型;对第一模型进行训练,得到...
陈龙杨帅杜江白宏宇吴亮明佳李玉靖王明阳郭萌吴杨李梧迪袁涔赵本源王榆楗王帮华李和阳
基于ERNIE-BMBD-CRF模型的中文课程问句命名实体识别方法研究
2025年
随着智慧教育的快速普及,如何将课程知识点以更直观的形式进行展示,帮助学生更加高效地学习,已成为教育信息化领域一项重要的研究课题.传统中文命名实体识别方法因忽略文字上下文联系而不易推出被掩盖的文字,因此提出一种基于ERNIE-BMBD-CRF(EBC)模型的课程问句命名实体识别方法,以有效地从课程问句中识别出知识点实体.首先利用ERNIE预训练语言模型对文本词向量进行表征,然后构建BMBD层,通过BiLSTM模型进行上下文语义特征提取,将边界扩散机制引入到多头注意力机制MHA中以增强实体边界信息的捕捉.最后在CRF模型中进行序列标签解码,从而完成命名实体识别.实验结果表明:该模型在CLUENER2020、MSRA两个公开数据集和自建课程语料数据集上的F1值分别为87.45%、98.48%、81.49%,均优于其他对比模型
秦慧伶邢雪枫张黔川陈嘉豪陈雅茜
关键词:命名实体识别
基于BERT-BiLSTM-CRF模型的荔枝命名实体识别
2025年
1背景1.1研究背景命名实体识别(Named Entity Recognition, NER)是自然语言处理(Natural Language Processing,NLP)领域内的一项核心任务,其目标在于从文本数据中识别并分类出各类实体名称,包括但不限于人名、地名、机构名等。NER技术在信息抽取、问答系统、机器翻译等众多领域展现出极高的应用价值。特别是在农业领域,通过对农业相关文献、报告、新闻等文本资料的深入处理与分析,NER技术能够高效提取出关键信息,为农业生产的优化、科研工作的推进以及管理决策的制定提供有力支持。
姚松林梁敦毫罗振营
关键词:命名实体识别问答系统ENTITY文本资料
一种基于ERNIE-BiLSTM-FNNAttention-CRF模型的碳捕集、利用与封存领域专利命名实体识别方法
本发明提出一种基于ERNIE‑BiLSTM‑FNNAttention‑CRF模型的碳捕集、利用与封存领域专利命名实体识别方法,涉及自然语言处理和专利信息处理领域。在ERNIE层预训练处理过的专利语料库CCUS_datas...
梁艳任河孙践知
融合全局语义信息的BIG-LSTM-CRF模型被引量:1
2024年
命名实体识别任务是针对输入的文本句子做序列标注的一类自然语言处理任务,其目的是抽取出文本句子中的主语实体和宾语实体.基于深度神经网络的提取方法获得了优异的性能,其中BI-LSTM-CRF是效果显著且具有代表性的模型之一.但该模型在训练过程中忽略了全局语义信息对实体识别准确度的影响.本文通过引入全局语义信息来改进BI-LSTM-CRF模型用于命名实体识别任务的性能:先通过添加一层带有激活操作的全连接层来提取输入文本句子的高维语义信息;再通过一个全连接层将高维语义信息与每个字符进行深度融合,得到该句子融合了全局语义信息的向量表示,并将其用于后续的命名实体识别任务.通过将改进后的模型用于CLUENER2020数据集上,验证了添加全局语义信息融合模块可以提升模型命名实体识别的准确度.
胡俊英王煜华金书意张博
关键词:自然语言处理命名实体识别
基于CRF模型的《里耶秦简》自动断句与分词研究
2024年
里耶秦简的数量是之前出土秦简的10倍,填补了秦朝历史记载中的诸多空白。将《里耶秦简》作为实验语料,探索基于CRF(条件随机场)模型的里耶秦简自动断句与分词方法。结合简文的实际特点,通过设置不同的特征模板,面向不同的任务验证模型序列标注的泛化能力;通过设置断句、分词一体化的对比实验,以选取性能更优的处理方案;同时设计了深度学习方法与预训练模型的对比试验。实验结果表明,CRF模型一体化的标注方案在各任务中的整体性能均有所提升,其中自动断句、分词的F1值分别达到75.79%与94.44%,且速度快用时少,更适用于里耶秦简。
冯慧敏郭帅帅刘铭
关键词:CRF模型里耶秦简自动分词
基于改进BiLSTM-CRF模型的网络安全知识图谱构建被引量:3
2024年
针对网络安全领域的图谱构建任务,基于BiLSTM-CRF模型引入了外部网络安全词典来加强网络安全文本的特征,并结合多头注意力机制提取多层特征,最终在网络安全数据集取得了更优异的结果。利用企业内部的日常网络运维数据,设计并构建了一个面向企业网络安全运维管理的知识图谱,为后续进一步研究基于图谱的企业网络安全智能决策等应用奠定基础。
黄智勇余雅宁林仁明黄鑫张凤荔
关键词:知识图谱企业网络本体建模知识抽取
基于BERT-BiLSTM-CRF模型的油气领域命名实体识别被引量:8
2024年
针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from transformers)预训练模型得到输入序列语义的词向量;然后将训练后的词向量输入双向长短期记忆网络(bi-directional long short-term memory,BiLSTM)模型进一步获取上下文特征;最后根据条件随机场(conditional random fields,CRF)的标注规则和序列解码能力输出最大概率序列标注结果,构建油气领域命名实体识别模型框架。将BERT-BiLSTM-CRF模型与其他2种命名实体识别模型(BiLSTM-CRF、BiLSTM-Attention-CRF)在包括3万多条文本语料数据、4类实体的自建数据集上进行了对比实验。实验结果表明,BERT-BiLSTM-CRF模型的准确率(P)、召回率(R)和F_(1)值分别达到91.3%、94.5%和92.9%,实体识别效果优于其他2种模型
高国忠李宇华远鹏吴文旷
关键词:油气领域命名实体识别
基于BiLSTM-CRF模型的房屋出租App系统的设计与实现
2024年
针对文本实体信息抽取优化问题,本文以租赁行业为研究对象,首先,使用爬虫技术对客户发布的信息进行爬取,采用BiLSTM-CRF算法对信息进行实体提取和处理,将处理后的信息存储在数据库中,构建App数据来源的数据层,再基于数据层的数据开发App应用层。开发的App应用层模块包括用户认证模块和主页模块。BiLSTM-CRF模型比LSTM和Bi LSTM在实体边界的识别率更高,模型准确率、召回率和F1值分别可以达到96.58%,88.94%,92.60%。
罗佳李萌
基于ERNIE-BiGRU-CRF模型的煤矿安全隐患命名实体智能识别研究被引量:1
2024年
为充分挖掘煤矿安全隐患文本关键知识,帮助煤矿企业安全管理人员更好的开展隐患排查治理工作,提出一种基于预训练语言模型的命名实体识别方法。首先定义煤矿安全隐患实体类别,并采用BIO标注策略构建了7个实体类别和15个实体标签;然后将收集到的煤矿隐患排查数据进行预处理,由煤矿安全领域专家人工标注相关实体,得到1500条煤矿安全隐患命名实体标准数据集;最后采用ERNIE预训练模型对煤矿安全隐患文本词向量进行表征、同时利用BiGRU结构进行上下文语义特征提取以及CRF模型进行实体标签解码,完成煤矿安全隐患命名实体识别研究。实验结果表明:ERNIE-BiGRU-CRF模型在序列标注任务上的精确率、召回率和F1值分别为56.69%、69.23%和62.34%,较于BiLSTM-CRF基线模型分别提高了6.85%、13.74%和9.83%,并且实体抽取结果与实际标注结果相差不大。另外,消融实验也验证了BiGRU层能够更好的捕捉煤矿安全隐患文本上下文语义依赖关系以及CRF层能够进一步优化标签序列的有效性。
刘飞翔李泽荃赵嘉良李靖
关键词:命名实体识别

相关作者

赵静
作品数:44被引量:136H指数:6
供职机构:成都中医药大学
研究主题:青藤碱 肾纤维化 HMGN2 类风湿性关节炎 5/6肾切除
刘伟伟
作品数:47被引量:192H指数:7
供职机构:成都中医药大学
研究主题:青藤碱 肾纤维化 类风湿性关节炎 5/6肾切除 MSN
周国栋
作品数:393被引量:1,254H指数:19
供职机构:苏州大学计算机科学与技术学院
研究主题:文本 分类器 语料 最大熵 中文
高永翔
作品数:206被引量:1,267H指数:19
供职机构:成都中医药大学基础医学院
研究主题:青藤碱 湿邪 类风湿关节炎 类风湿性关节炎 中医
朱巧明
作品数:488被引量:1,577H指数:19
供职机构:苏州大学计算机科学与技术学院
研究主题:中文 抽取 篇章 中文信息处理 识别方法