搜索到6582篇“ 文本相似度“的相关文章
- 文本相似度检测方法、装置及系统
- 本申请涉及文本处理领域,公开了一种文本相似度检测方法、装置及系统,方法包括:获取待检测文本、对比文本以及预设比较长度值;将待检测文本中的文字分割为多个待检测文字段;基于预设比较长度值和待检测文字段,将对比文本中的文字分割...
- 周洋王思梦林明林威张艺榕
- 一种文本相似度计算方法及相关装置
- 本申请公开了一种文本相似度计算方法及相关装置,涉及文本查重领域,包括:在获取待进行相似度计算的第一文本和第二文本之后;先分别对第一文本和第二文本进行多元化序列提取,得到至少一组序列;再分别计算各组序列的相似度;最后对各组...
- 陈佳文龚骏
- 融合多头图注意力的文本相似度计算
- 2025年
- 现有的文本相似度计算方法在处理长文本或具有复杂结构句子时,无法有效挖掘文本的深层语义,从而影响相似度计算的精度。为了解决这一问题,本文提出了一种融合图注意力的孪生网络框架,该框架结合了图神经网络的图嵌入和节点嵌入2种编码方式。在图嵌入支路中,引入图注意力机制,解决了长距离节点受限于图卷积层数无法充分传播和整合远距离节点的信息的问题;在节点嵌入支路中,采用残差结构以缓解节点过度平滑的问题,从而更好地挖掘节点间的语义关系。实验结果表明,本文方法在语义文本相似性(semantic textual similarity,STS)基准的多个数据集上表现优异,且相较于当前先进的双向编码器表征模型模型,具有更高的文本相似度计算精度。
- 申晓旭王忠燎包训成吴醒宇张茂萱张艳迪
- 关键词:图嵌入文本表示文本相似度自然语言处理
- 文本相似度计算模型生成方法、装置、设备及存储介质
- 本申请涉及计算机技术领域,本申请提供一种文本相似度计算模型生成方法、装置、设备及存储介质,所述方法获取样本数据集对应的第一样本类别向量,并将第一样本类别向量进行归一化运算,生成第二样本类别向量;获取目标语句对应的第一句向...
- 田兴黄忠品
- 文本相似度确定方法、装置、设备、存储介质及程序产品
- 本申请实施例提供一种文本相似度确定方法、装置、设备、存储介质及程序产品,涉及大数据领域。该方法包括:对第一文本和第二文本进行摘要提取处理,得到第一文本的第一摘要,以及第二文本的第二摘要;对第一文本、第二文本、第一摘要和第...
- 胡辉辉
- 文本相似度识别方法、装置、电子设备及可读存储介质
- 本发明提供一种文本相似度识别方法、装置、电子设备及可读存储介质,方法包括:获取第一文本和第二文本,并确定第一文本和第二文本对应的公共子字符串;根据第一文本和第二文本的语序,分别确定公共子字符串的相似度贡献比例、以及第一文...
- 王哲
- 一种基于句法增强的多维向量化文本相似度计算方法
- 本发明实施例中提供了一种基于句法增强的多维向量化文本相似度计算方法,属于数据处理技术领域,具体包括:步骤1,对输入文本进行分词和句法分析,得到分词结果及其对应的成分标签;步骤2,分别采用WoBERT模型和Transfor...
- 易国栋赵俊伟黄偲乐杨英丽张新玉吴奇陈佳婷蔡文雅朱钰杰
- 一种文本相似度的确定方法、装置、电子设备及存储介质
- 本发明公开了一种文本相似度的确定方法、装置、电子设备及存储介质,其中,该方法包括:获取待处理文本和待处理文本关联的至少一个参考文本;针对各参考文本,根据待处理文本的第一词分布信息和当前参考文本的第二词分布信息,确定待处理...
- 苏权奇沈博珩和冬梅王雪松李效恋门小千朱延忠龙潜刘雁行
- 基于知识图谱和对比学习的遥感文本相似度计算方法
- 本发明公开了基于知识图谱和对比学习的遥感文本相似度计算方法,涉及遥感科学与自然语言处理技术领域,包括从遥感领域数据网站和期刊文章中收集数据,构建遥感知识图谱并训练简单对比学习词嵌入模型,基于遥感知识图谱和简单对比学习词嵌...
- 赵萍吴松申奥楚博策朱进王梅瑞周俊常杰
- 用于网络舆情文本相似度计算的方法、装置、设备和存储介质
- 本发明涉及深度学习技术领域,公开了用于网络舆情相似度计算的方法、装置、设备和存储介质,方法包括,获取网络舆情文本数据,基于网络舆情文本数据训练构建的相似度计算模型;将网络舆情文本数据进行文本标记化处理,得到文本标记化处理...
- 张家瑞
相关作者
- 余正涛

- 作品数:890被引量:1,254H指数:15
- 供职机构:昆明理工大学
- 研究主题:自然语言处理技术 越南语 机器翻译 语料 跨语言
- 龙华

- 作品数:574被引量:482H指数:9
- 供职机构:昆明理工大学信息工程与自动化学院
- 研究主题:语种识别 包装盒 语音 相似度 文本
- 马海群

- 作品数:577被引量:4,645H指数:32
- 供职机构:黑龙江大学信息管理学院信息资源管理研究中心
- 研究主题:开放数据 知识产权 数字图书馆 情报 信息公开
- 张鹏程

- 作品数:346被引量:365H指数:8
- 供职机构:河海大学
- 研究主题:控制流图 网络 神经网络 图像 X射线图像
- 张涛

- 作品数:172被引量:111H指数:6
- 供职机构:哈尔滨工程大学
- 研究主题:镁合金 光纤 三轴磁强计 毛细管 电化学噪声