搜索到770篇“ 新事件检测“的相关文章
- 面向新闻领域的蒙古文新事件检测方法研究
- 随着蒙古文网络资源的不断增多,对蒙古文信息进行新事件检测,进而在庞大的信息源中及时掌握最新动态的需求不断增加。然而目前为止在国内外对于蒙古文新事件检测方法的研究仍处于起步阶段,亟需对其进行进一步研究。在蒙古文新闻领域的新...
- 王士杰
- 关键词:蒙古文新事件检测新闻要素
- 面向新闻领域的蒙古文新事件检测方法的研究
- 2020年
- 新事件检测的目标是从一个或多个新闻源中检测出报道一个新闻话题种子事件的第一个新闻.本文面向新闻领域,研究了蒙古文新事件检测的相关方法.提出结合新闻内容相似度与新闻要素相似度进行新事件检测的方法.在新闻内容表示上,针对新闻的特点以及不同类型新闻表达词汇对传统的TF-IDF方法进行了改进.其次,提取出新闻的主要要素,包括时间、地点、主体、客体和主客体动作,计算了两篇新闻文档之间新闻要素的相似度.最后将新闻内容相似度与新闻要素相似度进行融合后进行相似度比较.实验结果表明,本文改进方法明显,性能比传统新事件检测系统有显著提升.
- 王士杰飞龙高光来
- 关键词:新事件检测蒙古文新闻要素相似度计算
- 面向蒙古文新闻语料的新事件检测
- 蒙古文作为内蒙古自治区主体民族使用的主要文字,在各个领域都被广泛应用。其使用者分布在中国、蒙古国和俄罗斯等国家,在世界范围也有一定的影响力。随着蒙古文相关的网络资源逐渐增多,对蒙古文信息进行检测与追踪的需求不断增加。然而...
- 高耀文
- 关键词:新事件检测条件随机场向量空间模型
- 基于混合模型的社交网络新事件检测方法研究与应用
- 传统的新事件检测往往只注重检测过程中的某一具体环节,而尚未构架出一个完整而全面的能够保证新事件检测准确度和效率的系统。本文在现有新事件检测研究的基础上,针对现有社交网络检测新事件中监测节点较多导致算法效率较低、时间准确度...
- 丁喆
- 关键词:新事件检测
- 面向大规模数据的在线新事件检测
- 新事件检测是从以时间顺序到来的新闻报道流中发现新闻话题种子事件的第一篇新闻报道。由于目前Internet高速发展,网络新闻信息规模变得十分巨大,传统的新事件检测算法在处理大规模数据时出现了性能上的瓶颈。随着云计算时代的到...
- 蔡偃武
- 关键词:新事件检测大规模数据MAPREDUCE
- 面向大规模数据的在线新事件检测被引量:1
- 2014年
- 通过分析基于新闻要素的在线新事件检测算法的时间消耗,提出一种面向大规模数据环境的在线新事件检测算法。该算法利用基于倒排索引的高效相似报道搜索机制,有效减少单路径聚类算法中的相似度比较次数。通过对报道预处理、报道与事件比较以及索引搜索这3个过程的并行化,提高算法在多机环境下的运行效率和可伸缩性。实验结果表明,该算法在不影响漏检率和误检率的基础上,提高了新事件检测的速度,并且在千万到亿级别的报道规模下,其吞吐量达到150条/s^200条/s。
- 蔡偃武高大启阮彤蒋锐权
- 关键词:新事件检测大规模数据并行计算倒排索引
- 用于视频流的实时新事件检测的装置和方法
- 公开了用于以提高的检测效率实时检测视频流中新事件的技术。例如,一种方法确定给定事件是否为视频流中的新事件。该视频流包括多个事件。第一步骤从给定事件中提取第一特征(例如文本特征)集。第一特征集与给定事件所关联的第二特征(例...
- 骆罡颜嵘俞士纶
- 基于新闻要素的在线新事件检测被引量:2
- 2013年
- 在线新事件检测的主要任务是从以时间顺序到来的新闻报道中识别出未知事件。提出一种基于新闻要素的自动在线新事件检测方法。首先,构建基于新闻要素的报道和事件表示模型,该模型包括新闻报道地点、人物和内容等要素,使用多维要素的优越性在于可以区别相似事件;为计算各要素对应特征的相似度提供对应的相似度算法:使用基于地理本体树的地名相似度算法计算地点相似度,使用基于维基百科的语义相似度计算方法计算报道内容之间的相似度;为了衡量各要素的重要性,使用SVM模型训练得出各要素的权值;最后,以single-pass聚类算法为基础,在算法过程中不断修改事件的表示向量以防止事件中心的漂移,同时使用滑动的时间窗口以减少因处理大量不活跃事件引起的时间消耗。实验结果表明该方法可以有效地降低系统的漏检率和误检率,提高事件检测的性能。
- 李营那阮彤顾春华
- 关键词:新事件检测地理本体语义相似
- 基于新闻要素的在线新事件检测
- 随着Internet技术的迅速发展,在线新闻已成为人们获取信息的主要途径。然而互联网上的新闻杂乱无序、增长迅速,人们很难从如此庞大的信息库掌握有用的信息,特别是最新的消息动态。本文的研究对象——新事件检测的主要任务是从以...
- 李营那
- 关键词:新闻要素支持向量机语义相似
- LDA及主题词相关性的新事件检测被引量:4
- 2012年
- 目前,话题检测与跟踪已被广泛应用,新事件检测作为话题检测与跟踪领域中的研究任务之一,为跟踪后续话题发展的先验知识,在话题检测与跟踪领域具有重要的理论研究意义。LDA主题模型不能自动识别新事件,其主题数需通过人工或反复实验来确定,识别效率低。本文提出基于LDA及主题词间的相关性新事件检测算法,同时结合报道发生的时间,确定合理的主题数目,从而探知新事件。实验证明,与传统LDA算法及Gibbs LDA算法相比,该方法具有一定优势,提高了对新事件检测的敏感度。
- 黄颖
- 关键词:LDA新事件检测
相关作者
- 洪宇

- 作品数:133被引量:463H指数:9
- 供职机构:苏州大学计算机科学与技术学院
- 研究主题:隐式 篇章 存储介质 框架语义 语料库
- 李生

- 作品数:249被引量:2,362H指数:23
- 供职机构:黑龙江工程学院
- 研究主题:机器翻译 自然语言处理 句法分析 汉语 信息检索
- 范基礼

- 作品数:9被引量:62H指数:4
- 供职机构:哈尔滨工业大学
- 研究主题:个性化信息检索 话题检测与跟踪 分治 新事件检测 动态阈值
- 张宇

- 作品数:676被引量:3,724H指数:27
- 供职机构:西南交通大学建筑学院
- 研究主题:职业教育 数值模拟 对流换热 高等职业教育 计算机应用
- 刘挺

- 作品数:378被引量:3,794H指数:32
- 供职机构:哈尔滨工业大学
- 研究主题:自然语言处理 中文 中文信息处理 文本 计算机应用