搜索到1746篇“ 多模式匹配算法“的相关文章
- 多模式匹配算法被引量:2
- 2007年
- 针对特征串匹配问题,本文对模式匹配算法作了概括介绍,分析了单模式匹配算法KMP、BM、QS等算法和多模式匹配算法Aho-Corasick、Wu-Manber、SBOM等算法的特点。在此基础上,文章结合Wu-Manber算法和QS算法各自的优点,同时对算法的匹配和跳跃机制作了相应改进,提出了一种新的匹配算法QWM(QuickWu-Manber)。
- 车莉
- 关键词:多模式匹配KMP算法QS算法AHO-CORASICK算法WU-MANBER算法
- 基于藏文音节特征的WM多模式匹配算法
- 2025年
- 近年来,随着互联网特别是移动互联网在西藏的普及和发展,对涉藏网络舆情的治理也变得越发重要,其中最基本的方式便是敏感词检测。而多模式(字符串)匹配算法正是进行敏感词检测的核心技术手段。作为一种高效的多模式匹配算法,WM(Wu-Manber)算法以其良好的实际表现,在许多场景都得到广泛应用,该算法使用字符块跳转技术来加速匹配过程。然而藏文作为一种音节文字,其文本特性与中英文等文字存在显著差异,若直接将WM算法用于藏文多模式匹配,效果并不理想。针对这一问题,该文充分利用藏文的音节结构特性,对WM算法进行改进和优化,提出适用于藏文的多模式匹配算法——TWM(Tibetan Wu-Manber)。实验结果表明,TWM算法在藏文多模式匹配任务中,相比原始WM算法在效率和准确性上都有显著提高。
- 杨媛婷彭展
- 关键词:多模式匹配WM算法藏文处理藏文音节
- 基于跳跃式匹配的藏文多模式匹配算法
- 2025年
- 在计算机科学的研究领域中,字符串匹配算法是基础性问题的关键一环,依据查找过程中所涉及模式串的数量差异,可细分为单模式匹配算法与多模式匹配算法这两大类别。其中,AC算法作为多模式匹配算法范畴内极具代表性且应用极为广泛的经典算法。文章通过分析AC算法及其相关改进算法,并结合藏文结构的特点,提出了一种基于跳跃式匹配的藏文多模式匹配算法—AC_BM2T算法。该算法基于当前匹配窗口末尾的2个字符,设计了一种新的模式树移动规则,使得模式树可以实现跳跃式匹配并且跳跃距离相对较大,以此提高算法执行效率。实验结果表明,在处理藏文时,AC_BM2T算法的执行时间是其他改进算法的50%~60%;在模式串数量较少时,AC_BM2T算法的执行时间是AC算法的25%~90%。
- 周磊超彭展
- 关键词:多模式匹配算法模式树
- 基于AC自动机和双数组Trie树的藏文多模式匹配算法
- 2025年
- 多模式匹配算法在网络舆情监管中发挥重要作用,这些算法可以有效地监测筛选出与特定事件相关的敏感词,进而可以快速地对事件做出响应,更好地应对网络舆情的动态变化。然而在处理涉藏网络舆情所涉及的海量藏文数据时,传统针对ASCII字符集的多模式匹配算法,常常无法满足性能要求。在这一背景下,文章针对藏文多模式匹配问题,提出一种适用于藏文字符集的多模式匹配算法——TAC-DAT算法(tibetan Aho Corasick-double array trie),该算法将AC自动机(Aho Corasick automaton)与双数组Trie树(double array trie)结合,减少内存空间占用,同时利用藏文音节字之间以音节点为分隔的特点,优化自动机跳转过程,降低失败字符匹配次数,从而提升了匹配的效率。实验结果表明,该算法在藏文多模式匹配任务中表现出色,相较于传统多模式匹配算法性有明显提升。
- 崔晨彭展
- 关键词:藏文处理多模式匹配
- 网络入侵检测系统中的多模式匹配算法设计
- 2024年
- 为提高网络入侵检测系统多模式匹配算法性能,解决传统模式处理模式串数量较低的问题,文章将对多模式匹配算法进行优化设计,通过改进BMH的方式提高系统信息处理能力,对比改进BMH与传统BM算法进行验证。结果表明:改进算法对模式串的处理能力明显提高。
- 刘佳诚
- 关键词:网络入侵检测系统多模式匹配算法
- 一种基于AC自动机的藏文多模式匹配算法被引量:2
- 2023年
- 本文基于AC(Aho-Corasick)算法提出了一种适用于藏文字符集的多模式匹配算法——TAC(Tibetan Aho-Corasick)算法。该算法有效利用藏文以音节点为结尾这一特点,检测到失配字符后不再将文本串读入自动机而是进行下一个词读入,从而提高了效率。实验结果表明,在处理藏文多模式匹配方面,TAC算法相较于AC算法效率大幅度提高。可很好地应用于藏文字取证、拼写检查器以及抄袭检测等领域。
- 王蒙彭展
- 关键词:藏文处理多模式匹配文本匹配
- 多模式匹配算法在研究生预推免系统中的研究与应用
- 厉志鹏
- 计算机网络入侵检测系统的多模式匹配算法被引量:5
- 2021年
- 为了使网络入侵检测系统能够在高速网络环境中有效的开展工作,实现计算机网络入侵检测系统的多模式匹配算法优化设计.首先,对网络入侵检测的算法与原理进行全面分析.其次,对网络入侵检测系统多模式匹配算法的优化思想进行描述,描述多模式匹配算法,对算法进行实现,使模式匹配算法效率得到提高,以此提高系统检测能力.通过测试结果表示,优化后多模式匹配算法能够使网络检测系统的检测性能得到提高.
- 薛芳林丽
- 关键词:计算机网络网络入侵检测多模式匹配算法
- 多模式匹配算法在网络入侵自动检测中的应用被引量:1
- 2021年
- 为了可以对计算机网络安全进行有效的保护,同时提高计算机网络入侵检测的功能及其效率,提出多模式匹配算法在网络入侵自动检测中的应用。首先快速检测引擎初始化,快速有效地区别规则集合;其次构造模式匹配链表,读取系统配置文件的规则;最后检测网络数据包,确保计算机网络安全。通过实验结果的对比,可以明显看出,相比于传统算法,多模式匹配算法在网络入侵自动检测中的应用要更具有实用性,对入侵数据的检测能够进行高速处理,相同时间范围内,多模式匹配算法的超调量远超传统算法。
- 彭仁旺
- 关键词:多模式匹配算法网络入侵
- 一种面向科技文献元数据增量数据规范的多模式匹配算法被引量:2
- 2021年
- 【目的】针对期刊文献元数据日增的小规模数据,设计一种基于Hash的多模式匹配算法,对其机构信息利用大规模的模式集进行规范化。【方法】使用Hash定位模式串,减少对系统内存的占用;抽取模式串的首个单词/字结合Word跳步匹配,减少匹配次数,加大跳转幅度,从而提升多模式匹配的效率。【结果】以CSCD机构库182万条数据作为模式集的实验中,该算法与Aho-Corasick(AC)算法对比,能够较为快速地构建模式集对应的字典;在字符集规模约为1万条时,有更优越的时间性能,尤其是英文语料下有9.39%时间性能的提升;与Wu-Manber(WM)算法相比,该算法不受最短模式串限制。【局限】针对不同的模式集和字符集,需要对算法或数据进行调整;该算法及其拓展的无首词模式,均不适用于模式集较小、字符集较大的场景。【结论】该算法可以应用于中文、英文、中英混合的文本,在模式集较大(106级)、字符集较小(1万左右)的情况下,有超越经典算法AC算法(0.08%-30.41%)和WM算法时间性能的表现。
- 董美常志军张润杰
- 关键词:数据规范化哈希算法
相关作者
- 侯整风

- 作品数:199被引量:485H指数:10
- 供职机构:合肥工业大学计算机与信息学院
- 研究主题:秘密共享 数字签名 门限 身份认证 离散对数
- 王永成

- 作品数:169被引量:1,452H指数:24
- 供职机构:上海交通大学
- 研究主题:搜索引擎 自然语言处理 中文信息处理 信息检索 中文
- 李训根

- 作品数:100被引量:65H指数:4
- 供职机构:杭州电子科技大学
- 研究主题:雷达目标识别 目标识别方法 HRRP 迭代学习控制器 测试集
- 杨波

- 作品数:21被引量:21H指数:3
- 供职机构:合肥工业大学
- 研究主题:多模式匹配算法 多模式匹配 中文 有限状态自动机 抑制电路
- 王巍

- 作品数:293被引量:190H指数:7
- 供职机构:哈尔滨工程大学
- 研究主题:网络 信道状态信息 社交网络 网络缓存 最大化