搜索到507篇“ 多模式匹配“的相关文章
基于藏文音节特征的WM模式匹配算法
2025年
近年来,随着互联网特别是移动互联网在西藏的普及和发展,对涉藏网络舆情的治理也变得越发重要,其中最基本的方式便是敏感词检测。而模式(字符串)匹配算法正是进行敏感词检测的核心技术手段。作为一种高效的模式匹配算法,WM(Wu-Manber)算法以其良好的实际表现,在许场景都得到广泛应用,该算法使用字符块跳转技术来加速匹配过程。然而藏文作为一种音节文字,其文本特性与中英文等文字存在显著差异,若直接将WM算法用于藏文模式匹配,效果并不理想。针对这一问题,该文充分利用藏文的音节结构特性,对WM算法进行改进和优化,提出适用于藏文的模式匹配算法——TWM(Tibetan Wu-Manber)。实验结果表明,TWM算法在藏文模式匹配任务中,相比原始WM算法在效率和准确性上都有显著提高。
杨媛婷彭展
关键词:多模式匹配WM算法藏文处理藏文音节
基于跳跃式匹配的藏文模式匹配算法
2025年
在计算机科学的研究领域中,字符串匹配算法是基础性问题的关键一环,依据查找过程中所涉及模式串的数量差异,可细分为单模式匹配算法与模式匹配算法这两大类别。其中,AC算法作为模式匹配算法范畴内极具代表性且应用极为广泛的经典算法。文章通过分析AC算法及其相关改进算法,并结合藏文结构的特点,提出了一种基于跳跃式匹配的藏文模式匹配算法—AC_BM2T算法。该算法基于当前匹配窗口末尾的2个字符,设计了一种新的模式树移动规则,使得模式树可以实现跳跃式匹配并且跳跃距离相对较大,以此提高算法执行效率。实验结果表明,在处理藏文时,AC_BM2T算法的执行时间是其他改进算法的50%~60%;在模式串数量较少时,AC_BM2T算法的执行时间是AC算法的25%~90%。
周磊超彭展
关键词:多模式匹配算法模式树
基于AC自动机和双数组Trie树的藏文模式匹配算法
2025年
模式匹配算法在网络舆情监管中发挥重要作用,这些算法可以有效地监测筛选出与特定事件相关的敏感词,进而可以快速地对事件做出响应,更好地应对网络舆情的动态变化。然而在处理涉藏网络舆情所涉及的海量藏文数据时,传统针对ASCII字符集的模式匹配算法,常常无法满足性能要求。在这一背景下,文章针对藏文模式匹配问题,提出一种适用于藏文字符集的模式匹配算法——TAC-DAT算法(tibetan Aho Corasick-double array trie),该算法将AC自动机(Aho Corasick automaton)与双数组Trie树(double array trie)结合,减少内存空间占用,同时利用藏文音节字之间以音节点为分隔的特点,优化自动机跳转过程,降低失败字符匹配次数,从而提升了匹配的效率。实验结果表明,该算法在藏文模式匹配任务中表现出色,相较于传统模式匹配算法性有明显提升。
崔晨彭展
关键词:藏文处理多模式匹配
高精度陀螺模式匹配光电集成系统
本发明涉及高精度陀螺模式匹配光电集成系统,主要用于解决现有光纤陀螺仪中发热器件分散布置在光纤环模块两端,其产生的热量对光纤环模块的测量精度影响较大,且占用空间较大,不满足小型化需求的技术问题。本发明高精度陀螺模式匹配...
刘瑜李鹏李龙刚许田林张培吴一尘任宾潘子军王一桦
一种模式匹配方法、装置、电子设备和存储介质
本发明涉及一种模式匹配方法、装置、电子设备和存储介质,该方法包括:获取待匹配文本;将待匹配文本符号化转化成符号序列;从字典树的根节点开始依次匹配所述符号序列中每个符号对应的子节点,在匹配过程中,根据符号序列中的每个符号...
任禾刘升平梁家恩
网络入侵检测系统中的模式匹配算法设计
2024年
为提高网络入侵检测系统模式匹配算法性能,解决传统模式处理模式串数量较低的问题,文章将对模式匹配算法进行优化设计,通过改进BMH的方式提高系统信息处理能力,对比改进BMH与传统BM算法进行验证。结果表明:改进算法对模式串的处理能力明显提高。
刘佳诚
关键词:网络入侵检测系统多模式匹配算法
一种基于AC自动机的藏文模式匹配算法被引量:2
2023年
本文基于AC(Aho-Corasick)算法提出了一种适用于藏文字符集的模式匹配算法——TAC(Tibetan Aho-Corasick)算法。该算法有效利用藏文以音节点为结尾这一特点,检测到失配字符后不再将文本串读入自动机而是进行下一个词读入,从而提高了效率。实验结果表明,在处理藏文模式匹配方面,TAC算法相较于AC算法效率大幅度提高。可很好地应用于藏文字取证、拼写检查器以及抄袭检测等领域。
王蒙彭展
关键词:藏文处理多模式匹配文本匹配
模式匹配算法在研究生预推免系统中的研究与应用
厉志鹏
基于模式匹配和关联约束的协议识别方法与系统
本发明提出一种基于模式匹配和关联约束的协议识别方法与系统,属于协议识别技术领域。包括:从一个标准协议中提取出个标准协议特征序列,并将所述个标准协议特征序列存储至标准协议库;提取所述个标准协议特征序列之间的关联关系...
李鹏飞王军张祥虎陶业荣晋伊灿李文璋唐川张颂郭晋卢杰
一种基于公约数的时序子结构模式匹配查询方法及装置
本发明公开了一种基于公约数的时序子结构模式匹配查询方法及装置。根据用户定义个查询操作,其时序子结构的时间跨度大小由用户自定义,可获取时间定义时间跨度大小内的时序数据,并根据业务需求聚合计算对应时序子结构,对外部应用提...
鲍迪恩蒋炜黄宏彭聪陈盼盼

相关作者

叶润国
作品数:160被引量:263H指数:9
供职机构:中国电子技术标准化研究院
研究主题:网络安全 网络 多模式 异常检测 脚本
胡振宇
作品数:46被引量:0H指数:0
供职机构:北京启明星辰信息技术股份有限公司
研究主题:多模式匹配 多模式 自动机 搜索 脚本
侯整风
作品数:199被引量:485H指数:10
供职机构:合肥工业大学计算机与信息学院
研究主题:秘密共享 数字签名 门限 身份认证 离散对数
方滨兴
作品数:679被引量:4,305H指数:35
供职机构:哈尔滨工业大学
研究主题:网络安全 物联网 计算机 INTERNET 入侵检测
王永成
作品数:169被引量:1,452H指数:24
供职机构:上海交通大学
研究主题:搜索引擎 自然语言处理 中文信息处理 信息检索 中文