搜索到1012篇“ 模式匹配算法“的相关文章
基于藏文音节特征的WM多模式匹配算法
2025年
近年来,随着互联网特别是移动互联网在西藏的普及和发展,对涉藏网络舆情的治理也变得越发重要,其中最基本的方式便是敏感词检测。而多模式(字符串)匹配算法正是进行敏感词检测的核心技术手段。作为一种高效的多模式匹配算法,WM(Wu-Manber)算法以其良好的实际表现,在许多场景都得到广泛应用,该算法使用字符块跳转技术来加速匹配过程。然而藏文作为一种音节文字,其文本特性与中英文等文字存在显著差异,若直接将WM算法用于藏文多模式匹配,效果并不理想。针对这一问题,该文充分利用藏文的音节结构特性,对WM算法进行改进和优化,提出适用于藏文的多模式匹配算法——TWM(Tibetan Wu-Manber)。实验结果表明,TWM算法在藏文多模式匹配任务中,相比原始WM算法在效率和准确性上都有显著提高。
杨媛婷彭展
关键词:多模式匹配WM算法藏文处理藏文音节
基于跳跃式匹配的藏文多模式匹配算法
2025年
在计算机科学的研究领域中,字符串匹配算法是基础性问题的关键一环,依据查找过程中所涉及模式串的数量差异,可细分为单模式匹配算法与多模式匹配算法这两大类别。其中,AC算法作为多模式匹配算法范畴内极具代表性且应用极为广泛的经典算法。文章通过分析AC算法及其相关改进算法,并结合藏文结构的特点,提出了一种基于跳跃式匹配的藏文多模式匹配算法—AC_BM2T算法。该算法基于当前匹配窗口末尾的2个字符,设计了一种新的模式树移动规则,使得模式树可以实现跳跃式匹配并且跳跃距离相对较大,以此提高算法执行效率。实验结果表明,在处理藏文时,AC_BM2T算法的执行时间是其他改进算法的50%~60%;在模式串数量较少时,AC_BM2T算法的执行时间是AC算法的25%~90%。
周磊超彭展
关键词:多模式匹配算法模式树
基于AC自动机和双数组Trie树的藏文多模式匹配算法
2025年
模式匹配算法在网络舆情监管中发挥重要作用,这些算法可以有效地监测筛选出与特定事件相关的敏感词,进而可以快速地对事件做出响应,更好地应对网络舆情的动态变化。然而在处理涉藏网络舆情所涉及的海量藏文数据时,传统针对ASCII字符集的多模式匹配算法,常常无法满足性能要求。在这一背景下,文章针对藏文多模式匹配问题,提出一种适用于藏文字符集的多模式匹配算法——TAC-DAT算法(tibetan Aho Corasick-double array trie),该算法将AC自动机(Aho Corasick automaton)与双数组Trie树(double array trie)结合,减少内存空间占用,同时利用藏文音节字之间以音节点为分隔的特点,优化自动机跳转过程,降低失败字符匹配次数,从而提升了匹配的效率。实验结果表明,该算法在藏文多模式匹配任务中表现出色,相较于传统多模式匹配算法性有明显提升。
崔晨彭展
关键词:藏文处理多模式匹配
基于弱无回溯模式匹配算法的敏感大数据安全分级检测方法
2025年
随着信息技术的广泛应用,敏感大数据在传输和存储过程中存在隐私泄露、数据滥用、安全风险等问题。为了提高敏感大数据的安全性,提出了一种基于弱无回溯模式匹配算法的敏感大数据安全分级检测方法。建立协方差矩阵构建敏感大数据样本库,设定约束条件同构嵌入敏感大数据子图,采用弱无回溯模式匹配算法回溯匹配敏感大数据查询图索引,降低计算复杂度。利用核函数映射查询图特征向量,提高敏感大数据识别准确度,以剪枝的方式完成敏感大数据特征相似性匹配。通过相似度指数函数计算敏感因子,划分敏感大数据安全等级,完成自动化分级检测。实验结果表明:所提方法的敏感大数据安全分级准确度为100%、特征匹配耗时为2.7 s、收敛速度为0.44。由此证明,所提方法能够有效保护敏感大数据安全,在数据传输和存储中具有较高的实际应用价值。
张海明王艺霏那琼澜王森温馨姚艳丽
关键词:协方差矩阵
基于藏文音节结构的单模式匹配算法被引量:2
2024年
字符比较次数和失配后的跳转长度是影响模式(字符串)匹配算法效率的两个关键因素。BM算法是最经典的单模式字符串匹配算法之一。在长度为m的模式串中,其失配后的最大跳转长度为m,但是在应用于藏文环境时无意义字符比较次数较多、最大跳转长度还可增加。针对以上两点不足并结合藏文的文字特征,提出一种基于藏文音节点的单模式匹配算法:BM-Tibetan算法算法采用“先对齐,再匹配”的思想以减少匹配次数,失配后的最大跳转距离为m+k(2≤k≤8)。实验结果表明,BM-Tibetan算法的字符比较次数和模式串的移动次数均少于BM算法,算法性能有一定优势。
张学通彭展
关键词:字符串匹配单模式匹配算法藏文
网络入侵检测系统中的多模式匹配算法设计
2024年
为提高网络入侵检测系统多模式匹配算法性能,解决传统模式处理模式串数量较低的问题,文章将对多模式匹配算法进行优化设计,通过改进BMH的方式提高系统信息处理能力,对比改进BMH与传统BM算法进行验证。结果表明:改进算法模式串的处理能力明显提高。
刘佳诚
关键词:网络入侵检测系统多模式匹配算法
一种基于K线模式匹配算法的大气污染深度学习预测方法
本发明公开了一种基于K线模式匹配算法的大气污染深度学习预测方法,属于大气环境技术领域。包括预测地区的实验数据进行划分,并对污染物浓度数据进行预处理;生成组合连续的PM2.5浓度变化烛台图;根据每组烛台图中展现出的组合形态...
李建许睿沈世铭吴文杰
基于Rete和字符串模式匹配算法的负载均衡资源调度方法
本发明公开了一种基于Rete和字符串模式匹配算法的负载均衡资源调度方法,对于Docker容器,在Kubernetes集群中,将Pod调度到集群合适的节点上时,先运用字符串模式匹配算法筛选出一批可用的节点;再运用Rete算...
夏飞袁国泉赵然冒佳明商林江赵新建范磊张颂王翀张利许良杰陈璐
精确模式匹配算法族的可重用设计及其装配平台
大数据时代的到来使得网络信息数据的总量快速增长。从海量数据中快速而高效地检索到有效的信息是计算机领域亟需解决的重要问题,模式匹配是解决该问题的主要方法之一。模式匹配算法被广泛应用于入侵检测、生物信息、IP路由、信息检索、...
陈名森
关键词:模式匹配算法模型驱动开发可重用设计
保护搜索内容的字符串模式匹配算法研究
2024年
高效的在线字符串模式匹配算法对云数据库检索至关重要,然而搜索内容的泄露会威胁用户隐私。现有的字符串模式匹配算法没有考虑用户搜索内容的保护,可搜索加密方案虽然可以保护用户的搜索内容,但存在索引构建代价大、检索效率低等问题。因此,提出了两种保护用户搜索内容的模式匹配算法:基于分布式点函数的模式匹配(pattern matching based on distributed point function,PMDPF)算法和基于分布式点函数的跳跃式模式匹配(jumping pattern matching based on distributed point function,JPMDPF)算法。PMDPF算法利用指纹函数以及分布式点函数构造模式串真值表,并分发给两台独立的服务器,把搜索中字符对比操作转换为查表操作,从而保护搜索内容。为了提升搜索效率,提出了JPMDPF算法。通过字符跳转,JPMDPF算法以泄露更多信息为代价,其搜索效率比PMDPF算法平均提高了约m倍,其中m为搜索内容长度,同时显著降低了因指纹函数碰撞而导致的误判的概率。实验结果表明,PMDPF算法的搜索效率比基于指纹函数的经典算法提高约5%,并优于现有的可搜索加密方案,PMDPF算法的搜索耗时在搜索内容长度为4时是JPMDPF算法的4.2倍。
王健旭李睿李银

相关作者

巫喜红
作品数:39被引量:97H指数:5
供职机构:嘉应学院计算机学院
研究主题:BM算法 模式匹配算法 网络监听 BF算法 KMP算法
冯帅
作品数:29被引量:0H指数:0
供职机构:哈尔滨工业大学
研究主题:计算机 模式匹配算法 自动机 攻击检测 高斯白噪声
叶麟
作品数:115被引量:149H指数:6
供职机构:哈尔滨工业大学
研究主题:存储介质 电子设备 虚拟机 计算机 模式匹配算法
史建焘
作品数:76被引量:70H指数:6
供职机构:哈尔滨工业大学
研究主题:数据包 计算机 模式匹配算法 自动机 流量数据
余翔湛
作品数:193被引量:384H指数:10
供职机构:哈尔滨工业大学
研究主题:计算机 存储介质 数据包 物联网 模式匹配算法