搜索到1012 篇“ 模式匹配算法 “的相关文章
基于藏文音节特征的WM多模式匹配 算法 2025年 近年来,随着互联网特别是移动互联网在西藏的普及和发展,对涉藏网络舆情的治理也变得越发重要,其中最基本的方式便是敏感词检测。而多模式 (字符串)匹配 算法 正是进行敏感词检测的核心技术手段。作为一种高效的多模式匹配 算法 ,WM(Wu-Manber)算法 以其良好的实际表现,在许多场景都得到广泛应用,该算法 使用字符块跳转技术来加速匹配 过程。然而藏文作为一种音节文字,其文本特性与中英文等文字存在显著差异,若直接将WM算法 用于藏文多模式匹配 ,效果并不理想。针对这一问题,该文充分利用藏文的音节结构特性,对WM算法 进行改进和优化,提出适用于藏文的多模式匹配 算法 ——TWM(Tibetan Wu-Manber)。实验结果表明,TWM算法 在藏文多模式匹配 任务中,相比原始WM算法 在效率和准确性上都有显著提高。 杨媛婷 彭展关键词:多模式匹配 WM算法 藏文处理 藏文音节 基于跳跃式匹配 的藏文多模式匹配 算法 2025年 在计算机科学的研究领域中,字符串匹配 算法 是基础性问题的关键一环,依据查找过程中所涉及模式 串的数量差异,可细分为单模式匹配 算法 与多模式匹配 算法 这两大类别。其中,AC算法 作为多模式匹配 算法 范畴内极具代表性且应用极为广泛的经典算法 。文章通过分析AC算法 及其相关改进算法 ,并结合藏文结构的特点,提出了一种基于跳跃式匹配 的藏文多模式匹配 算法 —AC_BM2T算法 。该算法 基于当前匹配 窗口末尾的2个字符,设计了一种新的模式 树移动规则,使得模式 树可以实现跳跃式匹配 并且跳跃距离相对较大,以此提高算法 执行效率。实验结果表明,在处理藏文时,AC_BM2T算法 的执行时间是其他改进算法 的50%~60%;在模式 串数量较少时,AC_BM2T算法 的执行时间是AC算法 的25%~90%。 周磊超 彭展关键词:多模式匹配算法 模式树 基于AC自动机和双数组Trie树的藏文多模式匹配 算法 2025年 多模式匹配 算法 在网络舆情监管中发挥重要作用,这些算法 可以有效地监测筛选出与特定事件相关的敏感词,进而可以快速地对事件做出响应,更好地应对网络舆情的动态变化。然而在处理涉藏网络舆情所涉及的海量藏文数据时,传统针对ASCII字符集的多模式匹配 算法 ,常常无法满足性能要求。在这一背景下,文章针对藏文多模式匹配 问题,提出一种适用于藏文字符集的多模式匹配 算法 ——TAC-DAT算法 (tibetan Aho Corasick-double array trie),该算法 将AC自动机(Aho Corasick automaton)与双数组Trie树(double array trie)结合,减少内存空间占用,同时利用藏文音节字之间以音节点为分隔的特点,优化自动机跳转过程,降低失败字符匹配 次数,从而提升了匹配 的效率。实验结果表明,该算法 在藏文多模式匹配 任务中表现出色,相较于传统多模式匹配 算法 性有明显提升。 崔晨 彭展关键词:藏文处理 多模式匹配 基于弱无回溯模式匹配 算法 的敏感大数据安全分级检测方法 2025年 随着信息技术的广泛应用,敏感大数据在传输和存储过程中存在隐私泄露、数据滥用、安全风险等问题。为了提高敏感大数据的安全性,提出了一种基于弱无回溯模式匹配 算法 的敏感大数据安全分级检测方法。建立协方差矩阵构建敏感大数据样本库,设定约束条件同构嵌入敏感大数据子图,采用弱无回溯模式匹配 算法 回溯匹配 敏感大数据查询图索引,降低计算复杂度。利用核函数映射查询图特征向量,提高敏感大数据识别准确度,以剪枝的方式完成敏感大数据特征相似性匹配 。通过相似度指数函数计算敏感因子,划分敏感大数据安全等级,完成自动化分级检测。实验结果表明:所提方法的敏感大数据安全分级准确度为100%、特征匹配 耗时为2.7 s、收敛速度为0.44。由此证明,所提方法能够有效保护敏感大数据安全,在数据传输和存储中具有较高的实际应用价值。 张海明 王艺霏 那琼澜 王森 温馨 姚艳丽关键词:协方差矩阵 基于藏文音节结构的单模式匹配 算法 被引量:2 2024年 字符比较次数和失配后的跳转长度是影响模式 (字符串)匹配 算法 效率的两个关键因素。BM算法 是最经典的单模式 字符串匹配 算法 之一。在长度为m的模式 串中,其失配后的最大跳转长度为m,但是在应用于藏文环境时无意义字符比较次数较多、最大跳转长度还可增加。针对以上两点不足并结合藏文的文字特征,提出一种基于藏文音节点的单模式匹配 算法 :BM-Tibetan算法 。算法 采用“先对齐,再匹配 ”的思想以减少匹配 次数,失配后的最大跳转距离为m+k(2≤k≤8)。实验结果表明,BM-Tibetan算法 的字符比较次数和模式 串的移动次数均少于BM算法 ,算法 性能有一定优势。 张学通 彭展关键词:字符串匹配 单模式匹配算法 藏文 网络入侵检测系统中的多模式匹配 算法 设计 2024年 为提高网络入侵检测系统多模式匹配 算法 性能,解决传统模式 处理模式 串数量较低的问题,文章将对多模式匹配 算法 进行优化设计,通过改进BMH的方式提高系统信息处理能力,对比改进BMH与传统BM算法 进行验证。结果表明:改进算法 对模式 串的处理能力明显提高。 刘佳诚关键词:网络入侵检测系统 多模式匹配算法 一种基于K线模式匹配 算法 的大气污染深度学习预测方法 本发明公开了一种基于K线模式匹配 算法 的大气污染深度学习预测方法,属于大气环境技术领域。包括预测地区的实验数据进行划分,并对污染物浓度数据进行预处理;生成组合连续的PM2.5浓度变化烛台图;根据每组烛台图中展现出的组合形态... 李建 许睿 沈世铭 吴文杰基于Rete和字符串模式匹配 算法 的负载均衡资源调度方法 本发明公开了一种基于Rete和字符串模式匹配 算法 的负载均衡资源调度方法,对于Docker容器,在Kubernetes集群中,将Pod调度到集群合适的节点上时,先运用字符串模式匹配 算法 筛选出一批可用的节点;再运用Rete算... 夏飞 袁国泉 赵然 冒佳明 商林江 赵新建 范磊 张颂 王翀 张利 许良杰 陈璐精确模式匹配 算法 族的可重用设计及其装配平台 大数据时代的到来使得网络信息数据的总量快速增长。从海量数据中快速而高效地检索到有效的信息是计算机领域亟需解决的重要问题,模式匹配 是解决该问题的主要方法之一。模式匹配 算法 被广泛应用于入侵检测、生物信息、IP路由、信息检索、... 陈名森关键词:模式匹配算法 模型驱动开发 可重用设计 保护搜索内容的字符串模式匹配 算法 研究 2024年 高效的在线字符串模式匹配 算法 对云数据库检索至关重要,然而搜索内容的泄露会威胁用户隐私。现有的字符串模式匹配 算法 没有考虑用户搜索内容的保护,可搜索加密方案虽然可以保护用户的搜索内容,但存在索引构建代价大、检索效率低等问题。因此,提出了两种保护用户搜索内容的模式匹配 算法 :基于分布式点函数的模式匹配 (pattern matching based on distributed point function,PMDPF)算法 和基于分布式点函数的跳跃式模式匹配 (jumping pattern matching based on distributed point function,JPMDPF)算法 。PMDPF算法 利用指纹函数以及分布式点函数构造模式 串真值表,并分发给两台独立的服务器,把搜索中字符对比操作转换为查表操作,从而保护搜索内容。为了提升搜索效率,提出了JPMDPF算法 。通过字符跳转,JPMDPF算法 以泄露更多信息为代价,其搜索效率比PMDPF算法 平均提高了约m倍,其中m为搜索内容长度,同时显著降低了因指纹函数碰撞而导致的误判的概率。实验结果表明,PMDPF算法 的搜索效率比基于指纹函数的经典算法 提高约5%,并优于现有的可搜索加密方案,PMDPF算法 的搜索耗时在搜索内容长度为4时是JPMDPF算法 的4.2倍。 王健旭 李睿 李银
相关作者
巫喜红 作品数:39 被引量:97 H指数:5 供职机构:嘉应学院计算机学院 研究主题:BM算法 模式匹配算法 网络监听 BF算法 KMP算法 冯帅 作品数:29 被引量:0 H指数:0 供职机构:哈尔滨工业大学 研究主题:计算机 模式匹配算法 自动机 攻击检测 高斯白噪声 叶麟 作品数:115 被引量:149 H指数:6 供职机构:哈尔滨工业大学 研究主题:存储介质 电子设备 虚拟机 计算机 模式匹配算法 史建焘 作品数:76 被引量:70 H指数:6 供职机构:哈尔滨工业大学 研究主题:数据包 计算机 模式匹配算法 自动机 流量数据 余翔湛 作品数:193 被引量:384 H指数:10 供职机构:哈尔滨工业大学 研究主题:计算机 存储介质 数据包 物联网 模式匹配算法