周健
- 作品数:3 被引量:0H指数:0
- 供职机构:华中科技大学计算机科学与技术学院更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- FreeBSD下Bonding实现研究及其性能分析
- 2002年
- 将多块网卡虚拟成为一块网卡,使其具有相同的IP地址,来实现提升主机的网络吞吐量或者是提高可用性,这种技术被称作Bonding。这项技术的最早应用是在集群——beowulf上,为了提高集群节点间的数据传输而设计的。本文提出了在FreeBSD4.4下针对INTEL网卡实现Bonding功能的途径,并对Bonding后网络吞吐性能进行了测试。
- 周健余胜生周敬利郭辉
- 关键词:FREEBSDBONDING性能分析网卡集群网络吞吐量
- 存储节能技术研究
- 2012年
- 通过综述当前国内外存储节能技术的研究应用现状,对前沿的存储节能技术如PARAID、Rabbit为代表的数据分布技术,以MAID、分级存储为代表的数据存储管理技术,此外还有数据周期分布技术、冷热数据分析技术等.进行了分析和研究.
- 王峰张宏周健李平
- 关键词:节能CACHE
- 面向海量数据的高效流水化检索增强生成系统
- 2025年
- 检索增强生成(retrieval-augmented generation, RAG)是一种通过诸如近似最近邻搜索(approximate nearest neighbor search, ANNS)等知识检索手段融入外部知识,从而显著提升大型语言模型(large language model, LLM)生成质量的方法.然而,随着外部知识库的不断膨胀, ANNS索引的存储需求也急剧增加,使得海量数据存储在内存中变得不切实际.这进一步促进了基于磁盘的ANNS的发展和应用,但也大大增加了RAG系统的响应时间.为解决这一问题,本文提出了PipeRAG,该系统通过流水线化执行基于磁盘的ANNS检索与LLM的预填充过程,有效地重叠了知识检索和模型推理的延迟,从而在确保检索精度的同时有效提升了RAG系统的整体性能.具体而言, PipeRAG设计了两个核心机制:“ANNS自适应预取机制”和“RAG动态流水线调度策略”,前者能够根据当前的检索状态实时调整预取速度,从而在性能与精度之间取得最佳平衡;后者则综合考虑了ANNS预取速度与LLM分块预填充的延迟,动态地调整预填充任务的大小,以实现最优的流水效率.在实际负载下的广泛评估显示, PipeRAG成功地将基于磁盘的ANNS的RAG系统的响应延迟缩短了25%~71%,同时保持了极低的召回率损失.
- 余润杰阳羽凡周健周健