您的位置: 专家智库 > >

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...
  • 1篇电子电信

主题

  • 1篇性能分析
  • 1篇语言模型
  • 1篇吞吐
  • 1篇吞吐量
  • 1篇网卡
  • 1篇网络
  • 1篇网络吞吐量
  • 1篇流水化
  • 1篇节能
  • 1篇节能技术
  • 1篇节能技术研究
  • 1篇集群
  • 1篇海量
  • 1篇海量数据
  • 1篇BONDIN...
  • 1篇FREEBS...
  • 1篇RAG
  • 1篇LLM
  • 1篇CACHE
  • 1篇ANNS

机构

  • 3篇华中科技大学
  • 1篇广西师范大学
  • 1篇周口师范学院

作者

  • 3篇周健
  • 1篇张宏
  • 1篇王峰
  • 1篇郭辉
  • 1篇周敬利
  • 1篇余胜生
  • 1篇吴非
  • 1篇李平

传媒

  • 1篇计算机与数字...
  • 1篇许昌学院学报
  • 1篇中国科学:信...

年份

  • 1篇2025
  • 1篇2012
  • 1篇2002
3 条 记 录,以下是 1-3
排序方式:
FreeBSD下Bonding实现研究及其性能分析
2002年
将多块网卡虚拟成为一块网卡,使其具有相同的IP地址,来实现提升主机的网络吞吐量或者是提高可用性,这种技术被称作Bonding。这项技术的最早应用是在集群——beowulf上,为了提高集群节点间的数据传输而设计的。本文提出了在FreeBSD4.4下针对INTEL网卡实现Bonding功能的途径,并对Bonding后网络吞吐性能进行了测试。
周健余胜生周敬利郭辉
关键词:FREEBSDBONDING性能分析网卡集群网络吞吐量
存储节能技术研究
2012年
通过综述当前国内外存储节能技术的研究应用现状,对前沿的存储节能技术如PARAID、Rabbit为代表的数据分布技术,以MAID、分级存储为代表的数据存储管理技术,此外还有数据周期分布技术、冷热数据分析技术等.进行了分析和研究.
王峰张宏周健李平
关键词:节能CACHE
面向海量数据的高效流水化检索增强生成系统
2025年
检索增强生成(retrieval-augmented generation, RAG)是一种通过诸如近似最近邻搜索(approximate nearest neighbor search, ANNS)等知识检索手段融入外部知识,从而显著提升大型语言模型(large language model, LLM)生成质量的方法.然而,随着外部知识库的不断膨胀, ANNS索引的存储需求也急剧增加,使得海量数据存储在内存中变得不切实际.这进一步促进了基于磁盘的ANNS的发展和应用,但也大大增加了RAG系统的响应时间.为解决这一问题,本文提出了PipeRAG,该系统通过流水线化执行基于磁盘的ANNS检索与LLM的预填充过程,有效地重叠了知识检索和模型推理的延迟,从而在确保检索精度的同时有效提升了RAG系统的整体性能.具体而言, PipeRAG设计了两个核心机制:“ANNS自适应预取机制”和“RAG动态流水线调度策略”,前者能够根据当前的检索状态实时调整预取速度,从而在性能与精度之间取得最佳平衡;后者则综合考虑了ANNS预取速度与LLM分块预填充的延迟,动态地调整预填充任务的大小,以实现最优的流水效率.在实际负载下的广泛评估显示, PipeRAG成功地将基于磁盘的ANNS的RAG系统的响应延迟缩短了25%~71%,同时保持了极低的召回率损失.
余润杰阳羽凡周健周健
共1页<1>
聚类工具0