您的位置: 专家智库 > >

张祯

作品数:13 被引量:6H指数:1
供职机构:江南计算技术研究所更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 11篇专利
  • 1篇期刊文章

领域

  • 5篇自动化与计算...

主题

  • 6篇计算机
  • 6篇高性能计算机
  • 6篇高性能
  • 5篇网络
  • 5篇计算机系
  • 5篇计算机系统
  • 5篇高性能计算机...
  • 2篇地址自动配置
  • 2篇源库
  • 2篇通路
  • 2篇网络负载
  • 2篇网络设计
  • 2篇文件服务器
  • 2篇节点管理
  • 2篇结点
  • 2篇镜像
  • 2篇基于资源
  • 2篇集中式
  • 2篇监控数据
  • 2篇管理单元

机构

  • 12篇江南计算技术...

作者

  • 12篇建澜涛
  • 12篇张祯
  • 12篇黄益明
  • 9篇韩小虎
  • 8篇吴智
  • 1篇丁亚军
  • 1篇石嵩

传媒

  • 1篇计算机工程

年份

  • 1篇2024
  • 3篇2022
  • 1篇2021
  • 6篇2020
  • 1篇2019
13 条 记 录,以下是 1-10
排序方式:
一种高性能计算机监控方法及系统
一种高性能计算机监控方法及系统,属于高性能计算机系统监控技术领域。本发明的方法包括:轮询采集一般监控数据,中断采集重点监控数据;对采集到的一般监控数据和重点监控数据按实时数据和历史数据进行分类存储;根据监控请求,将相应的...
张春林黄益明建澜涛张祯吴智韩小虎
文献传递
一种适用于高性能计算机的地址自动配置系统
本发明涉及网络设计与控制领域,具体涉及一种适用于高性能计算机的地址自动配置系统。本发明通过以下技术方案得以实现的:BMC管理系统,所述BMC管理系统包含编号配置模块和基于所述物理编号生成自身地址的地址生成模块,所述BMC...
张祯吴智黄益明张春林韩小虎建澜涛郑生滨
一种基于资源优化策略的基层故障诊断方法及装置
本发明公开了一种基于资源优化策略的基层故障诊断方法及装置,该方法包括构建整机故障诊断树,整机故障诊断树包括由系统基层至顶层分别设置的第一级管理单元、第二级管理单元、第三级管理单元;当各第一级管理单元采集到总错监控数据时,...
建澜涛黄益明张祯陈恒郑生滨朱可夫
文献传递
一种计算机系统中基于自学习的并行故障定位方法及系统
一种计算机系统中基于自学习的并行故障定位方法及系统,属于高性能计算机维护技术领域。本发明的方法包括:查找故障点;并行对各个故障点的故障现象采用专家诊断模块进行诊断,若诊断有结果,则输出结果;否则采用智能诊断模块进行诊断,...
丁亚军建澜涛黄益明张祯张春林韩小虎
文献传递
一种适用于高性能计算机的地址自动配置系统
本发明涉及网络设计与控制领域,具体涉及一种适用于高性能计算机的地址自动配置系统。本发明通过以下技术方案得以实现的:BMC管理系统,所述BMC管理系统包含编号配置模块和基于所述物理编号生成自身地址的地址生成模块,所述BMC...
张祯吴智黄益明张春林韩小虎建澜涛郑生滨
紧耦合高性能计算机系统BMC系统自动修复方法及修复系统
本发明属于高性能计算机系统维护领域,尤其涉及紧耦合高性能计算机系统BMC系统自动修复方法及修复系统。其特征在于,包括:管理系统监测到BMC启动失败时,控制其重新启动,从网络文件服务系统获取启动所需的BMC启动文件并将所述...
吴智张春林韩小虎张祯建澜涛黄益明
文献传递
一种基于资源优化策略的基层故障诊断方法及装置
本发明公开了一种基于资源优化策略的基层故障诊断方法及装置,该方法包括构建整机故障诊断树,整机故障诊断树包括由系统基层至顶层分别设置的第一级管理单元、第二级管理单元、第三级管理单元;当各第一级管理单元采集到总错监控数据时,...
建澜涛黄益明张祯陈恒郑生滨朱可夫
E级高性能计算机的维护故障诊断系统研究被引量:6
2022年
E级计算机系统规模巨大,使得故障异常总量随之增多,导致诊断发现的难度增加,因此,迫切需要一套更加准确高效的实时维护故障诊断系统,对硬件系统进行全面的异常及故障信息实时检测、故障诊断及故障预测。传统故障诊断系统在面对数万节点规模的诊断时存在执行效率低、异常检测误报率高的问题,异常检测及故障诊断的覆盖率不足。对异常及故障检测、故障诊断与故障预测相关技术进行研究,分析技术原理及适用性,并结合E级高性能计算机实际工程需求,设计一套满足数E级高性能计算机需求的维护故障诊断系统。基于维护系统的结构组成设计可扩展的边缘诊断架构,将高性能计算机系统知识、专家知识与数理统计、机器学习相融合给出故障检测、诊断及预测算法,并针对专用场景建立预测模型。实验结果表明,该系统具有较好的可扩展性,能在10 s内完成对十万个节点规模系统的故障诊断,与传统故障诊断系统相比,异常检测某特定指标误报率从3.3%降低到几乎为0,硬件故障检测覆盖率从90.2%提升至96%以上,硬件故障诊断覆盖率从71%提升至约94%,能较准确地预测多个重要应用场景下的故障。
建澜涛任秀江张祯石嵩黄益明张春林
关键词:异常检测故障诊断故障预测
一种分布式维护系统的更新方法及系统
本发明公开了一种分布式维护系统的更新系统及方法。本发明涉及的一种分布式维护系统的更新系统,包括管理结点、一级代理、二级代理,所述管理结点上部署一级代理源库和二级代理源库,所述一级代理上部署二级代理镜像库;所述一级代理源库...
建澜涛赵起锋黄益明庄佳远张祯张春林韩小虎吴智
一种基于冗余的嵌入式系统
本发明属于高可靠嵌入式系统设计与应用领域,尤其涉及一种基于冗余的嵌入式系统。包括嵌入式处理器;启动检测与切换电路,通过总线与嵌入式处理器连接;第一存储器,通过总线与启动检测与切换电路连接;第二存储器,通过总线与启动检测与...
吴智张春林韩小虎张祯建澜涛黄益明
文献传递
共2页<12>
聚类工具0