搜索到7602篇“ 计算统一设备架构“的相关文章
一种计算统一设备架构的超大像素图像处理方法及系统
本申请提供了一种计算统一设备架构的超大像素图像处理方法及系统中,首先通过计算统一设备架构接收超大像素图像,对超大像素图像进行不同尺度池化,得到池化图像集,依据池化图像集进行池化预测,得到池化预测图像集,根据池化预测图像集...
杨泽霖刘伟生杨科山
一种计算统一设备架构的超大像素图像处理方法及系统
本申请提供了一种计算统一设备架构的超大像素图像处理方法及系统中,首先通过计算统一设备架构接收超大像素图像,对超大像素图像进行不同尺度池化,得到池化图像集,依据池化图像集进行池化预测,得到池化预测图像集,根据池化预测图像集...
杨泽霖刘伟生杨科山
基于计算统一设备架构的高铁故障诊断方法被引量:3
2015年
为解决传统高铁振动信号故障诊断方法速度慢、难以满足实时处理的要求,提出一种基于计算统一设备架构(CUDA)加速的高铁振动信号故障诊断方法。首先利用CUDA架构对高铁数据进行经验模态分解(EMD),进而计算分解所得到的各个分量的模糊熵,最后利用最近邻分类(KNN)算法对多个模糊熵特征组成的特征空间进行故障分类。实验结果表明,该方法能高效地对高铁振动信号进行故障分类,运行速度较传统方法有明显提高。
陈志李天瑞李明杨燕
关键词:故障诊断计算统一设备架构经验模态分解模糊熵
基于包围跳跃的计算统一设备架构光线投射算法
2014年
针对传统光线投射算法绘制速度慢和图形处理器(graphics processing unit,GPU)不能有效进行并行计算的缺点,文章提出一种基于包围跳跃的计算统一设备架构(compute unified device architecture,CUDA)光线投射算法。首先介绍了CUDA的编程模型和线程结构,然后用包围盒技术隔离体数据周围无效的空体素,减少投射光线的数目;利用光线跳跃技术,在包围盒内进行快速光线的合成,跳过透明的体素,减少大量体素的重采样;最后使用CUDA强大的并行处理计算的功能实现光线投射算法。实验结果表明,在保证图像质量的同时,绘制速度上比基于GPU加速的光线投射算法有14倍的提高,能够接近实时绘制,有很好的应用价值。
方军房晓阳肖亮
关键词:光线投射体绘制包围盒
基于计算统一设备架构的高斯径向基图像插值快速实现方法研究
2014年
在医学图像的处理及分析中,常常需要对图像进行插值运算。尽管高斯径向基(GRBF)插值有插值精度高的优点,但运算时间长的不足仍限制了它在图像插值中的应用。因此,本文提出采用基于计算统一设备架构(CUDA)的方法实现二维和三维医学图像的GRBF快速插值。根据CUDA单指令多线程(SIMT)的执行模型,采用合并访存、共享内存等各种合适的内存优化措施。并且在应用对数据空间进行二维分块,三维分体策略的过程中使用基于重叠区域的自然缝合算法来消除图像插值连接边界的失真现象。在保持较高图像插值精度的基础上,二维和三维医学图像GRBF插值各基本计算步骤都得到了极大的加速。实验结果表明:基于CUDA平台的GRBF插值执行效率与传统CPU运算相比明显提高,对其在图像插值中的应用具有相当的参考价值。
陈浩陈兆学喻海中
关键词:计算统一设备架构内存优化
基于计算统一设备架构的程序优化研究
2011年
计算统一设备架构(CUDA)是通用计算领域的生力军,是世界最强计算机的引擎。但由于架构的特殊性,基于CUDA的程序必须进行专门的优化。为使编程人员了解CUDA程序的优化,从编程方法,存储器使用以及指令流优化等方面阐述CUDA程序优化措施的同时,结合一个实例进行了比较测试,测试结果显示经充分优化的程序比优化前快30倍。最后,给出了优化措施的参考排序。
杨云生张朝晖
关键词:CUDA信号处理
模型的空间靠近检查方法及相关装置
本申请实施例提供了一种模型的空间靠近检查方法及相关装置,涉及计算机技术领域。该方法应用于GPU,该方法包括:确定处于目标空间中的多个目标模型,以及获得各目标模型的几何数据,其中,目标空间被划分为多个体素网格,体素网格为立...
沈益哲
高分辨率大气谱线并行计算方法研究被引量:1
2024年
大气谱线计算是大气辐射传输中的一个重要环节,其计算速度慢是长期以来限制大气辐射传输计算效率的主要问题之一。通过对大气透过率中谱线计算可并行性的分析,利用图形处理器(GPU)构建了基于GPU并行处理的大气谱线计算模型。针对大气环境和高温环境进行仿真计算,结果表明,相较于中央处理器(CPU),基于GPU的并行算法模型可以在达到相同精度的同时,计算速度提升1~3个数量级。在此基础上,使用Malkmus带模式参数拟合法,基于并行计算构建了相关K分布系数表,能够支持并行计算成果在无GPU或内存受限设备上的使用,提高该技术的普适性。为常规大气、高温燃气等条件下的高分辨快速辐射传输计算提供新的技术途径。
马志昂李大成吴军程晨
关键词:光学计算并行处理计算统一设备架构
基于图形处理器的水下目标传递函数多频点处理方法
2024年
为了提高水下目标宽带回波的计算速度,本文提出一种基于图形处理器GPU的散射传递函数多频点快速计算解决方案。相较于传统算法中逐个频率点计算的方式,CUDA快速算法充分利用各频点处目标强度的相对独立性,基于GPU的硬件特点,同时计算宽带内的散射声场,从而显著提高了计算效率。本文以潜航器模型为算例,对不同网格数量下模型的目标散射传递函数计算速度进行对比分析。仿真结果表明,相较于传统的CPU串行计算,采用CUDA快速算法能够实现超过80的加速比,有效提高了计算速度。
钱浩然王斌
关键词:图像处理器计算统一设备架构并行计算
可配置的处理器分区
用于为多进程服务配置处理器分区的装置、系统和技术。在至少一个实施例中,多进程服务配置一个或更多个并行处理单元的一组流式多处理器,以基于并行处理库(诸如,计算统一设备架构(CUDA))可访问的一个或更多个用户定义的数据值来...
A·X·胡K·佩列雷金

相关作者

吴先良
作品数:452被引量:691H指数:10
供职机构:安徽大学
研究主题:电磁散射 雷达散射截面 矩量法 时域有限差分 天线
叶剑
作品数:5被引量:14H指数:2
供职机构:解放军信息工程大学电子技术学院
研究主题:GPU 计算统一设备架构 图形处理器 AES 高级数据加密标准
孙冬
作品数:110被引量:106H指数:5
供职机构:安徽大学
研究主题:图像 齿轮箱 标签分类 标签 齿轮箱故障
杜晓刚
作品数:50被引量:66H指数:5
供职机构:兰州交通大学
研究主题:医学图像 CUDA 隐私保护 变化检测 治疗计划系统
李立新
作品数:103被引量:503H指数:10
供职机构:中国人民解放军信息工程大学
研究主题:可信计算 可信计算平台 网络处理器 信息安全 公钥基础设施