搜索到766篇“ 混合编程模型“的相关文章
- 基于MPI与OpenMP混合编程模型的大型工程结构并行Woodbury非线性分析方法
- 2024年
- 基于Woodbury公式的非线性分析方法避免了结构非线性分析过程中整体刚度矩阵的反复更新和分解,然而,因局限于单机计算,该方法仅适用于中小规模结构的非线性分析。为此,通过两级稀疏近似策略对基于子结构技术的Woodbury法(简称“子结构Woodbury法”)进行改进,结合MPI与OpenMP混合编程模型提出了并行Woodbury非线性分析方法。该方法将整体结构剖分为若干个子结构,其中子结构级别的计算任务通过MPI并行编程模型实现,而每个子结构单元级别的计算任务则嵌套OpenMP并行编程模型完成。所提方法不仅克服了子结构Woodbury法在非线性区域规模较大时变得低效的局限性,也突破了现有Woodbury法的单机性能瓶颈。算例分析结果表明:所提方法能充分利用多个计算节点实现计算效率的大幅提升,其中非线性系数矩阵更新和求解过程降低的计算耗时最为显著,是提升整体分析效率的关键。
- 苏璞余丁浩李钢
- 关键词:非线性并行计算
- 基于MPI和OpenMP混合编程模型并行计算提高计算速度的方法
- 本发明公开了一种基于MPI和OpenMP混合编程模型并行计算提高计算速度的方法,包括:根据计算节点数目和节点内可用CPU核数确定可调用的MPI进程数和OpenMP线程数;每个进程读入已有子稀疏矩阵A、子初始向量x<Sub...
- 罗海飙王婷陈春艳廖俊豪
- 基于三层混合编程模型的Petri网并行算法研究被引量:2
- 2017年
- 为解决多核机群Petri网并行化过程中,运用MPI+OPenMP混合编程实现同步会出现死锁的问题,提出了基于三层混合编程模型的Petri网并行算法。首先,根据事务内存的同步优势,在多核机群环境下构建MPI+OPenMP+STM的三层编程模型;然后,对Petri网的几何模型与代数模型的并行化进行分析,建立MPI+OPenMP+STM三层结构的Petri网并行模型,并对三层混合编程模型的Petri网并行算法进行设计与分析;最后,通过示例进行编程验证,该算法的运行效率明显优于其他编程模式,而且Petri网的规模越大,其并行计算的效果就越明显。因此,该算法是多核机群环境下模拟Petri网并行运行的一种高效且可行的算法。
- 周杰李文敬
- 关键词:PETRI网
- 基于MPI+OpenMP混合编程模型的并行声纳信号处理技术研究被引量:4
- 2017年
- 针对多核分布式共享存储集群的特点,提出了一种基于MPI+OpenMP混合编程模型的声纳信号处理并行计算技术,该模型结合了消息传递和共享存储两者的优点,为现代声纳信号处理中海量数据的实时处理及复杂算法的实时实现提供了解决方案。
- 胡银丰孔强
- 关键词:声纳信号处理并行计算MPIOPENMP
- 基于CPU/GPU异构体系结构的混合编程模型被引量:2
- 2015年
- 随着计算机GPU硬件的快速发展,GPU编程环境变得友好,CPU/GPU异构体系结构也被广泛的应用。文章为了有效利用CPU/GPU异构体系结构的优点,并提出了基于该体系结构的两种并行编程模型,使得并行程序设计研究人员使用CPU/GPU异构体系结构的并行编程模型来对大量的程序进行设计,从而最大程度地提高程序的性能。
- 高玉励周秀娟张国凯
- 关键词:GPU
- 基于MPI和OpenMP混合编程模型并行计算提高计算速度的方法
- 本发明公开了一种基于MPI和OpenMP混合编程模型并行计算提高计算速度的方法,包括:根据计算节点数目和节点内可用CPU核数确定可调用的MPI进程数和OpenMP线程数;每个进程读入已有子稀疏矩阵A、子初始向量x<Sub...
- 罗海飙王婷陈春艳廖俊豪
- 基于混合编程模型的支持向量机训练并行化被引量:2
- 2015年
- 支持向量机(support vector machine,SVM)是一种广泛应用于统计分类以及回归分析的监督学习方法.基于内点法(interior point method,IPM)的SVM训练具有空间占用小、迭代趋近快等优点,但随着训练数据集规模的增大,仍面临处理速度与存储空间所带来的双重挑战.针对此问题,提出利用CPU-GPU异构系统进行大规模SVM训练的混合并行机制.首先利用计算统一设备架构(compute unified device architecture,CUDA)对基于内点法的SVM训练算法的计算密集部分并行化,并改进算法使其适合利用cuBLAS线性代数库加以实现,提高训练速度;然后利用消息传递接口(message passing interface,MPI)在集群系统上实现CUDA加速后算法的分布并行化,利用分布存储有效地增加所处理数据集规模并减少训练时间;进而基于Fermi架构支持的页锁定内存技术,打破了GPU设备存储容量不足对数据集规模的限制.结果表明,利用消息传递接口(MPI)和CUDA混合编程模型以及页锁定内存数据存储策略,能够在CPU-GPU异构系统上实现大规模数据集的高效并行SVM训练,提升其在大数据处理领域的计算性能和应用能力.
- 李涛刘学臣张帅王恺杨愚鲁
- 关键词:计算统一设备架构消息传递接口
- CPU/GPU混合编程模型上的并行谱聚类实现
- 谱聚类作为极具竞争力的聚类算法,目前已经取得了较广泛的应用。谱聚类算法本质是通过特征分解,将原始的高维数据空间映射到特征向量空间,即低维的线性测度空间,然后对特征向量空间中的数据点进行聚类,所以谱聚类方法相对简单,对复杂...
- 焦晓帆
- 关键词:谱聚类混合编程模型数据处理空间复杂度
- MPI+OpenMP混合编程模型在大规模三对角线性方程组求解中的应用被引量:4
- 2011年
- 分布式共享存储系统的特点是每个节点内是共享存储的,而节点间是分布式存储.为了更好地利用这种多级体系结构,讨论了MPI+OpenMP混合编程模型的性能及实现方法,建立了大规模三对角线性方程组的MPI+OpenMP混合并行算法,并在上海大学高性能计算集群上与单纯MPI算法进行了性能方面的比较.结果表明,MPI+OpenMP混合并行算法具有更好的加速比和扩展性.
- 郑汉垣刘智翔封卫兵张武
- 关键词:混合编程模型分布共享存储三对角线性方程组MPI
- MPI+OPENMP混合编程模型在大规模三对角线性方程组求解中的应用
- 分布式共享存储系统的特点是每个节点内是共享存储的,而节点间是分布式存储。为了更好地利用这种多级体系结构,讨论了MPI+OPENMP混合编程模型的性能及实现方法,建立了大规模三对角线性方程组的MPI+OPCNMP混合并行算...
- 关键词:混合编程模型分布共享存储三对角线性方程组MPI
相关作者
- 郑汉垣

- 作品数:43被引量:69H指数:4
- 供职机构:上海大学计算机工程与科学学院
- 研究主题:格子BOLTZMANN方法 迭代计算 MPI 三对角线性方程组 混合编程模型
- 刘智翔

- 作品数:19被引量:14H指数:3
- 供职机构:上海大学通信与信息工程学院
- 研究主题:格子BOLTZMANN方法 MPI 迭代计算 混合编程模型 OPENMP
- 祝永志

- 作品数:55被引量:149H指数:7
- 供职机构:曲阜师范大学
- 研究主题:并行计算 负载均衡 BEOWULF 可扩展性 MPICH
- 笪良龙

- 作品数:247被引量:341H指数:10
- 供职机构:中国人民解放军海军潜艇学院
- 研究主题:矢量水听器 被动声纳 海洋环境 声纳 不确定性
- 张林

- 作品数:63被引量:82H指数:5
- 供职机构:中国人民解放军海军潜艇学院
- 研究主题:声传播 水声传播 并行计算 浅海 简正波