搜索到240篇“ 自动向量化“的相关文章
一种代码自动量化优化方法、设备及介质
本发明公开了一种代码自动量化优化方法、设备及介质,属于高性能计算技术领域,用于解决现有的代码自动量化较为不便,人工操作占比较大,难以支持对不规则的或存在负载依赖关系的代码进行量化,不利于计算性能的提升以及能耗的降低...
孙宗齐赵鑫鑫姜凯
可变长量架构的超字级自动量化方法
本发明公开一种面可变长量架构的超字级自动量化方法,包括:步骤1.搜索目标源标量代码的基本块中所有存储指令;步骤2.将搜索到的所有存储指令添加进存储指令组;步骤3.根据存储指令组构造SLP图,构造SLP图过程中,以存...
范小康黄春唐滔彭林方建滨沈洁于恒彪易昕苏醒
一种基于指令MKS的自动量化代价模型
2024年
自动量化代价模型是编译器进行自动量化优化时的重要组成部分,其作用是评估代码在应用量化转换后能否获得性能提升。当代价模型不准确时,编译器会应用负收益的量化转换,从而降低程序的执行效率。针对GCC编译器默认代价模型的不精确问题,以Intel Xeon Silver 4214R CPU为平台,提出了一种基于指令MKS的自动量化代价模型。该模型充分考虑了指令的机器模式、运算类型以及运算强度等,并使用梯度下降算法自动搜索不同指令类型的近似代价。在SPEC2006以及SPEC2017上进行了单线程测试,实验结果表明,该模型能够减少收益评估错误的情况。与默认代价模型生成的量程序相比,GCC编译器添加MKS代价模型后,在SPEC2006课题上最高获得了4.72%的提速,在SPEC2017课题上最高获得了7.08%的提速。
王震聂凯韩林
关键词:GCC编译器自动向量化梯度下降
一种基于重排指令融合的编译自动量化方法
本发明提供一种基于重排指令融合的编译自动量化方法,包括:初始化一量数据流;收集一个基本块中的Store指令,并按照访问的数据类型以及地址连续性来分组,形成若干个Store指令组;以所有Store指令组作为种子指令组加...
漆楚衡冯竞舸郑兆凯李姝其
一种SLP自动量化方法、装置及电子设备
本发明公开了一种SLP自动量化方法、装置及电子设备,该方法包括:先在待处理数据中确定出各SLP实例的先导实例,并根据所述先导实例将所述待处理数据进行子图划分,同时将所述待处理数据中除先导实例外的所有实例划分到对应子图中...
陈梦尧聂凯李嘉楠谢景明张朝阳胡世哲
基于国产申威处理器的自动量化优化技术研究优化研究
王震
国产平台的LLVM自动量化移植与优化被引量:2
2022年
作为SIMD扩展部件量化的重要手段,自动量化已在LLVM编译器中得到实现,但量长度以及指令集功能的差异,导致国产平台在自动量化过程中容易错失量化机会以及量化后产生倒加速的问题。为使SIMD得到充分应用,结合国产平台的指令集特征完善指令代价信息以提高收益分析精准度,使其在自动量化后生成后端支持且简洁高效的量指令。在此基础上,提出一种改进的控制流量化方法,通过添加指令代价信息提高自动量化的适配能力,从而形成一套面国产平台的LLVM自动量化系统。实验结果表明,相比自动量化移植前,通过该方法进行移植优化后,SPEC测试的整体性能提升10.8%,TSVC测试集中的加速比提升16%,精准代价指导下的加速比提升42%,控制流量化下的加速比提升51%。
李嘉楠韩林柴赟达
关键词:自动向量化
自动量化:近期进展与展望被引量:6
2022年
随着单指令流多数据流(SIMD)技术的迅速发展,近年来许多面SIMD扩展部件的自动量化编译方法被提出,有效缓解了程序员手写量程序的压力,并发挥了SIMD扩展部件的加速效能。基于此,分析总结了自动量化领域近10年的研究成果,从保义分析和变换、量化分组分析和变换、面处理器支持特性的分析和变换以及性能评估分析这4个方面分类归纳了自动量化的关键问题和主要突破,进而对4个方面的发展趋势和研究方进行了展望。
冯竞舸贺也平陶秋铭
关键词:自动向量化
申威平台的LLVM自动量化移植与优化
通过自动量化编译技术自动生成量程序,以有效地利用微处理器底层SIMD硬件提升程序的执行性能,已成为编译器研究的一个重要方。然而,由于技术路线不同,以及各种微处理器的SIMD扩展指令集的巨大差异,自动量化要针对具体...
李嘉楠
关键词:微处理器
一种基于重排指令融合的编译自动量化方法
本发明提供一种基于重排指令融合的编译自动量化方法,包括:初始化一量数据流;收集一个基本块中的Store指令,并按照访问的数据类型以及地址连续性来分组,形成若干个Store指令组;以所有Store指令组作为种子指令组加...
漆楚衡冯竞舸郑兆凯李姝其

相关作者

姚远
作品数:50被引量:84H指数:5
供职机构:中国人民解放军信息工程大学
研究主题:SIMD 自动向量化 向量化 自动并行化 面向异构
赵荣彩
作品数:266被引量:562H指数:11
供职机构:解放军信息工程大学
研究主题:向量化 网络处理器 IA-64 自动并行化 二进制翻译
李春江
作品数:53被引量:95H指数:5
供职机构:国防科学技术大学计算机学院
研究主题:GCC 编译器 处理器 SIMD 双精度
淡孝强
作品数:10被引量:9H指数:1
供职机构:国防科学技术大学计算机学院
研究主题:MATRIX GCC 自动向量化 编译器 DSP
索维毅
作品数:5被引量:1H指数:1
供职机构:解放军信息工程大学
研究主题:自动向量化 数据依赖 DSP 并行性 SLP