搜索到360篇“ 单指令多数据“的相关文章
用于神经处理单元的单指令多数操作的高效选择
用于神经处理单元的单指令多数操作的高效选择的系统和方法。示例处理器系统包括被配置为执行与神经网络相关联的卷积的矩阵处理器和与矩阵处理器通信的单指令多数(SIMD)处理器,SIMD处理器基于与处理神经网络相关联的当前位...
D·霍普P·萨索内J·隆吉诺
一种单指令多数SIMD指令的生成、处理方法以及相关设备
本申请实施例公开一种SIMD指令的生成、处理方法以及相关设备,用于芯片领域的SIMD指令生成领域中。方法可以包括:获取第一张量计算式的每个循环维度的长度,根第一张量计算式的每个循环维度的长度,从多组第一SIMD指令模型...
武琛林逸凡淡孝强
一种三模冗余电路网表的仿真加速方法
本发明涉及抗辐照集成电路网表仿真处理方法技术领域,且公开了一种三模冗余电路网表的仿真加速方法,包括以下步骤:S1、对三模冗余电路IR中间表示代码按照指令组合模板定义进行中间代码筛选;S2、筛选后的三模冗余电路中间代码进行...
刘檬靳淑蕉刘涤
一种GPU资源隔离方法、系统、介质及产品
本发明公开了一种GPU资源隔离方法、系统、介质及产品,本发明方法包括获取各个GPU的属性信息;将各个GPU的属性信息以含计算资源分配状态的位图的形式格式化成位图表保存;等待来自虚拟机中应用的GPU资源请求,在收到GPU资...
张浩张铎谢明李唯实
混洗SRAM:SRAM中的并行按位数混洗
2025年
向量处理单元(vector processing unit,VPU)已被广泛应用于神经网络、信号处理和高性能计算等处理器设计中,但其总体性能仍受限于专门用于对齐数的混洗操作.传统上,处理器使用其数混洗单元来处理混洗操作.然而,使用数混洗单元来处理混洗指令将带来昂贵的数移动开销,并且数混洗单元只能串行混洗数.事实上,混洗操作只会改变数的布局,理想情况下混洗操作应在内存中完成.随着存内计算技术的发展,SRAM不仅可以作为存储部件,同时还能作为计算单元.为了实现存内混洗,提出了混洗SRAM,它可以在SRAM体中逐位地并行混洗多个向量.混洗SRAM的关键思想是利用SRAM体中位线的数移动能力来改变数的布局.这样SRAM体中位于同一位线上不同数的相同位可以同时被移动,从而使混洗操作拥有高度的并行性.通过适当的数布局和向量混洗扩展指令的支持,混洗SRAM可以高效地处理常用的混洗操作.评测结果表明,对于常用的混洗操作,混洗SRAM可以实现平均28倍的性能增益,对于FFT,AlexNet,VggNet等实际的应用,可以实现平均3.18倍的性能增益.混洗SRAM相较于传统SRAM的面积开销仅增加了4.4%.
张敦博曾灵灵王若曦王耀华沈立
模型的推理优化方法、系统、电子设备和存储介质
本申请实施例涉及深度学习技术领域,特别涉及一种模型的推理优化方法、系统、电子设备和存储介质,该方法包括:获取模型的算子信息和中央处理单元CPU的硬件信息;根所述模型的算子信息、所述CPU的硬件信息和预设的策略生成算法,...
王超金士英刘涛屠要峰
用于合成打印数并且将打印数提供给打印机的方法和产品
本发明涉及用于合成M位打印数并且将M位打印数提供给打印机的方法、优选地计算机实现的方法,该方法包括:a)将至少一个图像的基于对象的数以页面描述语言的形式输入到光栅图形处理器中,所述光栅图形处理器具有至少一个包括多个...
T·斯托尔
卷积神经网络运算
公开了用于在单指令多数(SIMD)单元上执行运算的方法和系统。所公开的技术在一个计算机循环期间对输入数执行点积运算,该点积运算包括对该输入数进行卷积、生成中间数、以及对该中间数应用一个或多个过渡运算以生成输出数...
布莱恩·恩贝林迈克尔·曼特迈克尔·Y·乔何斌
处理器架构
一种包括控制单元(3)和多个处理单元(5)的处理器(1),所述多个处理单元根由所述控制单元从以下架构中的至少两个以及以下架构的组合中动态施加的操作架构相互作用:‑单指令多数(SIMD)流架构,‑多指令单数(MISD...
克哈莱德·玛来吉特朗格·邓格·恩古延朱利恩·斯奇米特皮埃尔-伊曼纽尔·伯纳德
电子设备和用于电子设备的方法
一种用于将数存储于邻接存储器地址处的方法,其包含,在单指令多数SIMD处理器处,执行并行前缀有效计数指令以确定第一数向量的第一偏移且确定包含有效数和无效数的第二数向量的第二偏移。所述第二偏移基于所述第一偏移及...
艾瑞克·马胡林戴维·霍伊尔

相关作者

严晓浪
作品数:488被引量:989H指数:15
供职机构:浙江大学电气工程学院
研究主题:集成电路 VLSI 低功耗 版图 光学邻近校正
孟建熠
作品数:59被引量:50H指数:3
供职机构:复旦大学微电子研究院
研究主题:低功耗 缓冲器 嵌入式处理器 寄存器 缓存
秦兴
作品数:57被引量:178H指数:9
供职机构:杭州电子科技大学
研究主题:数控系统 卷积神经网络 基于FPGA 单指令多数据 多媒体处理
陈志坚
作品数:35被引量:51H指数:3
供职机构:浙江大学
研究主题:嵌入式处理器 单指令多数据 数据类型 自适应 低功耗
刘衡竹
作品数:161被引量:189H指数:7
供职机构:国防科学技术大学
研究主题:向量 向量处理器 SIMD 矩阵 寄存器文件