FPGA与GPU计算存储加速对比:单位功耗性能考量因素.docx
《FPGA与GPU计算存储加速对比:单位功耗性能考量因素.docx》由会员分享,可在线阅读,更多相关《FPGA与GPU计算存储加速对比:单位功耗性能考量因素.docx(5页珍藏版)》请在第一文库网上搜索。
1、FPGA与GPU计算存储加速对比:单位功耗性能考量因素为了提升计算基础设施的性能,并紧跟数据分析与AI不断攀升的需求,众多企业将硬性加速视为主要的解决方案。在大多数情况下,先进的可编程硬件(主要是指GPU和FPGA)是加速的主要方式。通过使用这种先进的硬件,企业正在赢得计算优势;然而,对于编程难度,他们仍然存在合理的担忧。图1:分析/AI流水线组件硬件制造商正在将加速方法应用于计算存储,这是专门设计用于包含内嵌计算元素的存储。这种方法已经被证明可以为分析和AI应用提供优异的性能(图1)。使用或者不使用机受辅助的分析以及验证,都可以借助计算存储器件进行加速。这些器件提供了一个关键的优势,使得成本
2、高昂的计算被卸载到存储器件上,而不必在服务器CPU上完成。与标准的存储/CPU方法相比,通过计算存储获得的优势包括:1借助应用专用编程定制可编程硬件,获得更高性能2 .将计算任务从服务器卸载到存储器件,释放CPU资源3 .数据与计算共址,降低数据传输需求这种新颖的方法前景光明。不过,您应根据具体用例评估这种方法,考量性能、成本、功耗和易用性。性价比和单位功耗性能在选择加速硬件评估时,占据主要比率。在本文中,我们将研讨单位功耗性能(另一篇文章则专门研讨性价比)。计算存储功耗比较3种系统在这个场景中,我们将比较以CSV数据读取用例为主的三种工具:英伟达GPUDirect存储和RA1DS存储,以及基
3、于赛灵思技术的三星SmartSSD存储。CSV读取在计算密集型流水线中起着重要的作用(参见图1)O在下文中,我们将性能定义成CSV的处理速率,或处理“带宽”。我们先快速回顾一下三种系统的运行方式。英伟达GPUDirect存储 端到端满足分析和AI需求 将GPU用作计算单元,紧贴基于NVMe的存储器件布局(GPUDireCt) 使用CUDA进行编程(RAPIDS)英伟达用其CSV数据读取技术衡量相对于标准SSD的性能提升。结果如图1所示。使用1到8个加速器时,对应的吞吐量是4到23GBso三星SmartSSD驱动器 将赛灵思FPGA用作计算单元 与存储逻辑内嵌驻留在同一个内部PCIe互联上 通过
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- FPGA GPU 计算 存储 加速 对比 单位 功耗 性能 考量 因素