为什么用FPGA来加速YOLOV2.docx
《为什么用FPGA来加速YOLOV2.docx》由会员分享,可在线阅读,更多相关《为什么用FPGA来加速YOLOV2.docx(7页珍藏版)》请在第一文库网上搜索。
1、为什么用FPGA来加速Y010V21GPu加速:GP1J是一种多核处理器,GPU起初是用来进行图形处理任务的,经过长时间的发展,GPU的发展是日趋复杂的,而且针对不同的领域也有不同。当GPU被用来进行通用计算时,就产生了一些通用的计算框架,比如说OPenCI和CUDA。比如说高端GPUIItan系列,其频率可以达到IGhz,拥有330GB的带宽,提供每秒极高的算力,但是功耗也达到了惊人的250W。对于嵌入式的GPU,比如说graX1,拥有256个处理核,带宽为2Bs,同样在IGhZ的频率下,算力仍可以达到近Titan的十分之一,但是功耗只有10W。2. ASIC加速:这些直左分为两类:第一类,
2、用来做训练和推理,这些芯片可以用来做DNN的训练,也可以做DNN的推理。第二类,用来做推理,这些ASICs用来运行在GPU或者其他硬件上已经训练好的模型,然后对训练过的网络进行修改,使得网络可以运行在不同的AS1C上。3. FPGA加速:FPGA是一种可以重复配置的电路。在延迟方面,FPGA要比GPU更好。FPGA可以提供很高的带宽同时也可以降低延迟。1.2FPGA实现要实现某种运算,其中一种方法就是将这种运算以电路的方式实现,而使用FPGA就是其中一个相对简单的方法,使用者可以将FPGA配置为所需要的电路。基于指令的硬件是通过软件来实现的,而FPGA是通过专用硬件实现的。对于一些需要低延迟的
3、算法,比如说智能驾驶,FPGA的延迟要比GPU更低。当时用FPGA时,可以将延迟控制在1微秒或者1微秒之外,但是对于CPU来说,延迟低于50微秒,性能就已经很强了。除此之外,FPGA的定制化更强,延迟能够人为的控制,FPGA不需要操作系统,内部也不需要想CPU一样通过总线进行通行。在FPGA中,可以连接任何的数据源,比如说网口或者传感器,可以直接通过芯片的引脚就可以连接,这就和GPU与CPU形成了鲜明的对比(GPU和CPU与外界数据交互需要标准总线进行连接)。FPGA的直连技术可以为数据提供很高的带宽,同时也降低了时延。2、为什么用FPGA来加速Y010V2对于卷积核和池化的运算来说,因为是矩
4、阵运算,这就需要相当高的算力。而由于卷积和池化运算都是流式运算,所以将他们放在FPGA中实现从而进行加速是一个很好的选择。对于YO1oV2中的部分运算,比如说计算坐标图像的预处理等,都是一些非流式运算,或者是标准运算,这些运算适合放在ARM中进行,于是将YO1oV2中的运算做一下划分,充分利用软硬件协同的优势,从而对整个算法进行加速。FPGA:卷积层和池化层ARM:SoftmaxTyPeFi1tersSneZStrideOutputHW/SWCoJnfOhItiDj13233224224HWMajoo122/2112112HWCo1nrohItiDI16433112112HWMajqtoo12
5、2/25656HWConvo1ution128335656HWConvo1ution64115656HWComrohitbn128335656HWMaoo122/22828HWCoitvohitiDii256332828HWConvohtn128112828HWConvohtn256332828HWMaoo122/21414HWConvohitiDii512331414HWCOJnfOhItiDjI256111414HWConvo1ution512331414HWConvohition256111414HWConvohtn512331414HWMajoo122/277HWConvohition
6、10243377HWConvohtn5121177HWConvohition10243377HWConvohtn5121177HWConvohition10243377HWConvohitionIOOO1177HWAvgpoo1G1oba11000HWSoftonaxG1oba11000SW3、FPGA简介3.1 FPGA的基本结构基本构成:C1B(可配置逻辑块),IOS(输入输出模块),IR(互联资源)FPGA的功能是由S幽中的数据类配置的,所以大部分FPGA芯片中都是采用查找表结构的。FPGA中组合逻辑使用小型1UT实现的,这些1UT输出端连接到D触发器的输入端,D在连接到其他逻辑电路或者
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 为什么 FPGA 加速 YOLOV2