基于RISC-V加速器实现FPGA CNN异构的控制方案.docx
《基于RISC-V加速器实现FPGA CNN异构的控制方案.docx》由会员分享,可在线阅读,更多相关《基于RISC-V加速器实现FPGA CNN异构的控制方案.docx(6页珍藏版)》请在第一文库网上搜索。
1、基于R1SCT加速器实现FPGACNN异构的控制方案吴海龙,李金东,陈翔,电子与信息工程学院,中山大学,中国摘要:现场可编程门阵列(FPGA)具有低功耗、高性能和灵活性的特点。FPGA神经网络加速的研究正在兴起,但大多数研究都基于国外的FPGA器件。为了改善国内FPGA的现状,提出了一种新型的卷积神经网络加速器,用于配备轻量级R1SCT软核的国产FPGA(紫光同创PG21100H)。所提出的加速器的峰值性能达到153.6GOPs,仅占用14K1UT(查找表)、32个DRM(专用RAM模块)和208个APM(算术处理模块)。所提出的加速器对于大多数边缘A1应用和嵌入式系统具有足够的计算能力,为国
2、内FPGA提供了可能的AI推理加速方案。背景卷积神经网络在机盗视觉任务中越来越流行,包括图像分类和目标检测。如何在有限的条件下充分发挥FPGA的最大性能是各研究者的主要方向。如今,大多数CCN使用外国FPGA器件。由于国内FPGA起步较晚,其相关开发工具和设备落后于其他外国制造商。因此,在国内FPGA上构建高性能CNN并替换现有成熟的异构方案是一项具有挑战性的任务。Zhang1于2015年首次对卷积网络推理中的数据共享和并行性进行了深入分析和探索。Guo2提出的加速器在214MHZ下达到了84.3GOP/s的峰值性能。2016年,Qiu3更深入地探索了使用行缓冲器的加速器。本文提出了一种更高效
3、、更通用的卷积加速器。提出的加速器峰值性能达到153.6G0Ps,仅占用14K1UT、32个DRM和208个APM。本文的章节安排如下,第2节介绍了我们提出的加速器的详细设计以及基于RISC-V的加速器实现的控制调度方案。第3节给出了实验结果。系统设计整个RISCT片上系统设计如图1所示。该系统主要由R1SCT软核坠、指令/数据存储器、总线桥、外围设备、DMA(直接存储器访问)和卷积加速器组成。Keys1EDOVS640Seria1InterfaceSDcardO1EDFig.1.片上RISC-V系统设计图我们的工作主要在三个方面。首先,我们使用软核CP1J作为片上系统的主控,控制外设,DMA
4、,CNN加速器来实现数据调度和操作。其次,ID(一维)加速器被设计用于改变缓冲机制。第三,为紫光同创的FPGA设备设计了一个DMAIP,用于卷积加速的应用。A、RISC-V软核CPU架构软核。使用RISC-V软核VexRiscv代替Ibex4构建RISC-V的片上系统和面向软件的方法可以使VexRiscv具有高度的灵活性和可扩展性。接口。些和SP1等外围设备通过APB3总线连接到R1SCT软核。DMA和加速器通过PMB总线连接到RISC-V软核。指令与数据存储。程序被交叉编译以获得一个特定的文件,该文件由JTAG烧录到片上指令/数据存储器中。B、CNN加速器结构输入缓存。使用乒乓缓存来实现缓冲
5、区,可以有效地提高吞吐量。输出缓存。权重缓存模块由一系列分布式RAM和串行到并行单元组成。卷积。图2中的ID卷积模块分为四组,其中包含四个ID卷曲单元。每个单元负责ID卷积的一个信道。合并。积分模块有四组加法器树。每组加法器树将每组卷积运算单元的结果相加,得到单向输出结果。累加。累加模块中有四组FIFO和四个加法器。加速器一次只能接收四个通道的输入特征图数据。量化。该量化模块由乘法单元和移位单元组成。它通过比例变换将24位累加结果重新转换为8位5o激活。激活功能通过查找由一系列分布式RAM组成的表来实现。它存储Re1u1eakyRe1u和sigmoid函数的INT8函数表。池化。确定当前卷积层
6、是否与池化层级联,然后决定是否使用池化模块来完成池化操作。输出缓存。输出缓冲器由F1FO而不是乒乓缓存实现。输出高速缓存F1FO将结果存储回片外存储器,作为下一卷积层的输入。InputBufferWeightCacheConvo1utionIntegrationAccumu1ationQuantizationActuationpoo1ingFig.2.CNN加速器实现C、DMA结构神经网络不仅对计算能力有很高的要求,而且对内存也有很大的需求。中低端FPGA通常需要则SRAM(双数据速率同步动态随机存取存储器)来承载整个神经网络和所有中间运算结果的权重。紫光同创的FPGA的DDR3内存驱动I11
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于RISC-V加速器实现FPGA CNN异构的控制方案 基于 RISC 加速器 实现 FPGA CNN 控制 方案