技术与计算负载如何驱动多芯片系统.docx
《技术与计算负载如何驱动多芯片系统.docx》由会员分享,可在线阅读,更多相关《技术与计算负载如何驱动多芯片系统.docx(8页珍藏版)》请在第一文库网上搜索。
1、技术与计算负载如何驱动多芯片系统目录1 .前言12 .真正驱动多芯片系统发展的因素1?当下的设计重心3?针对AI负载进行芯片设计的额外的挑战4?多芯片同步技术解决措施55.1.硬同步55.2.软同步65.3.相位一致性难点解决措施6?下一轮创新的侧重点是什么?6?结语81 .刖百为了解决未来应用的算力需求,半导体产业内的IP与工艺创新仍在持续发展,如今多晶片(mu1tidie)系统已经变得愈发普遍。然而,负载需求已经开始影响到计算阵列、内存以及DDR、HBM和UQe的带宽等,因为新一代的硬件都已转为面向未来的AI负载设计。2 .真正驱动多芯片系统发展的因素SoC性能一直在迭代升级,多核设计在推
2、动性能提升上的重要性也是被广泛讨论的话题之一,因为“登纳德缩放定律(DennardSCaIing)也被视为即将迎来终结(图1)o即便忽略这一趋势,为了满足性能需求,晶圆代工厂持续推进下一代工艺节点,使其实现更高的频率和更高的逻辑密度从而集成更多的处理单元,同时减少功耗面积。这一持续创新的趋势可见图2o除了工艺节点的创新外,多核架构和处理器阵列也在积极克服性能迭代提升的问题。然而,无论是多核架构的创新,还是工艺节点的迭代升级,两者都需要一个新的多芯片系统架构。解决内存墙的问题无疑是多芯片系统的主要驱动需求之一(见图3)。下图向我们展示了内存密度正以每两年翻倍的速度增长,而工作负载所需的内存密度正
3、以每两年翻240倍的速度增长。如需了解更多详情,可以浏览发表在MediUm上的AI与内存墙一文。Origina1dataco11ectedandp1ottedbyM.Horowitz,F1abonte,0.Shacham1K.O1ukotun,1.HammondandC.Batten图ISOC性能的迭代升级Potentia1roadmapextension16-612612Deviceandmateria1innovations=I1Continueddimensiona1sca1ingRnFETFinFETFinFETGAAcr%hw1图2最新的IMEC工艺节点路线预测图A1andMemor
4、yWa110000as一运Goos85TransformerSize:240x/2yrsA1HWMmory:2x/2yrs图3训练先进模型所需的算力(单位PetaF1oPs),用来训练SOTA模型,包括不同的CV、N1P和语音模型,以及不同TranSformer模型的规模扩展速度(两年翻750倍);同时包括所有模型的平均规模扩展速度(2年翻15倍)。为了满足内存带宽方面的性能需求,我们已经看到当前片外内存市场被高带宽内存(HBM)等新技术所颠覆。业界已经看到HBM3成为HPC市场的主流。这一革新仍将继续,因为HBM有一个很好的未来性能提升路线图。遗憾的是,以上所表述的内存墙仅限于片外内存,而片
5、上内存系统在如今大多数SoC设计中都起到了至关重要的作用,所以不久的将来,这一行业的革新同样不可避免。?.当下的设计重心AI与安全相关的负载计算量正在急剧地提升,这也推动了不少频率提升之外的片上性能创新。其中绝大多数创新都集中在负载所需的处理器上。例如人工智能算法推动了大规模乘法累加并行运算以及创造性嵌套循环的设计,在减少了运算周期的同时提高了单个周期完成的工作量。不过,这些负载也需要更大的内存密度来存储权重、系数和训练数据。这就推动了更大容量和更高带宽的片上与片外内存的出现。在片外内存方面,业界已经迅速普及了新一代的HBM、DDR和1PDDR内存。然而,芯片供应商最大的差异化方案还是体现在片
6、上内存配置上。例如,在A1加速器领域,每个供应商都在力求在全局SRAM和缓存上集成更高带宽和更高密度的内存。利用特殊方法优化每个处理单元的内存配置,也是这一创新难题中最关键的一环。从SoC性能提升退一步看,业界面临的另一大问题就是云端A1系统的功耗。图4展示了谷歌数据中心的耗电量。显而易见,设计出具备更高能效CPU的SoC是至关重要的,多家SOC初创公司都公开宣传其A1处理器其的高效性,并声称可以解决这一问题。但是,整体的系统性能还应该将片外内存计算在内,比如DRAM的功耗往往占总功耗的18%。由于HBM的pj/bit冠绝群雄,所以在设计中采用更低功耗的HBM越来越普遍。回到性能的话题上来,在
7、讨论更为广泛的SOC系统时,A1加速器的片上竞争点很明显,往往都是如何在每一代产品中集成比竞品更多的SRAM和缓存。例如,英伟达等市场主导者会积极采用最新的工艺技术,每一代产品都集成了更大的二级缓存和更高的全局SRAM密度,以获得AI负载下更高的性能。A1andMemoryWa11IOOOO-TransformerSize:240x/2yrsA1HWMemory:2/2yrsV1OOPXoO(12G0)TFUv2(1CB)IOTBBaiduRecSys2TBBaiduRecSysGShardGFT-3MicrosoftT-N1GMgatron1MTPUv132GsA1BERTE1ECTRABC
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 技术 计算 负载 如何 驱动 芯片 系统