为 AI 处理器集群供电Vicor.docx
《为 AI 处理器集群供电Vicor.docx》由会员分享,可在线阅读,更多相关《为 AI 处理器集群供电Vicor.docx(4页珍藏版)》请在第一文库网上搜索。
1、为AI处理器集群供电ViCOr最近,基于A1双处蹴的新型集群超级计算机的引入,将电源传输网络的边界提高到了几年前从未想象过的水平。随着由速水平接近IoOkA/ASIC集群的应用,需要在电力系统架构、拓扑、控制系统和封装方面进行创新,以供应如此高的电流需求。由于功率水平不断提高,采用48V电源总线进行功率传输至关重要。此外,日益紧凑的处理器集群应用限制了电源方案在处理器旁横向摆放的可行性,因此需要一种新的电源方案来解决问题。ViCor48V直接至负载(IV)分比式架构(FPA)与常见的48V中间总线架构(IBA)不同,IBA还是传统的由一个中间母线转换器和多相Po1稳压器组成,而FPA则通过创新
2、解决方案独特地解决了集群处理器系统面临的每一个电源传输难题,它还支持电源方案在处理器对应面垂直摆放的方式,这种垂直电源传输方式(VPD)对于向此类集群系统提供高电流至关重要。集群式电源传输的挑战集群式ASIC系统采用紧密封装,以达到所需的高速带宽,从而实现AI训练工作负载(如自动驾驶)所需的万亿次处理性能。集群中的每个处理器本身可能需要600到1000安培的电流,所以即使是单个处理器加速卡上边,如果电源方案的摆放位置不接近处理器的电源引脚,也会带来严重的PCB或基板阻抗损失,从而带来电源传输功率损耗的挑战。此外,GPU和专门的AI处理器已经采用7nm、5nm工艺制程,很快将使用3nm硅工艺节点
3、,从而实现人工智能(AI)的快速发展。这些工艺节点的标称核心工作电压目前在0.75至0.85V之间。为了达到AI要求的工作性能,需要把GPU和处理器先安放在加速卡上,然后将加速卡群集到基于服务器机架的系统中,数据中心和高性能计算机的每个机架上有4或8个加速卡。然而,最近来自Cerebras和特斯拉(Tes1a)的介绍显示了另一种将人工智能ASIC本身进行集群的方法,这种方法可以生成极大算力、极高功率密度的超级计算机,但同时也带来了对电源传输方面的严峻考验和对热管理/冷却方面的挑战。对于电源传输来说,ASIC/GPU集群已经没有单处理器或双处理器AI卡那样的横向电源传输空间,其所使用的高速I/O
4、值量对大电流开关噪声(即硬开关多相降压(buck)稳压器工作时产生的噪声)极为敏感。所以将硬开关多相电源方案移动到更靠近处理器的位置会带来更多的电流开关噪声,这种情况下,电源方案设计既要满足噪声敏感I/O信号的要求,又要尽量降低PDN值就是一个巨大的挑战。在40-60A/相的典型设计值下,给每个A1ASIC或GPU提供高峰值电流(很多情况下每个AISC电流需求大于150OA)所需的多相电源方案数量很容易超过30相,在这种应用场景下,传统的横向电源(多相buck方案)几乎是难以实现的。分比式电源解锁电流传输新方式分比式架构(FPA)的基本原理是将电源转换器分为两个主要功能,分别对每个功能进行优化
5、,然后将这些功能作为一个系统来实现。这两个功能分别是稳压和电流倍增。稳压稳压器的效率与所做的工作成反比一一工作越多,效率越低。稳压器的输入电压和输出电压越接近,执行的工作就越少,效率就越高。凭借分比式架构在系统中的位置优化,可以使稳压器的输入至输出电压差最小化。PRM稳压器采用零电压开关(ZvS)升降压(buck-boost)拓扑结构,在输入和输出电压差较小的情况下具有高效率。ZVS大大降低了开关损耗,实现了高频操作,大大减小了转换器的尺寸。PRM通常将40至60V的输入电压调节为30至50V的输出电压。软开关与电流倍增PRM之后是第二级,执行电压降压和电流提升功能。这是使用正弦振幅(SAC)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AI 处理器集群供电Vicor 处理器 集群 供电 Vicor
![提示](https://www.001doc.com/images/bang_tan.gif)