为什么Chiplets对处理器的未来如此重要?.docx
-
资源ID:948415
资源大小:140.79KB
全文页数:8页
- 资源格式: DOCX
下载积分:10金币
快捷下载

账号登录下载
微信登录下载
三方登录下载:
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
为什么Chiplets对处理器的未来如此重要?.docx
为什么Chip1ets对处理器的未来如此重要?Chip1ets的主导地位才刚刚开始。ChiPIetS已经使用了几十年,但它们之前一直被用于少量特殊的用途。现在,它们处于技术的最前沿,全世界有数百万人在台式电脑、工作站和服务器中使用它们。处理番行业领导者利用ChiPIetS重新站在了创新的最前沿,可以预见未来ChiPIetS将成为计算世界的标准之一。因此,有必要了解ChiP1etS以及它们如此重要的确切原因。什么是Chip1ets?ChiPIetS是分隔式的处理器。不是将每个部分合并到一个甚左中(被称为单片机的方法),而是将特定的部分作为独立的芯片来制造。然后,这些独立的芯片通过一个复杂的连接系统被安装在一起,成为一个单一的封装。这种安排使能够让使用最新的制造方法的部件尺寸缩小,提高了工艺的效率,使其能够装入更多的部件。芯片中不能明显缩小或不需要缩小的部分可以用更旧的、更经济的方法生产。虽然制造这种处理器的过程很复杂,但总体成本通常较低。此外,它为处理器公司提供了一个更易于管理的途径来扩大其武遢范围。为了充分理解为什么处理器制造商转向芯片,我们必须首先深入了解这些设备是如何制造的。西和更也开始时是由超纯硅制成的大圆盘,通常直径略小于12英寸(300毫米),厚度为0.04英寸(1毫米)。这块硅片经历了一系列复杂的步骤,形成了不同材料的多层一绝缘体、电介质和金属。这些层的图案是通过一种叫做光刻的工艺创建的,在这种工艺中,紫外线通过放大的图案(掩膜)照射,随后通过透镜缩小到所需的尺寸。该图案以设定的间隔在晶圆表面重复出现,每一个都将最终成为一个处理器。由于芯片是长方形的,而晶圆是圆形的,图案必须与圆盘的周边重叠。这些重叠的部分最终会被丢弃,因为它们是无功能的。一旦完成,将使用应用于每个芯片的探针对晶圆进行测试。电检结果告知工程师关于处理器的质量与一长串标准的关系。这个初始阶段被称为芯片分选,有助于确定处理器的等级”。例如,如果该芯片打算成为一个CPU,那么每个部分都应该正确运作,在特定的电压下在设定的时钟速度范围内运行。然后根据这些测试结果对每个晶圆部分进行分类。完成后,晶圆被切割成单独的碎片,或称模具,可供使用。然后,这些模具被安装在一个基板上,类似于一个专门的主板。处理器经过进一步的包装(例如,用散热器),然后就可以进行销售了。整个过程可能需要数周的制造时间,台积电和三星等公司对每个晶圆收取高额费用,根据所使用的工艺节点,费用在3000至20000美元之间。工艺节点(Processnode)是用来描述整个制造系统的术语。历史上,它们是以晶体管的栅极长度命名的。然而,随着制造技术的改进,允许越来越小的组件,命名不再遵循芯片的物理方面,现在它只是一个营销工具。然而,每一个新的工艺节点都会带来比前者更多的好处。它的生产成本可能更低,在相同的时钟速度下消耗更少的功率(或者相反),或者具有更高的密度。后者衡量的是在一个给定的芯片区域内可以容纳多少元件。在下图中,你可以看到这些年来GPU(你在PC中发现的最大和最复杂的芯片)的发展情况。402020EEaenbs怎dSJO1S-S1Ie=JoSUO=IAIOo80604019941998200220062010Yearofchipre1ease工艺节点的改进为工程师提供了提高其产品能力和性能的手段,而不必使用大而昂贵的芯片。然而,上图只说明了部分情况,因为不是处理器的每个方面都能从这些进步中受益。芯片内的电路可以被分配到以下几大类中的一类:(1)逻辑,处理数据、数学和决策;(2)存储器,通常是S幽,用于存储逻辑的数据;(3)模拟,管理芯片和其他设备之间值号的电路。当逻辑电路随着工艺节点技术的每一次重大进步而继续缩小时,模拟电路几乎没有变化,SRAM也开始达到极限。虽然逻辑仍然构成了芯片的最大部分,但今天的CPU和GPU中的SRAM数量在近年来有了显著增长。例如,AMD在其RadeonVII显卡中使用的Vega20芯片的11和12缓存合计为5MBo仅仅两代GPU之后,Navi21就有超过130MB的各种缓存一比Vega20多了25倍,令人瞩目。可以预期,随着新一代处理器的开发,这些水平将继续提高,但由于存储器的规模没有像逻辑那样缩小,在同一工艺节点上制造所有电路的成本效益将越来越低。在一个理想的世界里,人们在设计芯片时,模拟部分在最大和最便宜的节点上制造,SRAM部分在更小的节点上制造,而逻辑部分则保留给绝对尖端的技术。不幸的是,这在实践中是无法实现的。然而,存在一种替代方法。分而治之早在1995年,蔓特尔推出了其原始P5处理器的继任者一奔腾I1它与当时的常规产品不同的是,在塑料外壳下有一块电路板,里面有两个芯片:主芯片,包含所有的处理逻辑和模拟系统,以及一个或两个独立的SRAM模块,作为二级缓存。英特尔公司生产主芯片,但缓存来自其他公司。在20世纪90年代中后期,这将成为台式电脑的相当标准,直到生昱隹制造技术改进到可以将逻辑、内存和模拟全部集成到同一芯片中。虽然英特尔继续尝试在同一封装中使用多个芯片,但它在很大程度上坚持了所谓的处理器单片(mono1ithic)方法(即一个芯片用于一切)。对于大多数处理器来说,不需要超过一个芯片,因为制造技术已经足够熟练(而且价格低廉),可以保持简单直接。然而,其他公司对遵循多芯片方法更感兴趣,最引人注目的是IBM。2004年,IBM提供了8芯片版本的POwER4服务器CPU,它由四个处理器和四个缓存模块组成,都安装在同一个机身内(称为多芯片模块或MCM方法)。大约在这个时候,异质集成一词开始出现,部分原因是DARPA(国防高级研究计划局)所做的研究工作。异质集成的目的是将处理系统的各个部分分开,在最适合每个部分的节点上单独制造,然后将它们合并到同一个包中。今天,这被称为系统级封装(SiP),从一开始就是为望能手表配备芯片的标准方法。例如,第1代的App1eWatch在单一结构中装有一个CPU>一些DRAM和NAND闪存、多个控制壁和其他组件。通过将不同的系统全部放在单个芯片上(称为片上系统或SoC),可以实现类似的效果。但是,这种方法不允许利用不同的节点价格,也不能以这种方式制造每个组件。对于技术供应商来说,对利基产品使用异构集成是一回事,但将其用于其大部分产品组合则是另一回事。这正是AMD对其处理器系列所做的。2017年,这家金昱便巨头以单芯片RyZen桌面CPU的形式发布了其Zen架构。几个月后,两条多芯片产品线Threadripper和EPYC首次亮相,后者拥有多达四个芯片。随着两年后Zen2的推出,AMD完全接受了异质集成,MCM,SiP。他们将大部分模拟系统移出处理器,并将它们放入单独的芯片中。这些是在更简单、更便宜的工艺节点上制造的,而更高级的流程节点则用于剩余的逻辑和缓存。自此,ChiP1etS成为流行。越小越好为了准确理解AMI)为什么选择这个方向,我们来看看下面的图片。它展示了Ryzen5系列的两款CPU,左边是采用所谓Zen+架构的2600,右边是由Zen2驱动的3600。两种型号的散热器都已被拆除,照片是用红外相机拍摄的。2600的单芯片容纳了八个核心,尽管其中两个核心在这个特定的模型中被禁用。这也是3600的情况,但在这里我们可以看到,封装中有两个模具一顶部的CoreComp1exDie(CCD),容纳了核心和缓存,底部的InPUt/OutputDie(IOD)包含所有控制器(用于内存、PCIExpress>USB等)和物理接口。由于这两颗RyZenCPU都适用于同一个主板插座,这两张图片基本上是按比例绘制的。从表面上看,3600的两个芯片似乎比2600的单个芯片有更大的综合面积,但外表可能是欺骗性的。如果我们直接比较包含核心的芯片,很明显可以看到旧型号中模拟电路所占用的空间(围绕着金色的核心和缓存的蓝绿颜色)。然而,在Zen2CCD中,用于模拟系统的芯片面积很少;它几乎完全由逻辑和SRAM组成。Zen+芯片的面积为213平方毫米,由G1oba1Foundries使用其12纳米工艺节点制造。对于Zen2,AMD保留了G1Oba1FOUndrieS对125平方毫米IOD的服务,但在73平方毫米的CCD上使用了台积电的N7节点。Zen+(±)vsZen2CCD(下)较新型号的芯片的综合面积更小,而且它还拥有两倍的13缓存,支持更快的内存和PC1Expresso然而,ChiPIetS方法最好的部分是,CCD的紧凑尺寸使AMD有可能将另一个CCD装入包装。这一发展催生了RyZen9系列,为台式电脑提供12和16核型号。更重要的是,通过使用两个较小的芯片而不是一个大的芯片,每个晶圆可能会产生更多的芯片。就Zen2CCD而言,一块12英寸(300毫米)的晶圆可以比Zen+型号多生产85%的芯片。从晶圆上取下的切片越小,就越不可能发现制造缺陷(因为它们往往是随机分布在光盘上的),所以考虑到所有这些,Chip1ets不仅使AMD有能力扩大其产品组合,而且成本效益更高。相同的CCD可用于多个型号,每个晶圆可生产数百个。但是,如果这种设计选择如此有优势,为什么英特尔不这样做呢?为什么我们没有看到它被用于其他处理器,如GPU?跟随潮流为了解决第一个问题,英特尔确实在采用全芯片路线,而且它的下一个消费者CPU架构(MetCor1ake)也将这样做。英特尔的方法有些独特,让我们来看看它与AMD的方法有何不同。这一代处理器使用区块(Ii1e)一词而不是芯片,将以前的单片式设计分割成四个独立的芯片:(1)计算区块:包含所有的内核和二级缓存;(2)GFX区块:容纳集成GPU;(3)SOC区块:整合了13高速缓存、PCIEXPreSS和其他控制器;(4)IO区块:容纳内存和其他设备的物理接口。在SoC和其他三个区块之间存在高速、低延迟的连接,并且所有这些区块都与另一个被称为插板的芯片相连。这个插板为每个芯片提供电源,并包含它们之间的导线。然后,插板和四块区块被安装到另一块板上,以便将整个组件封装起来。与英特尔不同,AMD不使用任何特殊的安装模具,而是有自己独特的连接系统,被称为InfinityFabric,以处理芯片数据交易。电源传输通过一个相当标准的封装运行,而且AMD还使用较少的芯片。那么,为什么英特尔的设计是这样的呢?AMD的方法的一个挑战是,它不太适合超移动、低功耗领域。这就是为什么AMD在该领域仍然使用单片式CPUo英特尔的设计允许他们混合和匹配不同的区块以满足特定的需求。例如,经济型笔记本电脑的预算型号可以到处使用小得多的芯片,而AMD只有一种尺寸的芯片用于每种用途。英特尔系统的缺点是生产复杂且昂贵,尽管现在预测这将如何影响零售价格还为时尚早。然而,两家CPU公司都完全致力于芯片的概念。一旦制造链的每一部分都围绕它进行设计,成本就会降低。关于GPU,与芯片的其他部分相比,它们包含的模拟电路相对较少,但里面的SRAM数量正在稳步增加。这就是为什么AMD将其芯片知识应用于其最新的RadeOn7000系列,RadeonRX7900GPU包括多个芯片一一个用于核心和二级缓存的大芯片,以及五六个Chip1ets,每个芯片包含一片13缓存和一个内存控制器。通过将这些部件移出主芯片,工程师们能够大大增加逻辑数量,而不需要使用最新的工艺节点来控制甚左尺寸。然而,这一变化并没有增强图形组合的广度,尽管它可能确实有助于改善整体成本。目前,英特尔和英伟达在其GPU设计方面没有显示出跟随AMD的迹象。两家公司都使用台积电承担所有的制造任务,似乎满足于生产极其庞大的芯片,将成本转嫁给消费者。随着图形领域的收入稳步下降,可能会在未来几年内