欢迎来到第一文库网! | 帮助中心 第一文库网-每个人都是第一
第一文库网
全部分类
  • 研究报告>
  • 学术论文>
  • 全科教育>
  • 应用文档>
  • 行业资料>
  • 企业管理>
  • 技术资料>
  • 生活休闲>
  • ImageVerifierCode 换一换
    首页 第一文库网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    燧原科技亮相Hot Chips大会详解邃思芯片架构.docx

    • 资源ID:954248       资源大小:44.84KB        全文页数:3页
    • 资源格式: DOCX        下载积分:10金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: QQ登录 微博登录
    二维码
    扫码关注公众号登录
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    燧原科技亮相Hot Chips大会详解邃思芯片架构.docx

    燧原科技亮相HOtChiPS大会,详解邃思芯片架构2023年8月25日,中国上海今天燧原科技在一年一度的HOtChiPS大会上由首席架构师刘彦和资深甚庄设计总监冯闯一起介绍了第一代云端训练芯片“邃思1.0”的架构细节。HotChiDS是全球高性能微处理器和集成电路相关的重要会议之一,芯片行业巨头每年都借此机会展示自己公司的量机成果,包括处理器体系结构,基础架构计算平台,内存处理等各类技术。燧原科技第一代通用人工智能训练芯片“邃思10”封装示意图邃思1O是燧原科技2019年12月发布的第一代云端A1训练芯片,采用众核结构,其计算核心采用了燧原科技自研的GCU-CARE计算引擎。整个SoC拥有32个GCIJYARE计算引擎,组成4个计算群组,全面支持常见A1张量数据格式(FP32FP16BF16,INT8/INT16/INT32),更全面地支撑客户业务。CARE还创新地通过复用张量核心,用最有效的晶体管效率提供了标量、向量、张量以及多种数据精度的计算能力。GCU-DARE数据架构,面向数据流优化,在数据流动中进行处理。512GBs的HBM和200GBs的GCU-1ARE互联,数倍于传统型、CPU;强劲的分布式片上共享缓存,提供IoTB/s的超大带宽;可编程共享缓存,可控线程内、线程间数据常驻共享,消除不必要的IO访问,既降低了数据访问延时,又节约了宝贵的IO带宽;同时,DARE架构还提供数据异步加载接且,支持数据与运算的流水执行,提高运算并行度。四路GCU-1ARE智能互联,200GBs的高速低延时片间互联接口,灵活支持不同规模的计算需求,可支持千卡级规模集群,为大中小型数据中心提供基于不同需求的人工智能训练产品组合。“邃思1.0"SoC邃思1.0人工智能加速芯片专为云端训练场景设计,支持CNN、RNN、1STM、BERT等常用人工训练模型,可用于图像、流数据、语音等训练场景。采用标准PCIe4.0接口,广泛兼容主流A1服务器,可满足数据中心大规模部署的需求,且能效比领先。演讲的最后部分,刘彦还介绍了上个月刚刚在世界人工智能大会上发布的“邃思2.0”训练芯片。经过全新升级迭代后,邃思2.0的计算能力、存储和带宽、互联能力较第一代训练产品有巨大提升,对超大规模的模型支持能力获得显著增强。由此,燧原科技成为国内首家发布第二代人工智能训练产品组合的公司。邃思2.0进行了大规模的架构升级,针对人工智能计算的特性进行深度优化,夯实了支持通用异构计算的基础;支持全面的计算精度,涵盖从FP32、IE32、FP16、BF16到INT8,单精度FP32峰值算力达到40TF1OPS,单精度张量TF32峰值算力达到160TF1OPSo同时搭载了4颗HBM2E片上存储芯片,高配支持64GB内存,带宽达18TBs0GCU-1ARE也全面升级,提供双向300GB/s互联带宽,支持数千张云燧C1OUdBIaZer加速卡互联,实现优异的线性加速比。Enf1ame燧原科技第二代通用人工智能训练芯片“邃思2.0”而同步升级的驭算TopsRider软件平台,成为燧原科技构建原始创新软件生态的基石。通过软硬件协同架构设计,充分发挥邃思2.0的性能;基于算子泛化技术及图优化策略,支持主流途度为框架下的各类模型训练;利用Horovod分布式训练框架与GCU-1ARE互联技术相互配合,为超大规模集群的高效运行提供解决方案。开放升级的编程模型和可扩展的算子接口,为客户模型的优化提供了自定义的开发能力。

    注意事项

    本文(燧原科技亮相Hot Chips大会详解邃思芯片架构.docx)为本站会员(lao****ou)主动上传,第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知第一文库网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 001doc.com网站版权所有   

    经营许可证编号:宁ICP备2022001085号

    本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



    收起
    展开