Groq发布全球首款每秒1000万亿次运算的AI加速卡.docx
《Groq发布全球首款每秒1000万亿次运算的AI加速卡.docx》由会员分享,可在线阅读,更多相关《Groq发布全球首款每秒1000万亿次运算的AI加速卡.docx(4页珍藏版)》请在第一文库网上搜索。
1、1250MHz205TF1OPS1000TOPS220MBN/A300W14nm725mm2Groq发布全球首款每秒1000万亿次运算的AI加速卡2016年底,谷歌TPU团队的十位核心开犬者中的八位悄悄离职,创办了一家名为Groq的机器学习系统公司,是进军M加速卡的第100家、是商业化推向市场的第2家,是首家达到每秒IOOO万亿次运算的公司。如果做对比,那么它是当前NVIDIA最强大显卡性能的四倍。TheGroqTensorStreamingProcessor(TSP)要求每个内核达到300W,而且他们己经丽丽!来了。而且更幸运的是,已将其从劣势转变为TSP的最大优势。这款TSP是一块巨大的硅
2、处理番,几乎只有矢量和矩阵处理单元以及高速缓存,因此没有任何控制器或后端,编译器具有直接控制权。TSP分为20个超级通道。超级通道按从左到右的顺序构建:矩阵单元(320MAC),交换单元,存储单元(5.5MB),矢量单元(16A1U),存储单元(5.5MB),交换单元,矩阵单元(320个MAC)oGroqTSPCoresMaximumFrequencyFP16TF1OPSINT8TOPSChipCache(11)BoardMemoryBoardPower(TDP)ProcessDieArea指令流(只有一个)被馈送到超通道O的每个组件中,其中矩阵单元有6条指令,开关单元有14条指令,存储单元有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Groq 发布 全球 每秒 1000 万亿 运算 AI 加速卡