AI规模化落地英特尔至强的七重助力.docx
《AI规模化落地英特尔至强的七重助力.docx》由会员分享,可在线阅读,更多相关《AI规模化落地英特尔至强的七重助力.docx(12页珍藏版)》请在第一文库网上搜索。
1、A1规模化落地英特尔至强的七重助力当今时代,各行各业与人工智能(A1)加速融合,通过智能化创新来寻求业务转型升级。与为数不多的顶级A1研发公司相比,大多数传统行业或企业有着更丰富的AI应用场景,推动着规模化的AI应用落地,其AI应用更具有实践意义。然而,在智能化技术架构和平台选择上,它们又往往面临着“拿着钉子到处找锤子”的尴尬局面。尽管有人津津乐道于承载AI应用的一些专用架构平台,但实际情况是,仅采用专用加速芯片或优化单一框架,已经无法满足运行不同工作负载和适应不同应用场景所需。这是因为,AI的应用需求是多种多样的,不同的应用也决定了从数据中心到边缘再到设备所需的硬件能力都会有所差别。而且,解
2、决企业AI规模化落地,需要充分利用以数据为中心的基础架构,考虑芯片处理器、核心算法和软件工具等平台解决方案的选择。无论是算法工程师、AI开发者还是数据科学家,他们在选择AI技术架构和平台时会有多方面的考量。一个共识是,基于既有的IT基础设施,统一大数据和人工智能平台,可以更加高效释放数据价值,实现A1业务目标。大家越来越发现,通用的英特尔架构有一个非常重要的先发优势,就是使用者众、部署广泛。来自英特尔架构和至强平台的助力,可以帮助企业从既有的平台起步,推动A1的发展,加速“破局”A1产业实践。下面我们从7个方面,展开阐述英特尔如何从性能、数据预处理、可扩展性、内存、模型部署、大数据分析、跨平台
3、部署应用等多方面实现优化和升级,全面支持企业A1的规模化应用落地。第一重助力:性能CPU性能优化有数量级提升,VNNI和框架优化等大幅提升了CPU架构运行深度学习推理的速度。很多人可能都认为A1这种新出现的技术,或者说应用负载,也应该用新的架构来支撑,其实不然。实际上随着CPU性能的数量级提升,以及在软硬件层面针对AI应用的不断优化,CPU平台也能很好地承载AI应用。现在CPU能兼容几乎所有的AI主流技术,深度学习的应用任务,特别是推理,完全可以用CPU来搞定。而且CPU还有一个特定的优势,就是当用户混合使用机器学习和深度学习方法时,CPU更适合承载这样的任务。不断更新换代的英特尔CPU平台,
4、已经在A1应用特别是推理上提供了强大的算力。以第二代英特尔®至强®可扩展处理器为例,它集成了加速人工智能深度学习推理的英特尔®深度学习加速(英特尔®D1Boost)技术,将人工智能性能提升到一个全新的水平,可加速数据中心、企业和智能边缘计算环境中的人工智能推理工作负载。以常见的CaffeReSnet_50模型为例来看性能变化,第二代英特尔®至强®伯金8280处理器借助英特尔D1BOOSt技术,图像识别的速度可比上一代英特尔至强可扩展处理器提升14倍。另外,英特尔CPU平台还与各类主流深度学习框架(包括TensorF1owPyTorchcaffe、
5、MXNetPadd1ePadd1eBigD1等)合作,针对CPU的AI训练和AI推理功能进行全面优化,Xeon处理器训练性能因此得到不断提升,客户也可以选择使用适合自身需求的深度学习框架做模型训练,而无需购买或者设置不同的硬件基础设施。随着软件工具的不断更新及面向主流框架的深度优化,CPU平台不论是支持基于单一AI技术的应用,还是在运行融合了多种AI技术的应用时,其性能表现都更为突出。对于全新硬件架构的每一个数量级的性能提升潜力,软件能带来超过两个数量级的性能提升。以第二代英特尔至强可扩展处理器上的VNNI深度学习加速指令为例,过去卷积神经需要三条指令,而现在的话一条指令就可以了,通过在底层的
6、软硬件协同优化,可根据不同深度学习框架将推理性能加速2-3倍甚至更多。第二重助力:数据预处理数据的处理分析和之后的AI应用如果在一个平台上,可以给用户带来更大的便利性,也能节省成本和降低风险。尽管当前市场对于AI技术抱有很大兴趣,但实施水平仍然相当低下。我们需要根据应用需求构建起完整的数据分析/AI流水线,从高质量数据源整理、数据预处理与清洗、适当特征数据的选择与构建等前期工作开始,这就要求数据工程师、算法工程师等协同工作。算法工程师往往要花很多时间,来处理用于深度学习模型训练和测试的庞大数据,数据预处理会涉及很多很零碎的事情,比如校对数据的标注是否符合某种逻辑。在进行数据预处理时,所写的代码
7、不一定是执行起来效率最高的,因为有可能这些零碎的校验数据功能只用一次,而不是反复使用。在这种情况下,可以使用方便快速实现功能的Python语言调用CPU来实现,而且基于CPU有很多现成的包和工具,具有更快数据预处理的优势。CPU还可以通过使用更多内存、减少I/O操作来提升A1运行效率。如今的深度学习和A1领域,优秀的算法和框架数不胜数,但英特尔开源的BigD1和采用了这一技术的Ana1yticsZOO平台选择了一个颇具独特性的切入点,那就是专为已有大数据集群的场景设计。目前,来自零售业、金融服务行业、医疗保健业、制造业及电信业等领域的企业客户都已经开始在英特尔至强服务器上利用Ana1ytics
8、Zoo、或基于BigD1构建更为平滑无缝的数据分析AI应用流水线。第三重助力:可扩展性CPU平台现有基础设施就是为可扩展性而搭建,不仅易于在更多节点上进行扩展,还能按核实现弹性扩展和调配。可伸可缩方为真英雄!在深度学习和机器学习领域,不管是模型训练还是推理,为了分配和部署计算能力,常常需要基于现有的IT基础设施或者云平台进行硬件扩展。目前一些专有的AI架构平台只能以卡或芯片为单位来管理和扩展,而英特尔至强平台不仅更容易在更多节点上扩展,还能按核实现弹性的扩展和调配,能真正做到精细化的资源管理和调配。这使得AI平台可以尽可能通过云化来提高灵活性,提升自动化管理水平,并充分利用到每个计算核心的价值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AI 规模化 落地 英特尔 七重 助力