北京市人工智能行业大模型创新应用白皮书(2023年).docx
《北京市人工智能行业大模型创新应用白皮书(2023年).docx》由会员分享,可在线阅读,更多相关《北京市人工智能行业大模型创新应用白皮书(2023年).docx(62页珍藏版)》请在第一文库网上搜索。
1、编写说明1魁2一、全球大模型发展整体态势4二、国内外大模型行业应用概述8(一)国外大模型行业应用情况8(二)我国大模型行业应用情况11三、北京市大模型行业应用情况18(一)北京市大模型产业发展情况18(二)北京市大模型行业应用特点19(三)大模型行业应用典型案例221 .政务领域232 .金融领域293 .医疗领域344 .传统产业赋能领域415 .文化旅游领域466 .智慧城市领域53(四)北京市大模型行业应用面临的挑战59四、下一步建议61结语64致谢声明65综述作为新一轮科技革命和产业变革的核心引擎,人工智能正在为经济社会发展持续注入新动能,今年以来,大模型技术引领着人工智能领域迈入新发
2、展高度,在世界范围内受到广泛关注。大模型对于人工智能厂商和企业用户而言,是一个重要发展机遇。人工智能厂商方面,谷歌、微软、Meta.亚马逊等全球科技巨头将大模型视为重要发展机遇,积极投入并且大动作频发。我国众多厂商也投身大模型领域,包括百度、阿里、腾讯等互联网大厂,科大讯飞、商汤科技、旷视科技等垂直于A1领域的厂商,以及智谱华章、百川智能、MiniMaX等大模型初创企业。市场上也不乏高校、研究机构的身影,清华大学、中国科学院自动化所、北京智源人工智能研究院等发布了各自的大模型成果。企业用户方面,大模型在企业侧的应用速度之快超乎想象。2023年初,企业管理层对大模型的话题还停留在大模型是什么,是
3、不是概念炒作。短短半年,大模型已经从饭后谈资走向落地应用。大企业管理层关于大模型的对话变得比之前复杂很多,他们希望了解到大模型能为企业发展带来哪些变革,大模型的应用路径是什么,如何提升大模型的投资回报率,以及应该为拥抱大模型做哪些准备。而且,大模型吸引的人群也愈发广泛,不仅吸引CIO、CTO等技术管理者的关注,CEO、CMO等非技术类管理者同样期待大模型在业务中发挥价值。这些转变表明,大模型的变革之力正日益得到产业界的认可。从传统行业到高科技行业,从行业黑马到行业龙头,诸多企业开始论证或试点应用大模型,期望在客户运营、软件开发、营销推动等领域有所提升,进而增强市场竞争力。通过对市场规模数据的分
4、析,能较为直观地体现出企业对大模型应用落地的热情。根据数字化市场的研究咨询机构北京爱分析科技有限公司相关报告显示,2023年中国大模型市场规模约为50亿元(人民币,下同)。2023年,企业在大模型方面的采购特点是论证多、采购少,各企业计划在2024年开始大量释放大模型预算,因此市场规模将大幅增长,预计达到120亿元。本报告基于前期对北京市人工智能行业大模型创新应用案例研究的情况,按照领域分类,以政务、金融、医疗、传统产业赋能、文化旅游和智慧城市等六大领域为切入点,并从应用案例的业务背景、共性痛点、大模型解决方案等角度展开系统分析,聚焦创新性、示范性、经济与社会效益、可推广性等四个维度,选取18
5、个具有代表性的应用案例深入调研,力求为相关领域开展应用场景建设提供参考。一、全球大模型发展整体态势(一)大模型推动智能“涌现”,打开A1技术发展上限人工智能大模型,是指通过在海量数据上依托强大算力资源进行训练后能完成大量不同下游任务的模型。在技术层面上,大模型的实现采用“预训练+指令微调+人类反馈的强化学习”的训练范式。首先通过预训练技术将深度学习网络在海量数据上进行自监督训练,然后利用指令数据进行有监督指令微调,提升模型对人类指令的追随能力,最后,基于由人类价值标注数据训练得到的奖励模型所提供的奖励信息进行强化学习,控制大模型的输入符合人类价值判断。在大模型使用时,通过设计提示进行即时学习可
6、以进一步提升大模型完成各类任务的能力。规模化是使大模型强大的重要原因,研究表明当模型规模足够大的时候,会涌现”智能能力,具备处理新的、更高层次的特征和模式的能力,能够为一系列下游任务带来更好的任务效果。大模型不断扩大的规模由“量变”引发质变”,模型通用认知能力不断提升。大模型能力的迅速发展不仅有助于人类完成“规定动作”,还可能帮助人类去研究和发现未知领域,突破人类过去没有突破过的极限。大模型的技术变革呈现数据巨量化、模型通用化、应用模式中心化的特点。整个发展历程可划分为三个阶段。2013-2018年的深度学习阶段,主要还是基于传统的“针对特定任务的专用模型+大量标注数据”方式,在监督学习的机制
7、下训练得到一个个专用小模型,但是在词向量的自监督学习中,使用大规模数据进行预训练的方法已初见端倪,2017年TranSformer的提出为基础架构带来了规模化构建和规模化运算的潜力。TranSfOrmer解决了RNN和1STM的并行化训练和长距离依赖问题,解决了CNN的局部归纳偏差问题,能够容纳更多的参数规模,并且具备更强的语义特征提取能力、长距离特征捕获能力、综合特征提取能力。2018年-2023年的预训练阶段,基于“海量无标注数据”,在自监督学习机制下获得预训练大模型,通过少量标注数据微调后得到领域专用模型。自监督学习机制的成功使得可利用的数据愈发“巨量化”,从标注数据拓展到无标注数据。B
8、ert将可利用的预训练数据量扩大3到5倍,成为自然语言理解任务中的基准模型。自此,“预训练+微调”的学习范式成为主流。在通用大模型上通过少量标注数据微调,即可适用于一系列下游任务。2023年下半年以来的大语言模型阶段,预训练大模型的通用能力愈发强大,引入指令监督训练使得模型能更好地追随人类指令完成各种任务,并提升了在下游任务上的泛化能力,通过人类反馈学习让机器与人类价值对齐成为可能。(二)大模型变革内容生产和技术服务模式,“无限生产”推动生产效率颠覆式提升内容生产方面,生成式大模型率先在内容创作、图像生成、数字人、游戏等娱乐媒体领域广泛应用,内容生产效率和质量显著提升,内容生产模式从辅助人到“
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 北京市 人工智能 行业 模型 创新 应用 白皮书 2023