《计算机行业AI应用专题报告.docx》由会员分享,可在线阅读,更多相关《计算机行业AI应用专题报告.docx(10页珍藏版)》请在第一文库网上搜索。
1、1 ChatGPT开放APl接口,引领Al领域新革命1.1 OpenAI 开放 ChatGPT API 接口2023年3月2 B,OpenAI推出了自然语言对话模型GPT-3.5-Turbo和语音转文本模型Whisper models 的开发者API0 ChatGPT-3.5TurbO模型是GPT-3.5系列中最快速、最便宜、最灵活的模型,具有高准确性、 可靠性和可扩展性,能以极低的成本获取精准的结果。GPT-3.5Turbo作为新型自然语言处理模型,使人 类与计算机之间的交流更加顺畅和高效。Whisper是OPenAl在22年9月开源的语音转文本模型,支 持其它98种语言的自动语音辨识。Wh
2、isper系统所提供的自动语音辨识模型能将各种语言的语音变成文 本,接受m4a、mp3、mp4 mpeg、mpga、wav、webm等多种格式,其核心业务是语音辨识与翻译任 务。Whisper无需联网,完全在本地运行,识别准确率高,可称为本地类脑。GPT-3.5-Turbo 和 Whisper models 的 API 价格低廉,功能强大。GPT-3.5-Turbo 模型定价 0.2 美元 / IOOOtokens,价格是GPT 3.5模型额1/10;参数数量更多,能够生成更准确、更具上下文相关性的响应: 包括额外的训练数据和微调,进一步提高了性能,适合应用于语言翻译、聊天机器人开发、内容生成
3、等。 与传统的自然语言处理算法相比,GPT-3.5Turbo有着更强大的抽象能力和语法识别能力,能够准确地理 解人类语言的含义和上下文,并将其转化为精准的文本输出。Whisper的英文语音辨识能力已达到人类水 准,可以用来转录或翻译音频,识别准确率相当高,可以在本地运行,费用为每分钟0.006美元。图2: GPT3.5Turbo 收费ChatGPT models are optimized for dialogue. The performance of gpt-3.5-turbo is on par witl Instruct Davinci.Leam more about ChatGPT
4、KModelUsagegpt-3.5-turbo$0.002 1K tokens行业报告责夯展资料来源:OpenAI民生证券研究院1.2 ChatGPT API应用走入千行万业目前已有多个应用程序通过API的方式将ChatGPT融入到服务之中.OpenAI向企业开放API端口, 社交软件SnapChaL购物软件InStaCart、学习软件Quizlet和Speak等均已嵌入ChatGPT API0 IT之家2月28日消息,2023年3月7日,微软发布WindowsH重要更新,相关更新将重塑和 提升人们通过PC完成各项事务的使用体验。微软作为PC、云、移动终端集大成的AIr ,在OpenAI 的
5、赋能下,从应用的制高点层层推进,此次PC端“开始”菜单的重构将成为应用端迈进AI时代的起点. 多个应用程序通过API的方式将ChatGPT融入到服务之中表明两个新的API有利于扩大AI的应用 场景,丰富ChatGPT的应用生态,优化人工智能应用的商业模式,为人工智能的发展和应用带来巨大推 动力。此外,ChatGPT模型还在不断改进、自我完善,未来将有更多增强功能供APP开发人员使用, ChatGPT的应用场景或将更加丰富。2成本降低有望催动海,应用进入AI时代2.1 新模型gpt-3.5-turbo发布,成本降低90%与传统搜索引擎相比,聊天机器人的运营成本高昂。摩根士丹利的分析表示,谷歌去年
6、共计3.3万亿次 搜索,每次搜索的成本仅为0.2美分。而此前有分析师指出,ChatGPT的一次回复则会产生2美分的成 本。摩根士丹利预计,若将谷歌旗下聊天机器人Bard引入搜索引擎,并用其处理谷歌一半的搜索和提问, 按照每次答案50词计算,该公司2024年的成本可能会增加60亿美元。专注于芯片技术的咨询公司 SemiAnaIysis表示,受到谷歌的内部芯片Tensor Processing Units等的影响,将聊天机器人添加至搜索引擎 中,可能会导致该公司额外花费30亿美元。OpenAI新模型使成本大幅降低。3月1日,OpenAI正式宣布,开发者现在可以通过API将ChatGPT和 Whis
7、per模型集成到他们的应用程序和产品中。此次ChatGPTAPI访问的模型被称为gpt-3.5-turbo, gpt-3.5-turbo和ChatGPT产品使用相同的模型,定价只要0.002美元/IOOOtokens,后者可以看作一个非 结构化的单词,1000个相当于750个单词,算下来就是企业付费2美元就可以输出75万单词。现在 这个价位做到了让人类普惠性使用Al,也是其他Al公司目前做不到的价位。随着ChatGPT开放APh 很多公司可以正式接入ChatGPT的Al服务。2.2 GPT-3.5的三大优势与GPT-3相比,GPT-3.5增加代码训练(Code-training)与指示微调(I
8、nstruction-tuning)两个训练步骤: 1)代码训练:经过前期的代码训练,GPT-3.5模型具备更好的代码生成与代码理解能力,同时间接拥有 了使用思维链进行复杂推理的能力;2)指示微调:经历Instruction-tuning, GPT-3.5具备更好的模型泛 化能力,同时模型的生成结果更加符合人类的预期。GPT-3.5具备三大优势,ChatGPT实现优势融合。基 于模型训练的持续优化,与GPT-3相比,GPT-3.5具备三大优势:更强的复杂推理能力,更好的人类指 令响应,更全面的文本、代码生成能力。作为基于GPT-3.5的模型微调产物,ChatGPT实现了 Code-traini
9、ng Instruction-tuning, RLHF等训练的优势整合,我们针对ChatGPT优势进行能力溯源:1)预训练大模型:ChatGPT具备的语言生成能力、基础世界知识、上下文学习能力等基本能力均来源于 基于Transformer的模型预训练:大量知识的存储能力依托于庞大的模型参数(GPT-3模型参数为1750 亿):2)代码训练:ChatGPT具备较好的代码生成与代码理解能力,同时具备执行复杂推理的能力,主 要得益于代码训练Code-training的引入:初代GPT-3未进行过专门的代码训练,因此在代码生成、理解 方面能力相对较差,同时推理(思维,)能力也较差;因此可以判断,代码训
10、练是ChatGPT上述能力的 重要来源:3)人类反馈强化学习:ChatGPT具备更好的问答能力,同时可以拒绝不当的问题、拒绝知识 范围之外的问题,这些在对话问答上的突出表现,得益于人类反馈强化学习RLHF的训练,让ChatGPT更 加遵循人类的价值观,同时拥有了建模对话历史、增加对话信息量等能力。4: GPT系列产品升级情况KGPT时网升锻不足GPT-I2018.6使用麻MW下.NlP 任务;JR眦)SGB的ill圈BaK和117M的 CtA自然沿营推理.I回答和常识推理.港义 相姒度以及分类JWeRl性:泛化性不足GPT-22019.2使用相同的由学习多个任务.在下 游任务中实现Zero S
11、h6;采用40G8的训 域故JeWI .58 的#$现期电内昌生成施力(阅读簿更 好、续写.索故事.角色扮演等)无监学习能力还有很大勒册仝司不使用祥本(Zero sbot).使用1条懵本几乎可以完成自然语言处理的她大部分自然通闻S断.城交,阕流现解任务GPT-32020.5(Zero-shot)或使用吸少的样本任务,钮的可酶案.陶澈语义等方面表现图不太好;.分和昂围的(Few-Shot)OTifi NLP 曜初 45TB推断.maii.文生成和自动i可答模型推理受R巾蟋道言可蹄在1的V惭数却117SB的祭物1见ChatGPT2022.1稣 A的 RLHF8M科酬安豆;依托大量文本Al尔生成不正
12、息;产生关于收不断循JI和输出内容;专为会话任务设计KS. H有突姒人类的反应WflI填电D世e; mk资来不民生证券研究宸g二一行业报告斫究院2.3 ChatGPT改变应用生态,赋能千行百业2.3.1 Bing&Edge+AI2023年2月8日,微软公司发布了新版必应Al搜索引擎和Edge浏览器,采用了 ChatGPT开发商 OpenAI的最新技术Al模型GPT-3.5的升级版,率先提供更具对话性的网络搜索和创建内容的替代方式, 集搜索、浏览、聊天于一体,带来前所未有的全新体验。新版必应还更加“人性化”,不仅会为用户提供 问题选项,还会在回复中使用表情符号;新版必应更加严谨,会在回复中标注所
13、引用的来源,并列出对 应网站;新版必应更加智能,Al聊天搜索能够通过自然语言处理技术对用户提出的问题进行分析和理解, 从而能够给出更加智能化的搜索结果;新版必应更加个性化,通过对用户提出的问题进行分析和理解,Al 聊天搜索可以给出更加个性化的搜索结果,满足用户不同的需求:新版必应更加便捷,Al聊天搜索可以 通过对话的形式进行搜索,用户可以通过直接与搜索引擎进行对话的方式获取所需的信息,更加便捷快捷。Al聊天搜索可以应用于各种不同的场景。例如:1.旅游出行:在旅游出行过程中,用户可能需要查询各种 信息,例如交通路线、景点介绍、天气预报等。通过Al聊天搜索,用户可以直接向搜索引擎提出问题, 获取所
14、需的信息。2.学习研究:在学习和研究过程中,用户可能需要查询各种资料和文献。通过Al聊天 搜索,用户可以直接向搜索引擎提出问题,获取所需的资料和文献。3.工作咨询:在工作中,用户可能需 要查询各种信息,例如公司资料、行业资讯等。通过Al聊天搜索,用户可以直接向搜索引擎提出问题, 获取所需的信息。微软企业副总裁兼消费领域首席营销官YUSUfMehdi公布的最新推文称,在新版Bing 上线48小时内,已经有超过100万人申请加入。图3: Bing&Edge+AI: 一种全新的搜索方式L Bing C EdgeQaSearchAnswerChatCreate2.3.2 美股Al龙头C3.AI启示录:
15、聚焦Al应用侧最佳“掘金铲”C3.AI在赋能海量应用的同时,也不断拔高自身的稀缺性,而看似无解定制化开发的恶性循环,也在生成 式AI与边缘Al的相结合下,有望迎来真正的突破。边缘Al是指在硬件设备上本地处理的Al算法, 可以在没有网络连接的情况下处理数据。即:在无需流式传输或在云端数据存储的情况下进行数据创建等 操作。在边缘计算通过云上的深度学习生成数据,而在数据原点一一即设备本身(边缘)执行模型的推 断和预测的模式下,边缘Al的优势相比边缘计算进一步在智能与实时洞察等方面升华。边缘Al通过 反馈循环,一方面作为推理引擎向(B/C/G端)用户输出答案,另一方面作为流量入【I对用户数据进行首 次处理。在边缘Al部署中,推理引擎在工厂、医院、汽车、卫星和家庭等偏远地点的某种计算机或设备 上运行边缘Al将成为一个推理引擎回答现实世界的问题。当Al偶然发现问题时,通常会将有问题的 数据上传到云端,以便对原始Al模型进行进一步训练,在某种程度上取代边缘的推理引擎。这种反馈回 路在提高模型性能方面发挥着重要作用。据C3.AI官网,加入生成式Al (如ChatGPT)后,边缘Al能力将迎来跃升,主要表现如下:1)快速 访问相关、关键和高价值的答案,解决企业用户不同的数据存储、业务应用程序和其他关键数据存储系统 信息孤岛问题;2)提高数据安全性和增强治理基于角色和异常的访问控制: