在2023金融科技大会上的讲话.docx
在2023金融科技大会上的讲话尊敬的各位领导、各位嘉宾:大家好!非常荣幸参加今天的会议,感谢大会组委会的邀请!前 面听到三位领导非常高屋建甑的报告,学到了很多东西,也 有很多应用实践。下面,我简单介绍金融科技人工智能这项 技术在XX的一些具体的探索和实践。首先简单介绍一下XX。XX不仅是一家保险公司,也是一 家综合金融集团,拥有金融全牌照,右边可以看到我们过去 XX多年的发展是非常稳健的(PPT图示)。现在我们有x.x亿 金融客户,接近X亿互联网用户,提供了很多互联网服务, 包括XX健康等等。我们有XX多万内外勤员工,有很多金融 科技的场景,尤其是人工智能数字化的应用场景。我们对科 技非常重视,XX现在有接近X万名的IT人员、科技工作者、 研发人员,已经申请专利接近X万件,集团在金融科技和医 疗健康领域的专利申请数排名都是全球第一。为什么我们做这么多人工智能金融科技应用?因为我 们在金融领域的核心场景,包括营销、服务、运营、风控等 方面都存在非常多的挑战,需要通过人工智能技术帮助我们 来解决。大家很清楚,在目前的环境下,我们需要非常多的 技术来帮助我们解决一些业务上具体的痛点。我们怎么来解决这些痛点呢?首先我们要建立通用的 技术能力,最近比较火的大模型,大家觉得大模型可以“一 招鲜,吃遍天”,把所有技术都代替掉。其实所有的技术像一 辆汽车一样,组合起来才能构成一部汽车,一个技术很难构 成一个完整的数字化解决方案,所以我们要具备所有技术。 最本质的原因是Al技术现在基本是不完美的,非常少的Al 技术是xxx%完美的,绝大部分有很多错误。比如现在GPTx, 也有百分之十几的错误,我们在金融这种严肃的场景下要非 常谨慎应用,打造的方案必须是综合性的解决方案。因此, 我们在图像识别、语音识别、语义理解都在打造核心技术。 大模型技术方面,XX是XXXX年用判别式大模型进行广泛应 用(PA-Bert),今年开始我们有自己百亿和千亿的生成式大 模型,目前也在应用场景中得到了应用。但光有技术还是不够规模化覆盖应用场景,如果单点技 术支撑单点应用,这样的重复建设会很大。比如我们有很多 的开户场景,每个都用人脸识别打造身份认证,这样的重复 建设成本很高,所以我们要建立一系列通用技术平台和业务 中台,介绍几个例子(PPT示例)。我们将这些技术集中在通 用平台上,就能标准覆盖所有业务场景,这样成本低、更容 易运维。比如结构化分析建模平台。在制定营销方案和风控方案 时要用到很多分析建模技术,对结构化数据进行处理。我们 没有平台的话每个领域都要单独建设,现在有了结构化建模 之后,业务人员就可以用这个平台进行客户画像、产品推荐, 并且能实时监控,形成闭环。对于非结构化数据,图像、语音、文本、多模态数据等, 我们建立了非结构化的分析建模平台,通过这个平台,我们 可以让业务人员不用写代码,非常方便地上传数据、提出需 求、配置平台的组件,就可以构建一个个应用,在图像识别、 农业保险、养殖险这样的场景中都可以得到应用。比如我们 有很多养殖户买了养殖险,保额的其中一部分是牲畜,但没 有全部保,任何一个牲畜死了,都要理赔的话,会造成很大 的损失,因此我们要识别这是我们保的猪或者牛或者羊,这 个时候就要用图像识别技术,帮助我们保证安全性。现在我 们已经在XX比较广泛地应用这样一些技术,一个养殖场的 单独开发成本是很高的,但通过这样的平台建设,我们可以 非常方便地上传数据,平台帮你选模型、选网络、选参数, 压缩模型尺寸,满足合适的要求,自动做这个事情。大模型 也在这个平台上得到应用。还有隐私计算平台。数据是我们第五大生产要素,数据 要素流通是非常重要的事情,数据隐私保护是另外一个很重 要的事情。所以我们必须在合规基础上使用这些技术、共享 数据。我们打造隐私计算的技术,面对的参与方遍及全国各 地,这个平台能够帮助我们快速实现这个技术,央行的隐私 计算相关技术也是XX负责搭建的。有了基础建设的平台和中台之后,就可以打造人工智能 核心引擎(XX脑),底层数据包括算法的两层相辅相成,数 据帮助我们构建更好的模型,模型帮助我们得到更高质量的 数据,之上是业务中台,也就是综合性的中台,由中台规模 化覆盖前端的风控、营销、运营、服务等场景应用。数字人、数字员工是一个典型的场景,一个数字方案需 要综合很多技术才能实现,有图像、语音、文字、语言理解 等等,所有这些技术结合在一个整体的方案内才能实现数字 人的呈现。数字人有非常多应用场景,在XX也广泛应用,我 们有两类技术,一类是高清的,成本高、时间长,构建这样 的数字人,我们可以用它直接服务客户,不管是离线还是在 线的,右下角的视频是我们在抖音平台做的数字人的直播销 售,它可以x×xx小时做直播销售,等于增加了服务渠道。 上线X小时就排到了行业里在抖音上和真人比都是前三名的 流量和效果。中间是另外一种模式,就是用手机随手拍就可 以做到数字人分身,业务人员像孙悟空一样,把一堆汗毛变 成孙悟空,我们拍一个小视频就可以变成数字人分身,可以 用于制作宣传资料、培训。在服务领域,我们也有很多的应用,这是一个例子,机 器人电话座席,去年我们进行了 XX亿人次的服务量,这个服 务在很多场景都可以应用。我们这么多的场景,一个个开发 要很多年才能开发完,成本也很高,所以我们介绍的中台和 平台就发挥了很大的作用。通过这样一个平台、中台,业务 人员可以非常方便打造各种各样的服务机器人、客服机器人。 这个视频的左边一排是一堆组件,业务人员只要搭配这个组 件,并配置里面的参数、话数等东西,就可以构造不同场景、 不同机器人,这样能够快速覆盖数以千计的场景。我们不仅把这些技术用在了客服,也用在了其他领域, 除了去年的AI坐席服务量是XX亿人次,我们的销售也是达 到了千亿规模的效果。另外还有很多场景,包括培训、面试, XX有XXXX个面试专员,现在可以通过机器人做面试工作; 又比如客户在线上申请了贷款,需要打电话回去确认是不是 符合条件,这样的贷款尤其是普惠金融领域里的大部分客户 是不符合条件的,我们之前浪费了很多人力做这个事情,现 在都可以用机器人直接解决所有这些问题,不需要额外的人 力去做。运营上也有很多案例,这是车险定损的案例,原本很多 作业人员及作业的过程,通过人工智能技术可以帮助我们大 幅提升效率,大幅减轻负担,并能提供更高质量的服务。我 们的座席运行一年在人工智能领域没有投诉,因为它的服务 态度非常好。我们拥有现在也是全世界唯一的规模化生产的 车险定损的闪赔系统,这种系统通过人工智能图像识别技术 和知识图谱两项技术,可以让客户在发生车祸之后现场只要 拍几张照片,就能检查清楚车祸应该赔付的情况、赔付报告, 在确定金额之后直接付款,客户可以非常方便解决这个问题, 不用在现场等很久,体验非常好,成本也降低了,并且通过 这种技术可以识别出欺诈风险,识别非常高的理赔风险,每 年减少XX亿的欺诈损失。这个系统的底层覆盖XX多种车型, XXXX万种配件,XX万家XS店,可以帮助我们快速出理赔报 告。风控领域是金融核心的领域,我们有很多场景。这是声 纹识别的例子,我们可以用来做认证、服务和风控,可以通 过声音检测出黑名单,这是非常简单的。同时如果没有黑名 单,通过声音的一些分析,我们会发现一个电话号码如果有 不同的声音打电话进来,很可能这个电话号码是有问题的, 如果同一个声音经常换不同的电话号码打电话进来,也是有 问题的,一群人用一群号码打来打去也是有问题的。通过这 种技术我们可以找到以前很多没有发现、没有记录的欺诈团 伙,也帮XX公安局也发现了一些走私团伙。这是金融风险管理平台,包括宏观、纵观、微观的平台, 通过这样的平台进行全面覆盖,用在投资、债券、信贷等不 同场景上。我们底层的数据覆盖了 X亿多实体的知识图谱的 网络,可以帮助我们抽取宏观、纵观、微观的风险因子,帮 助我们识别很多效果。大模型有上千个应用场景,这是内部员工应用服务的场 景,大模型直接面客有一定风险,所以我们是非常谨慎地处 理这些工作,都是有人去审查、审核过才会面客。在员工服 务上,就可以直接用大模型进行服务,这是语言大模型,通 过金融领域数据的重新训练加强以后,我们的模型效果是非 常好的,右边是一个生产系统的视频,从这个生产系统可以 看到,可以比通用大模型效果更好地回答我们经济领域、金 融领域的问题。刚才提到的几个例子都是语言大模型,大模型是有多模 态的,在多模态场景上,我们用图像大模型做了很多宣传资 料;代码大模型可以帮助我们在XX内部进行使用,帮助员工 提高写代码的效率,包括代码纠错、代码自动生成、视频大 模型。语音大模型,可以帮助我们做非常快速的语音复制、转 换,这是一个很需要的应用。之前普通人工智能模型每个声 音建一个模型,大模型具有泛化能力,一个模型可以覆盖不 同声音,我们可以通过快速零样本或者一个样本复制不同声 音,员工虽然经常换,但可以保持他的声音不变,这是我们 很多场景需要做的。现在也可以低成本地实现这个效果。刚才也提到可持续发展,我们对Al伦理非常重视,我们 有一个"x+x+x”的机制,保证Al应用的风险可控。整个链 路包括具体的实践、自上而下的抽查和自下而上的检视。这是我向大家汇报的内容。谢谢大家。