生成式AI行业市场分析.docx
《生成式AI行业市场分析.docx》由会员分享,可在线阅读,更多相关《生成式AI行业市场分析.docx(10页珍藏版)》请在第一文库网上搜索。
1、生成式AI行业市场分析1、生成式A1在视频/3D/游戏等领域的渗透加速生成算法模型不断突破创新,下游应用场景不断拓展基础的生成算法模型不断突破创新,基础能力日新月异,从图像向视频和3D扩展,更广泛地应用于下游应用场景。生成对抗网络(GAN)是早期最著名的生成模型之一,尽管在图像生成上产生了卓越的效果,但其训练常常受到梯度消失和模式崩溃等问题的影响。与GAN相比,扩散模型(DiffusionMode1)只需要训练“生成器”,不需要训练别的网络(判别器、后验分布等),训练时仅需模仿一个简单的前向过程对应的逆过程,实现简练过程的简化。扩散模型相对GAN来说具有更灵活的模型架构和更精确的对数似然计算,
2、生成图像质量明显优于GAN,已经成为目前最先进的图像生成模型。此前扩散模型主要适用于生成2D图像,23年Runway的最新研究成果将扩散模型扩展到视频领域,在未加字幕的视频和配对的文本-图像数据的大规模数据集上训练出视频扩散模型。NeRF(神经辐射场)的出现为3D场景生成带来了新的可能性,进一步拓宽生成算法领域下游的应用场景。NeRF(NeuraIRadianceFieId)是一种基于神经网络的3D重建技术,不同于传统的三维重建方法把场景表示为点云、网格、体素等显式的表达,NeRF将场景建模成一个连续的5D辐射场隐式存储在神经网络中,输入多角度的2D图像,通过训练得到神经辐射场模型,根据模型渲
3、染出任意视角下的清晰照片。Runway:生成式A1内容平台,Gen1可实现用文字和图像从现有视频中生成新视频RUnWay是一家生成式A1内容平台,致力于让所有人都能进行内容创作。RUnWay创立于2018年,总部位于纽约,提供图片、视频领域的生成式A1服务。Runway得到众多资本青睐,获得谷歌领投的D轮融资。创立以来,Runway已获得Fe1icisCoatueAmP1ify、1UX、Compound等顶级投资机构投资。23年6月,Runway获得由谷歌领投的1亿美元的D轮融资,这笔融资交易包括三年内7500万美元的谷歌云积分和其他服务,估值达到15亿美元。主要产品为Gen-1和Gen-2,
4、Gen-1可实现用文字和图像从现有视频中生成新视频,Gen2可实现文字生成视频功能。Gen-1:不需要灯光、相机和动捕,通过将图像或文本提示的结构和风格应用于源视频的结构,逼真且一致地合成新视频,且具有表现力、电影感和一致性。Gen-1提供给用户五种不同的视频制作模式:1)Sty1iZatiOn:将任何图像或提示的风格转移到视频的每一帧;2)Storyboard:将模型变成完全风格化和动画的渲染。3)Mask:隔离视频中的主题并使用简单的文本提示对其进行修改;4)Render:通过应用输入图像或提示,将无纹理渲染变成逼真的输出;5)Customization:通过自定义模型以获得更高保真度的结
5、果,释放Gen-1的全部功能。Gen-1的性能优势:基于用户研究,GEN-1的结果优于现有的图像到图像和视频到视频的转换方法,比StabIeDiffUSiOn1.5提升73.83%,比Text21ive提升88.24%oGen2是一个多模态的人工智能系统,可以用文字、图像或视频片段生成新颖的视频。Gen-2在Gen-1的基础上迭代,保留通过将图像或文本提示的结构和风格应用于源视频的结构合成新视频的功能,新增了只用文字便可生成视频的的功能。Gen-2在Gen的五种视频制作模式上新增了三项新的模式:1)TexttoVides仅通过文本提示合成任何风格的视频;2)Text+1magetoVideo:
6、使用图像和文本提示生成视频;3)ImagetoVideo:用一张图片生成视频(变体模式)。Gen-2已于2023年6月上线,用户可以通过网页端和移动端App免费体验文字生成视频的功能。收费模式上,Runway采用订阅模式,分为Standard和Pro两个版本:Standard15美元/月;Pro35美元/月。订阅版本提供更高的credits(制作视频消耗credits)更长的视频长度、更高的分辨率等。1umaA1:3D内容解决方案平台,基于NeRF上线文字转3D和视频转3D功能1umaAI是一家3D内容解决方案平台。1umaAI创立于2023年,总部位于加州。公司创始人在3D视觉、机器学习、实
7、时图形学上有所建树:CEO&CofounderAmitJain曾于苹果任职,在3D计算机视觉、摄像头、M1、系统工程和深度技术产品方面有者丰富经验;CTO&CofounderA1exYu致力于推动神经渲染和实时图形领域的发展,研究成果包括PIenOXe1s、PIenOctrees1pixe1NeRF01umaA1深耕3D领域,也发布多项3D生成产品。22年10月开放网页版1uma;22年12月推出文生3D模型功能;23年1月QS版APP开始支持NeRFReshoot;23年2月推出网页版全体积NeRF渲染器;23年3年QS版APP支持AR预览,同月推出视频转3DAPI。23年4月发布1umaU
8、nreaIEngineaIpha,帮助开发者在Unrea15中进行完全体积化的渲染,无需对几何结构或材质进行修补。主要产品:1umaApp:目前只推出QS客户端,可以通过iPhone上传视频,基于NeRF生成3D场景。1UmaAPP支持导入视频,以及引导模式和自由模式三种:导入模式,和Web模式功能类似,对设备和视频理论上要求最低;引导模式,需要360度拍摄,APP将具体提示框提醒拍摄视角、拍摄位置;自由模式,支持非360度(部分视角)拍摄,App不会给出明确提示框,需要尽可能拍摄多个角度。网页端:目前集成了三大主流功能:网页版1Uma、文字转3D模型、视频转3DAPI。网页版1Uma:上传照
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生成 AI 行业 市场分析