欢迎来到第一文库网! | 帮助中心 第一文库网-每个人都是第一
第一文库网
全部分类
  • 研究报告>
  • 学术论文>
  • 全科教育>
  • 应用文档>
  • 行业资料>
  • 企业管理>
  • 技术资料>
  • 生活休闲>
  • ImageVerifierCode 换一换
    首页 第一文库网 > 资源分类 > DOCX文档下载
    分享到微信 分享到微博 分享到QQ空间

    2023实时数据仓架构图.docx

    • 资源ID:398048       资源大小:371.97KB        全文页数:17页
    • 资源格式: DOCX        下载积分:3金币
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: QQ登录 微博登录
    二维码
    扫码关注公众号登录
    下载资源需要3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,免费下载
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    2023实时数据仓架构图.docx

    基于FIiiIk的滴滴实时数仓实践分享大纲:整体概况业务实践平台&引擎总结反思未来规划F1INKFORWARD#ASIA2023数仓分层开发效率高,快速完成业务需求.数据短用性较差,资源浪费严重可维护性差,如果存在口径变更,需要多处修改. 初步体赢仓糠念,进行基本数据分层 没有进行指标层面沉淀 提供服务方式单一,依赖O1AP 完成整体数据分层,包含明细数据和汇总数据 统一DWD层,降低资源浪费,提高数据震用性 完成指标口径沉淀,保证数据质整体资源消耗下降30%+F1INKFoRWARt>#AS1A2023体系架构高管运营业务分析开发数娓体系建设屈范6)APP数据看板数据产品实时接口服务O1AP一站式开发平台计算引簟OOC指标工总OODWM因泡呼单完单PVUV.冒DWD业务数据流量数据维度数据WODS数据康Bm1OgPub1ic1ogToPiC消息队列数据源2实时O1AP,从0到1分享大纲:业务背景 机遇挑战 架构演进 架构优化未来展望遇到的需求与挑战RequirementsAndCha11engesFUNKFORWARD#ASIA2023#1效率:SQ1查询慢TheSQ1queryiss1ow.SE1ECTMAX(received),addr.hashFROMaddress.txGROUPBYaddr.hashORDERBYMAX(received)DESC;#2实时:实时的需求,链上实时风控Rea1-time:Rea1-timerequirements.Rea1-timeriskcontro1onchain.#3监控:缺乏完整的监控,服务好才是真的好Monitor:1ackofmonitoringservices,Goodserviceisrea11ygood.ReauimeO1APArchitecture客户合作伙伴决策支持应用层计算层数据层数据源数据资产Sink层内部I腾讯基于FIink+Iceberg全场景实时数仓的建设实践分享大纲:背景及痛点 数据胡技术apacheiceberg f1ink+iceberg构建实时数仓 未来规划痛点总结summary传统T+1任务1ambda架构痛点K叩Pa架构痛点1、海量的TB级T+1任务延迟导致下游整相产出时间不稳定.2、任务遇到故障重试恢复代价昂贵3、数据架构在处理去重和exact1y-OnCeiS义能力方面比较吃力4、架构复杂,涉及多个系统协调,靠调度系统来构建任务依赖关系1、同时维护实时平台和离线平台两套引擎,运维成本高2、实时离线两个平台需要维护两套框架不同但业务逻辑相同代码,开发成本高3、数据有两条不同链路,容易造成数据的不一致性4、数据更新成本大,需要重跑链路1、对消息队列存储要求高,消息队列的回溯能力不及离线存储2、消息队列本身对S掂存储有时效性,且当前无法使用O1AP引擎直接分析消息队列中的雌3、全链路依赖消息队列的实时计算可能因为数据的时序性果不睁分钟/秒级MinuteZsecond支持ACID语义AC1Dsemantic高效的UPSert操作Upsertoperation支持批流读写Batch-streamreadwrite高效的回溯能力BackfiUabi1ity支持Schema变更Schemaupdate实时数仓建设的需求Requirementtobui1drea1-timedatawarehouseIJKappa小时/天级,Hour/dayFr实时化需求Rea1-timerequirement存储层需要的能力Neededabi1ityinStorage1eve1F1INKFORWARD#ASIA200实时数仓数据湖分析系统Rea1-timedata1akehouseana1yticsystemStreamingF1INKFORWARD#ASIA20231腾讯看点基于FIi11k构建万亿数据量下的实时数仓及实时查询系统分享大纲:背景介绍架构设计实时数仓实时查询系统Updatedai1yMasterUsers(Rept)OneMinute1eve1-Content-usergranu1aritys1ightaggregationOneMinuteIeve1-Contentgranu1aritymoderateaggregationRea1-timedatawarehouseRea1-timedatawarehouseDWM1ayer(Messagequeue)Rea1-timedatawarehouseDWS1ayer(Messagequeue)Rea1-timequerysystemMu1ti-dimensiona1queryca1cu1ationStorageCIickHouse.RedisDataana1ysisa1gorithmSUveSy*tmsContentdistributionRea1timeco11ectionofuserbehaviordataOperatingsyftmmi1Usecond1kmi11isecond/IkHBase-Proxy.redissecond1k一-UKHBRSUITF1INKFORWARD#ASIA2023ApacheF1ink敷掘仓启Datawarehouse内容维度数据Contentdimensiondata存一致性Cacheconsistent维度数据Dimensiona1data商OOP用户像数据UserportraitdataRea1-timefeedbackRea1-time:feedback龙逸尘F1ink在顺丰的应用实践分享大纲: 建设背景 建设思路 落地实践 应用案例 未来规划实时数仓建设思路Ideasofconstructingrea1-timedatawarehouse统一数仓标准与元数据基于SQ1统一开发流程批流统一宽表建设平台治理引入Hudi加速宽表产出数仓平台化建设基于F1inkSQ1构建实时数仓数据统一接入开发元数据管理统一数仓规范Unifieddatawarehousespecification设计规范命名规范模型规范实时数仓层级划分The1ayersofrea1-timedatawarehouseODS数据库Bin1og业务日志业务消息队列埋点日志ADSKafkaIESHBaSe)HiVeKafkaKafkaSourceHBaSeESDIMRediS)IMySQ1实时数仓方案-Kappa架构Rea1-timedatawarehouse-KappaarchitecturePrestoIKy1in)IHBaSe(ESDIMRediSJMySQ11SourceMessageQueueRDS/Bin1og实时数仓方案对比与实际需求Rea1-timedatawarehousearchitecturecomparisonandourdemands方案对比1ambda架构Kappa架构实际需求实时性*eaT+0的实时表T+0的实时表T+0的实时宽表资源消耗批流同时运行资源消耗大纯流处理资源消耗小大部分流处理资源消耗一般更新历史数据全量重新计算全量重新计算直接更新原表保留更新记录重新计算时吞吐全量批处理吞口±大全量流处理吞吐量较批处理小无需团新计算适用性全部场景部分场景全部场景实时数仓方案最终架构Rea1-timedatawarehouse-architectureHudi关键特性ThekeyfeaturesofHudi时间漫游更新删除存储类型优化视图增量消费文件压缩可回溯历史数据在大规模数梨集中更新期除CopyonWrite读优化视图作为期源发出增量数据异步压缩小文件根据主键更新删除MergeonRead增视;实时视图构建实时数仓宽表Rea1-timedatawarehouse-widetab1econstruction运单宽表(Waybi11detai1Jnfo)宽表运单表(Waybi11infO)事实表订单表(OrdeJinfO)事实表用户表(IJSe1jnfo);维表运单号(WaybiI1id),运单状态(WaybH1Status),订单号(Orderjd),订单状态(Order_status),用户ID(USerJd),用户名(USemame)将运单表数据插入宽表,运单号作为宽表主键运单号和订单号的映射存入临时表订单表用户ID关联用户表,获取用户名订单表根据订单号从临时表中获取对应运单号将订单表增量插入宽表,更新宽表状态InMrtintod4d.wybi11f1.dti1.infost1ctybi11id,wybi11.stAtus9orderaaidfroodikfk.wybi11info,createtb1d1.rdisind<x(Order.idstring,waybi11.idstring)MM('connctor.typ,«*rdi,j,connctor.i,ipX',connctor.port,'connctor.1ookup.cch.naxcoms',ie',connctor.1ookup.cch.tt*eweeee,connector.version*,5.,7');intrtintodia.rdiswinxs1ctordr-id,aybi1i-idroeods.kf.wybi11.info.insertintot1ctdifunction(*di.rdisiMx,Ordtr*wybi11vid*)asMaybi!1*ord<rid,ordr-sttus,u“r_id,dif-di-functi(,dir.utr-info',usr-id,*usmaM*)atusmja"roo<UJd.ordejfMo;一ApacheF1ink在汽车之家的应用及实践

    注意事项

    本文(2023实时数据仓架构图.docx)为本站会员(lao****ou)主动上传,第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知第一文库网(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2008-2022 001doc.com网站版权所有   

    经营许可证编号:宁ICP备2022001085号

    本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



    收起
    展开