大数据开发求职简历模板.docx
《大数据开发求职简历模板.docx》由会员分享,可在线阅读,更多相关《大数据开发求职简历模板.docx(3页珍藏版)》请在第一文库网上搜索。
1、孙青松简历个人信息姓 名:XXX工作经验:3年性 别:男手 机:XXXXXX学 历:本科电子邮件:XXXX求职意向意向:大数据开发工程师状况:离职地点:北京薪资:面议T作经历2016/2一至今XXXXX科技有限公司大数据开发工程师专业技能L 熟练掌握 SparkSql SparkStreaming Spark Core,理解 Spark 工作机制及 Spark 任务的执行流程。2.熟练掌握HadoOP分布式集群安装、部署、搭建和配置,能够熟悉应用Hadoop相关工具 进行相关应用开发。3,熟悉MapReduce, Hdfs工作机制和运行原理。4 .熟练使用Kafka实现集群分布式高吞吐量通信机
2、制,同时借助Zookeeper建立生产 者和消费者的关系,实现负载均衡和持久化。5 .熟悉Linux环境和常用命令以及简单Shell脚本编写。6 .熟悉HBase的系统架构,了解RowKey设计,了解HBaSe优化。7 .熟悉Hive工作原理,数据仓库基本建立和Hive优化。8 .熟悉开源日志收集系统Flume,能够在不同场景实现日志收集工作。9 .熟悉Sqoop的数据导入导出,实现MySql和Hive之间的数据传输。10 .熟悉OoZie任务调度工具和Azkaban工具实现定时调度任务。11 .熟练使用Java和Scala语言编程、熟练使用MySql语句。项目经历 项目一:礼物说数仓项目软件
3、架构:Nginx + Tomcat + Hadoop + Flume + Zookeeper + Hive + Mysql + Spark + Sqoop+Azkaban开发环境 :Idea + Maven + Git项目描述:公司发展迅速,针对数据整体统一规划管理,对数据进行统一整理、清洗、过 滤、去重、存储,便于以后的日常维护工作和项目开展。责任描述:在本次项目中主要负责并参与数据仓库的流程设计,实现数仓的各层,分别是ODS层(原始数据层)、DWD层(明细数据层)、DWS层(服务数据层)和ADS层(数据应用层), 其中DWS层中包含事实层、维度层、宽表层,为了达到拿空间换时间的目的,由事实
4、层中 的事实表和维度层的维度表关联形成宽表层。技术要点:LFIUnl收集Web节点日志信息,根据每个EVent的Body里存的数据,可以对Log进行判 断,设定不同的Header值,然后再经过选择器,根据Header中的某个值来决定走哪个 Channel,将清洗完的数据存入HiVe中,作为原始数据。2 .使用ShelI编写脚本,每日定时的通过脚本将数据加载到ODS层,不做数据处理。3 .在DWD层采用Snappy压缩,通过该压缩方式解压速率快,存储方式选用Parquet,后面 的需要用Spark处理数据。4 . DWS层将数据进行统一标准、数据维度建模,抽取公共纬度,符合星型模型,将事实表和
5、维度表进行关联,形成字段较多的宽表层,比如订单总数、订单流水等,为应用层服务。5 .对于一些每口变化量不大,但是业务需求有需要统计出来的表,制作拉链表,从而解决即 不好用全量表也不用增量表的情况。6 . ADS层数据,是为了满足具体需求,完成报表统计,细分主体,比如优惠券相关统计、用 户、订单相关数据统计。7 .在处理DWS层数据时,在使用RDD时,将重复的RDD进行持久化处理。当内存无法将完整 的RDD进行缓存时,将RDD进行序列化,减小数据体积。8 .在DWS层计算地区商品前三销量占比时,使UDAF函数解决Sql不方便显示商品占比问题。9 . Hive中开启FetCh,减少某些情况下不用M
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 开发 求职 简历模板