大数据开发工程师求职简历模板_002.docx
《大数据开发工程师求职简历模板_002.docx》由会员分享,可在线阅读,更多相关《大数据开发工程师求职简历模板_002.docx(4页珍藏版)》请在第一文库网上搜索。
1、大数据开发工程师-赵毅个人资料性别:X手机:XXXXX工作年限:3年姓名:XX学位:本科邮箱:XXXXXX求职意向工作性质:全职目标地点:北京期望职位:大数据开发工程帅专业技能1. 熟练使用MapReduce处理复杂业务,熟悉HDFS的读写流程、MapRcduce的运行流程以及Shuff1e机制、Yarn的工作机制、Hadoop的优化手段以及Hadoop框架搭建过程。2. 熟悉Zookeeper的选举机制和监听机制。3. 熟悉HiVe的架构和调优策略,熟练使用Hive的开窗等函数处理业务问题。4. 熟练使用FIUnIC完成数据的采集、过滤、分流等功能,熟悉双层F1Ume的使用。5. 熟悉Kaf
2、ka的工作流程、能够搭建Kafka集群,使用Kafka和Spark进行数据的流式处理。6. 熟悉HBasc框架,会使用HBaSe的基本操作以及HBase调优。7. 熟练掌握SPark任务调度和资源调度过程,会使用SPark常用的RDD算子处理数据,能够独立完成SPark集群的搭建,熟悉SPark的优化策略。8. 熟练使用DataSet和DataFrame算子和UDAF函数处理数据,熟练使用DStream算子完成流式实时数据的批次处理。9. 了解EIaStiCSearCho10. 会使用Azkaban和Oozie批量工作流任务调度器。11. 会使用SqOoP工具,实现关系型数据库和非关系型数据库
3、表数据的交互。12. 熟练使用Java和Sca1a编程,了解Python编程。13. 了解MongoDB、RCdiS等非关系型数据库。14. 熟练掌握常用的1inUX命令,使用She1I常用工具编写1inUX脚本。工作经历公司名称:工作时间:职位名称:项目经验XXXXX教育科技有限公司2015.07-至今大数据开发工程师项目名称:开发环境:技术框架:项目描述:东奥电商业务分析系统(2017.012019-02)IDEA+jdk1.8+MySQ1+Maven+SVNSpringBoot-.Nginx、F1ume-Hadoop.Hive、Spark、Sqoop,Azkaban通过对PC端和手机AP
4、P端用户产生的各类型日志经过一系列处理,形成各种报表,并且将网站的品牌前十、每月畅销图书、每季热门名师、地区点击量排名等统计出来,提供给公司的各大领导以及运营部门,提供参考,以便调整公司的发展方向。责任描述:1 .参与前期项目分析、设计系统整体架构。2 .编写she11脚本定期将f1ume-hdfs中的日志进行清洗并导入到hdfs中。3 .通过数据分层ODS、DWD.DWS.ADS,对东奥商城中活跃用户主题(日活、周活、月活)进行编码以及每月畅销图书、课程、热门名师,商品复购率等,以及特定需求的分析报表。4 .hive数据仓库设计和维护,数据主题的抽取,数据维度分析。5 .参与SPark的一些
5、优化,如常规性能调优、ShUffIe调优、数据倾斜。6 .编写系统的需求分析、设计、开发和部署文档。技术要点:1 .整体架构使用了双层FIUme的拓扑结构,以实现容灾及负载均衡,保证数据的安全性。2 .将行式存储转为列式存储,因为列式存储查询效率高,并采用ParqUet为存储方式,为了减少磁盘10、节约带宽;采用压缩格式为SnaPPy。3 .分析表的同步策略类型:例如用户表、商品表等实体表采用全量;订单明细、支付方式等采用增量;订单表采用新增及变化,并使用SqOoP导入数据到HDFS中。4 .把每个用户单b1的操作聚合起来组成一张多列宽表,以便之后关联用户维度信息后进行不同角度的统计分析。5
6、.制作订单表拉链表,将新增变动与拉链表,先进行合并变动信息,再追加新增信息插入到临时表中,然后覆盖拉链表,整理为每日脚本,查看任意一天的订单记录。6 .使用SPark共享变量机制,实现自定义累加器,并通过广播变量机制提升SPark任务的运行性能。7 .使用SParkSQ1、自定义二次排序、UDF函数、UDAF函数实现对课程、书籍以及教师ToPN的统计。8 .本项目中SPark集群采用了SortShUffie,通过产生一个RedUCerid排序可索引文件,大大提高了文件内指定reduce数据的读速度。9 .项目中的SPark集群采取了统一内存管理机制,一定程度上提高了堆内和堆外内存资源的利用率。
7、10 .为了避免在Spark的shuff1e过程中出现数据倾斜问题,我们提高了shuff1e操作中的reduce并行度。11 .项目中HiVe中,在map执行前合并小文件,并合理设置MaP数和RedUCe数,以防止导致数据倾斜。12 .在查询的时候对于“SE1EcT*FROM*”这种情况下,可以不用使用MaPRedUCe计算,所以我们使用Fetch抓取来直接读取存储目录下的文件。项目名称:开发环境:技术框架:项目描述:东奥电商实时分析系统(2018.082019-01)IDEA+JDK+Tomcat+Maven+GitNginx、SpingBootKafka、Redis、Spark、E1ast
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 开发 工程师 求职 简历模板 _002