简历模板大数据开发工程师.docx
《简历模板大数据开发工程师.docx》由会员分享,可在线阅读,更多相关《简历模板大数据开发工程师.docx(3页珍藏版)》请在第一文库网上搜索。
1、大熬据开发工程师个人信息姓 名:XXX电 话:17XXXXXX工作经验:3年性另成男邮 箱:XXXp 教育经历毕业学校:XX大同大学专也:计算机科学与技术工作经历工作经历:XXXXXXX技术有限公司时间:2016.22019.3技术列表 熟练使用Hadoop结构体系,以及Hadoop集群搭建和维护,理解HDFS读写流程、MapReduce原理,以及Hadoop的Shuffle机制及优化。 理解Spark任务提交流程以及Spark RDD、Shuffl广播变量等一系列调优。 熟练使用Flume完成数据的采集、过滤、分类等功能,理解Flume的组成及工作原理。 熟练使用Kafla高低阶API消费数
2、据,理解Kafl 熟悉使用Hive进行海量数据查询分析,常用的查询函数,以及自定义函数,熟悉Hive的架构和调优策略。 熟悉Zookeeper的选举机制和监听机制。 熟练使用DataSet和DataFrame算子以及UDF函数处理数据,熟练使用Dstream算子完成实时数据的批次处理。 熟悉Redis的常规操作以及五种数据类型,主从复制,集群搭建,以及Redis的持久化方式。 了解Hbase底层数据存储原理以及Hbase中RowKey的设计。 熟练使用Scala和Java编程,并了解Python编程。 熟练掌握Linux命令,可以使用Shell编写Linux脚本。 了解JVM的运行原理,GC优
3、化策略。 熟练使用GIT、SVN等代码管理工具。项目经验 项目名称:别样数仓离线分析项目架构:Flume Hadoop + Hive Spark + Sqoop开发环境:IDEA + Maven + Git + Scala项目描述:本项目是为了将分散的操作型数据、埋点数据以及历史数据通过做数据抽取、清理等有系统的分析整理,得到高效率、高质量、高扩展的数据,以方便联机分析处理(OLAP)的进行,分析处理可以分为离线、实时两大部分,离线通过分析当前系统的用户活跃、转化率以及用户行为等一些关键性指标,实现BI报表,起到企业决策分析的作用,对企业的未来趋势做出定量分析和预测。职责描述:1、参与数据仓库
4、的建模搭建。2、负责数据仓库与前台埋点数据以及用户行为口志的数据联调。3、负责将采集系统获取的页面的点击、下单等一系列用户操作行为日志进行具体分析。4、负责将数据进行分析并分别存储到ODS、DWD、DWS、ADS四层,不仅减少了极大的重复计算还使数据结构更加清晰。5、对Spark core Spark sql性能调用和优化。技术要点:1、通过将采集到的前台用户操作日志文件写入到对应的HDFS目录,得到原始数据。2、通过Hive将采集到HDFS的日志数据导入到数仓ODS层。3、将ODS层数据存储格式改为Parquet存储,以及压缩算法采用Snappy,以保证在提升查询速度的前提下降低压缩比。4、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 简历模板 数据 开发 工程师