大数据工程师的日常工作做什么?
【导读】时至今日,相信大家对大数据工程师一点也不陌生,作为时下比较热门的高薪职业,很多人想转行做大数据工程师,那么你知道大数据工程师的日常工作做什么?工作强度大不大呢?为此小编整理了以下内容,一起来看看吧!
1, 写 SQL :一般来说许多入职一两年的大数据工程师首要的工作就是写 SQL ;
2 ,为集群搭大数据环境(一般公司招大数据工程师环境都现已搭好了,公司内部会有现成的大数据途径);
3 ,维护大数据途径(这个应该是每个大数据工程师都做过的工作,或多或少会承担“运维”的工作);
4, 数据搬家(有部分公司需求把数据从传统的数据库 Oracle、MySQL 等数据搬家到大数据集群中,这个是比较繁琐的工作);
5 ,运用搬家(有部分公司需求把运用从传统的数据库 Oracle、MySQL 等数据库的存储进程程序或许SQL脚本搬家到大数据途径上,这个进程也是非常繁琐的工作,高度重复且杂乱)
6 ,数据收集(收集日志数据、文件数据、接口数据,这个触及到各种格式的转化,一般用得比较多的是 Flume 和 Logstash)
7, 数据处理
7.1 ,离线数据处理(这个一般就是写写 SQL 然后扔到 Hive 中跑,其实和首要点有点重复了)
7.2 ,实时数据处理(这个触及到音讯部队,Kafka,Spark,Flink 这些,组件,一般就是 Flume 收集到数据发给 Kafka 然后 Spark 消费 Kafka 的数据进行处理)
8 ,数据可视化(这个我司是用 Spring Boot 联接后台数据与前端,前端用自己魔改的 echarts)
9 ,大数据途径开发(偏Java方向的,大约就是把开源的组件整合起来整成一个可用的大数据途径这样,常见的是各种难用的 PaaS 途径)
10 ,数据中台开发(中台需求支撑接入各种数据源,把各种数据源清洗转化为可用的数据,然后再根据原始数据建立起宽表层,一般为了节省开发本钱和服务器资源,都是根据宽表层查询出业务数据)
11 ,建立数据仓库(这儿的数据仓库的建立不是指 Hive ,Hive 是建立数仓的东西,数仓建立一般会分为三层 ODS、DW、DM 层,其间DW是最重要的,它又能够分为DWD,DWM,DWS,这个层级仅仅逻辑上的概念,类似于把表名按照层级差异隔来的操作,分层的目的是防止开发数据运用的时分直接访问底层数据,能够减少资源,留意,减少资源开支是减少 内存 和 CPU 的开支,分层后磁盘占用会大大增加,磁盘不值钱所以没什么联络,分层能够使数据表的逻辑更加清楚,便当进一步的开发操作,假定分层没有做好会导致逻辑紊乱,新来的员工难以接手业务,跋涉公司的运营本钱,还有这个建数仓也分为建离线和实时的)
以上就是小编今天给大家整理发送的关于“大数据工程师的日常工作做什么?”的相关内容,希望对大家有所帮助。想了解更多关于大数据工程师要求具备的能力,关注小编持续更新。
大数据工程师相关文章推荐
|大数据工程师最新文章推荐
|大数据工程师最新经验推荐
- 营养师哪个证书最正规?(附公共营养师备考资料)
- 康复治疗技术可以考执业药师证吗(附执业药师备考资料)
- 中药师证怎么考,需要什么条件(附药师备考资料)
- 2025年二级建造师考试科目及通过率(附二建备考资料)
- 执业药师有什么作用和好处(附执业药师备考资料)
- 口腔医学技术可以考药师资格证吗(附执业药师备考资料)
- 选专业:环境工程和环境生态工程这两个专业有什么区别
- 自学考试报名条件(附自学考试备考资料)
- 教资面试会不会刷人?(附教师资格备考资料)
- 药学类和药学专业有什么区别?
-
胡子薇
19:00-21:00 19:00-21:00
早鸟筑基课(一)-法规
一级建造师
-
刘月
19:00-21:00 19:00-21:00 11月21日 19:00-21:00
早鸟筑基课(一)-建筑
一级建造师
-
裴彪
19:00-21:00 19:00-21:00 11月21日 19:00-21:00
早鸟筑基课(一)-市政
一级建造师
-
刘敬
19:00-21:00 19:00-21:00 11月21日 19:00-21:00
早鸟筑基课(一)-机电
一级建造师
-
杨姣
19:00-21:00 19:00-21:00 11月21日 19:00-21:00
早鸟筑基课(一)-公路
一级建造师
- 01 北京大约多久能解除疫情?
- 02 《中华人民共和国车船税法》全文
- 03 医师级别划分 十二级
- 04 这几种情况千万不要考消防工程师证书
- 05 2020年开年全球大事件你知道吗?
- 06 公务员存在不同级别 一级科员和一级行政执法员区别在哪
- 07 博士,硕士,研究生哪个学历高
- 08 中级资格证书有哪些
- 09 成人高考和自考有什么区别