大数据工程师的日常工作做什么?
【导读】时至今日,相信大家对大数据工程师一点也不陌生,作为时下比较热门的高薪职业,很多人想转行做大数据工程师,那么你知道大数据工程师的日常工作做什么?工作强度大不大呢?为此小编整理了以下内容,一起来看看吧!
1, 写 SQL :一般来说许多入职一两年的大数据工程师首要的工作就是写 SQL ;
2 ,为集群搭大数据环境(一般公司招大数据工程师环境都现已搭好了,公司内部会有现成的大数据途径);
3 ,维护大数据途径(这个应该是每个大数据工程师都做过的工作,或多或少会承担“运维”的工作);
4, 数据搬家(有部分公司需求把数据从传统的数据库 Oracle、MySQL 等数据搬家到大数据集群中,这个是比较繁琐的工作);
5 ,运用搬家(有部分公司需求把运用从传统的数据库 Oracle、MySQL 等数据库的存储进程程序或许SQL脚本搬家到大数据途径上,这个进程也是非常繁琐的工作,高度重复且杂乱)
6 ,数据收集(收集日志数据、文件数据、接口数据,这个触及到各种格式的转化,一般用得比较多的是 Flume 和 Logstash)
7, 数据处理
7.1 ,离线数据处理(这个一般就是写写 SQL 然后扔到 Hive 中跑,其实和首要点有点重复了)
7.2 ,实时数据处理(这个触及到音讯部队,Kafka,Spark,Flink 这些,组件,一般就是 Flume 收集到数据发给 Kafka 然后 Spark 消费 Kafka 的数据进行处理)
8 ,数据可视化(这个我司是用 Spring Boot 联接后台数据与前端,前端用自己魔改的 echarts)
9 ,大数据途径开发(偏Java方向的,大约就是把开源的组件整合起来整成一个可用的大数据途径这样,常见的是各种难用的 PaaS 途径)
10 ,数据中台开发(中台需求支撑接入各种数据源,把各种数据源清洗转化为可用的数据,然后再根据原始数据建立起宽表层,一般为了节省开发本钱和服务器资源,都是根据宽表层查询出业务数据)
11 ,建立数据仓库(这儿的数据仓库的建立不是指 Hive ,Hive 是建立数仓的东西,数仓建立一般会分为三层 ODS、DW、DM 层,其间DW是最重要的,它又能够分为DWD,DWM,DWS,这个层级仅仅逻辑上的概念,类似于把表名按照层级差异隔来的操作,分层的目的是防止开发数据运用的时分直接访问底层数据,能够减少资源,留意,减少资源开支是减少 内存 和 CPU 的开支,分层后磁盘占用会大大增加,磁盘不值钱所以没什么联络,分层能够使数据表的逻辑更加清楚,便当进一步的开发操作,假定分层没有做好会导致逻辑紊乱,新来的员工难以接手业务,跋涉公司的运营本钱,还有这个建数仓也分为建离线和实时的)
以上就是小编今天给大家整理发送的关于“大数据工程师的日常工作做什么?”的相关内容,希望对大家有所帮助。想了解更多关于大数据工程师要求具备的能力,关注小编持续更新。
大数据工程师相关文章推荐
|大数据工程师最新文章推荐
|大数据工程师最新经验推荐
- 2025年初级经济师84分即可过关,成绩2年内有效!
- 2025年中级经济师机考题目都一样吗?
- 2025年高级经济师证书满5年就过期?白考了吗?
- 2025年高级经济师评审政策解读!各省差异必须掌握
- 一级建造师考试高分答题技巧:从审题到作答,3大题型解题思路全解析
- 紧急提醒!2025 年一级建造师考试9月20日开考,这些事项千万注意
- 2025年12月英语四六级考试:时间明确,全力冲刺!
- 2025年12月英语四六级考试时间是什么时候?
- 2025下半年教资笔试准考证打印入口-中小学教师资格考试网
- 2025下半年教师资格证笔试准考证查询入口已开通!别错过!
-
胡安然
19:00-20:00 19:00-20:00
考前直播答疑-经济
一级建造师
-
高容国
20:00-22:00 20:00-22:00
AI让你准点下班: 自动写报告内容+PPT
AI启航
-
张君
19:00-20:00 19:00-20:00 09月16日 19:00-20:00
考前直播答疑-管理
一级建造师
-
安国庆
19:00-20:00 19:00-20:00 09月17日 19:00-20:00
考前直播答疑-法规
一级建造师
-
潘晓宇
19:00-20:00 19:00-20:00 09月18日 19:00-20:00
考前直播答疑-建筑
一级建造师
- 01 北京大约多久能解除疫情?
- 02 《中华人民共和国车船税法》全文
- 03 医师级别划分 十二级
- 04 这几种情况千万不要考消防工程师证书
- 05 2020年开年全球大事件你知道吗?
- 06 公务员存在不同级别 一级科员和一级行政执法员区别在哪
- 07 博士,硕士,研究生哪个学历高
- 08 中级资格证书有哪些
- 09 成人高考和自考有什么区别