大数据工程师数据分析技术工具有哪些
- 原创经验
- |
- 更新:
- |
关于大数据的业务应用,通过将数据扩展到解决方案,应该关注数据的“结构”和“维度”,那么,大数据工程师数据分析技术工具有哪些呢?大数据工程师都在用它们,今天就跟随小编一起来了解下吧!
具体内容
-
蜂巢
Hive是建立在Hadoop文件系统之上的数据仓库架构,用于分析和管理存储在HDFS中的数据。Facebook的诞生和发展是为了应对管理和机器学习Facebook每天产生的大量新社交网络数据的需求。后来,其他公司开始使用和开发Apache Hive,如Netflix、Amazon等。
-
Hadop
Hadoop诞生于2005年,是雅虎(Yahoo)为解决网络搜索问题而设计的一个项目。由于它的技术效率,后来被Apache软件基金会作为开源应用程序引入。Hadoop本身不是一个产品,而是一个软件产品的生态系统,这些软件产品结合在一起,实现了全面的功能和灵活的大数据分析。从技术上讲,Hadoop包括两个关键服务:使用Hadoop分布式文件系统(HDFS)的可靠数据存储服务和使用MapReduce技术的高性能并行数据处理服务。
-
风暴
Storm是一个主要由Clojure编程语言编写的分布式计算框架。这家营销和情报公司由Nathan Marz和他在BackType的团队创立,2011年被Twitter收购。Twitter随后将该项目开源,并将其推广到GitHub。Storm最终于2014年9月加入Apache孵化器项目,正式成为Apache的顶级项目之一。
作者声明:本篇经验系本人依照真实经历原创,未经许可,谢绝转载。