大数据发展现状和趋势
- 原创经验
- |
- 更新:
- |
“大数据”是一个术语,用来描述一种数据集,它及其庞大、复杂,以至于畅通的数据处理应用程序难以应对。术语“大数据”通常指的是应用预测分析、用户行为分析或者某些其他从数据中提取有价值信息的高级数据分析方法,并不是专指某特定规模的数据集。下面我们就来了解一下大数据发展现状和趋势。
具体如下
-
大数据的概念
主要从两个反面解释了“大数据”的概念:
满足“大数据”首先要数据量巨大,巨大到什么程度哪?就是传统的数据处理程序难以应付的程度。(但依然没有明确一个量化的概念,TB级,PB级,还是很模糊的概念)但我认为“大”只是大数据的表象,还有更深层次的东西。
“大数据”指只通过收集到的一些数据(信息)进行一些分析,预测提取更有价值的信息的方法行为。
所以,“大数据”不仅仅指“大”的数据集;它要是具有足够的规模、足够的维度的的数据量的数据集,可以基于此数据集进行一些预测、分析及更有价值的信息提取。
-
大数据发展现状和趋势
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
-
大数据发展现状和趋势
一、大数据产业
大数据产业是现代新型服务业的一种,其主要内容主要分为三部分
(1)数据软、硬件制造业;大数据产业可以认为是信息产业,其主要内容包括一些硬件制造、软件开发、软硬件相结合的相关数据服务业,涉及范围为数据相关软件制造到数据服务等一系列相关业务。
(2)数据服务业通常是指用专业知识和技能给客户提供解决方案的服务业。
(3)数据内容业:数据内容业主要是指以信息为主,涉及到市场的各个领域,通常这些领域主要从事数据的整理、采集、加工、传播等数据服务产业群。
主要特征:
(1)较高的经济效益。大数据产业可以为多个行业带来较高的效益。据不完全统计,欧洲通过利用数据产品使得经济增长60%,而制造业的装配成本却降为原来的一半。
(2)占地面积小且环保。大数据产业相对于传统产业来说,不仅占地面积小而且对环境的污染也大大降低。例如钢铁、化工业,在生产的各个环节会产生大量对有害环境的产物,对环境造成一定程度的污染,而大数据产业却相反,会大大降低产能的消耗率,更符合现代经济发展的宗旨。
(3)更加专业化。大数据需要的是复合型人才,而不是单一领域的人才。但是目前就我国人力资源现状,有关培养该人才的教育机构少之又少。
-
大数据特性 4V”
1. Variety 多样性
指多种数据源多样,数据类型多样包括结构化数据、非结构化数据;
2. Velocity 时效性
指在大数据背景下,具有快速分析处理数据的能力。这个V的意义在于能够基于现有数据迅速做出决策。
3. Volume 海量性
指只有基于海量的数据样本,才能推导出有意义的结论。
4. Veracity 准确性
指要控制数据的质量,保证数据的可靠和准确,才能保证分析出有意义的结果。