文章目录
一、认识大数据1.1、认识大数据1.2、大数据特征1.3、大数据流程图1.4、什么是大数据平台?一、认识大数据
1.1、认识大数据
大数据(Big data)或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工或者计算机,在合理的时间内达到截取、管理、处理、并整理成为人类所能解读的形式的信息。
1.2、大数据特征
Volumn:容量,数据的大小Variety:种类,数据类型的种类Velocity:速度,获取数据的速度1.3、大数据流程图
1.4、什么是大数据平台?
大数据平台是指以处理海量数据存储、计算及不间断流数据实时计算等场景为主的一套基础设施。典型的包括Hadoop系列、Spark、Storm、Flink以及Flume/Kafka等集群。
既可以采用开源平台,也可以采用华为、星环等商业级解决方案,既可以部署在私有云上,也可以部署在公有云上。
大数据平台的功能:
1、容纳海量数据
2、速度快
3、兼容传统工具
4、利用Hadoop
5、为数据科学家提供支持
6、提供数据分析功能