8 V Characteristics:
- Volume 量
- Velocity 速度
- Variety 多样性
- Veracity 诚实准确性
- Value 价值
- Variability 可变性
- Viscosity 粘度
- Virality 扩散性
【Hadoop】大数据时代,我们为什么使用hadoop - 大牛笔记 - CSDN博客 http://blog.csdn.net/weixuehao/article/details/14126199
大量:这个大家都知道,想百度,淘宝,腾讯,Facebook,Twitter等网站上的一些信息,这肯定算是大数据了,都要存储下来。
多样:数据的多样性,是说数据可能是结构型的数据,也可能是非结构行的文本,图片,视频,语音,日志,邮件等。
实时:大数据需要快速的,实时的进行处理。如果说对时间要求低,那弄几个机器,对小数据进行处理,等个十天半月的出来结果,这样也没有什么意义了。
不确定: 数据是存在真伪的,各种各样的数据,有的有用,有的没用。很难辨析。
根据以上的特点,我们需要一个东西,来:
1存储大量数据
2快速的处理大量数据
3从大量数据中进行分析
于是就有了这样一个模型Hadoop。