1.什么是hadoop?
hadoop是可靠的,可伸缩的,分布式计算的开源软件
是一个框架,允许跨越计算机集群的大数据集的分布式处理,使用的是简单的编程模型来完
成这些任务。可从单台服务器扩展到千台服务器。
2.hadoop的模块
1.hadoop common:公共的类库,用来支持其他的模块
2.hdfs :分布式文件系统
3.hadoop yarn:作业调度和资源管理的框架
4.MapReduce:基于yarn系统的大数据集并行处理技术
1.什么是hadoop?
hadoop是可靠的,可伸缩的,分布式计算的开源软件
是一个框架,允许跨越计算机集群的大数据集的分布式处理,使用的是简单的编程模型来完
成这些任务。可从单台服务器扩展到千台服务器。
2.hadoop的模块
1.hadoop common:公共的类库,用来支持其他的模块
2.hdfs :分布式文件系统
3.hadoop yarn:作业调度和资源管理的框架
4.MapReduce:基于yarn系统的大数据集并行处理技术