Cloudera Manager 是 CDH 市场领先的管理平台。它以其强大的数据管理和分析能力,帮助企业能够轻松驾驭海量数据,实现数据的实时分...
Cloudera Manager 是 CDH 市场领先的管理平台。它以其强大的数据管理和分析能力,帮助企业能够轻松驾驭海量数据,实现数据的实时分...
概述:mrjob 是编写能够在hadoop上运行的python程序最简单的途径。您如果使用mrjob,可以在本地测试您的代码,甚至不需要安装ha...
1 场景 1.1 目的 centos7环境下安装分布式hadoop。hadoop版本:2.7.1。 1.2 准备工作 (1)操作系统版本 cen...
hive的map数量和reduce数量控制 参考文档: https://blog.csdn.net/may_fly/article/detail...
一、安装hive前提条件 hive运行在hadoop集群上,所以先要确保你的hadoop集群已经安装完毕并且可正常启动运行。如果没安装好hado...
LDAP介绍 LDAP概述 LDAP是轻量目录访问协议,(LDAP, Lightweight Directory Access Protoc...
记录常用的kafka常用的topic相关命令 查看topic列表 创建topic --create:创建命令;--topic:后面指定topic...
配置微软Azure大数据HDInsight云集群,存储账户、托管标识等问题也都参考官方文档解决了。原文在我的开源中国博客:https://my....
一、mapreduce过程资源优化 要了解mapreduce的资源优化,首先应该要熟悉整个mapreduce的过程,可以参考mapreduce2...
一、MapReduce2工作机制 1.1、MapReduce2的架构图 1.2、MapReduce2运作步骤 说在前头的话,上图中有一个Reso...
专题公告
Hadoop