1.应用服务模拟器程序开发 2.模拟程序Jar包上传与分发 分发到第二台和第三台虚拟机--flume-1和flume-2 1.先在三台机器的opt中创建jar并改为普通用户权...
官方网址:http://flume.apache.org/ 1. Flume-3数据合并节点服务思路梳理 2.下载flume源码并导入Idea开发工具 下载并导入IDEA成功...
1.flume节点服务设计 前两个负责收集和整理数据,后面那个负责合并收集 2.flume版本下载安装 官方版本:https://archive.apache.org/dis...
1.Kafka服务简介及版本下载安装 1.官方版本:https://archive.apache.org/dist 2.搜索kafka_2.11-0.8.2.1.tgz版本 ...
1.下载hbase版本并安装 官方版本:https://archive.apache.org/dist CDH版本:http://archive.cloudera.com/c...
1.HBase能做什么? 1.海量数据存储 2.准实时查询 2.HBase在实际业务场景中的应用 3.HBase的特点 4.HBase数据模型并举例说明 举例说明 5.HBa...
1.HDFS-HA架构原理介绍 2.HDFS-HA 详细配置 namenode namenode datanode datanode da...
本文介绍几种目前常见的推荐系统的主要思路,后续会针对每个算法结合具体应用场景再具体阐述下。1.协同过滤推荐算法 user-CF算法 item-CF算法 2.基于内容的推荐算法...
1. zookeeper版本下载及安装 1.下载网址 1.https://archive.apache.org/dist 2.http://archive.cloudera....
三、Hadoop2.x分布式集群配置-取消授权 1.继续配置 Hdfs-site.xml 与core-site.xml 1.Hdfs-site.xml http://hado...
二、Hadoop2.x分布式集群部署-YARN 一、配置 一台ResourceManage和三台NodeManager 1.yarn分布式部署 1.Yarn-env.sh 配...
一、Hadoop2.x分布式集群部署-HDFS 1. hadoop2.x版本下载及安装 https://archive.apache.org/dist http://arch...
这几天跟着1点数据的金博老师 卡夫卡学习平台的大数据项目实战课程学习了 Linux环境的准备和配置,企业项目的案例需求与设计和一些基础概念,基本流程 收获很大,老师人还特别好...
三、 对集群中的机器进行基本配置 1、配置IP地址 以虚拟机bigdata-pro03.kfk.com为例 1.ifconfig 查看ip前缀码 可知为192.168.125...
二、克隆虚拟机并进行相关配置 1、创建我们将要使用的各个目录 sudo mkdir /opt/softwares sudo mkdir /opt/modules sudo m...
Linux环境的准备和设置 一、linux系统常规设置 首先,集群资源规划设计由5台机器改为3台机器 1.Linux系统常规设置 1.设置ip地址 192.168.125.-...
四、集群资源规划设计 4.集群资源规划设计