《机器学习实战:基于Scikit-Learn、Keras和TensorFlow》
《机器学习实战:基于Scikit-Learn、Keras和TensorFlow》
1、字符串2、元组3、列表4、集合5、字典
1、SparkRDD创建操作2、SparkRDD转换操作3、SparkRDD行动操作
声明 本系列文章为学习Hazelcast的笔记,内容大部分都为官方文档翻译,如果对Hazelcast感兴趣,可移步Hazelcast查看官方原版文档。 学习目的 公司项目服务...
一、Lambda表达式二、方法调用(双冒号)的用法三、Stream函数式操作流元素集合四 、接口新增:默认方法与静态方法五、最新的Date/Time API 一、Lambda...
个人文章
一、字符串格式化 Python有三种字符串格式化方法:百分号方式,format方式,模板方式 1、百分号方式 2、format方式 3、模版方式 模版方式需要导入string...
在hive中,有时候一些内置的函数,和普通的查询操作已经满足不了我们要查询的要求,这时候可以自己写一些自定义函数来处理。自定义函数(user defined function...
HBase是三维有序存储的,通过rowkey(行键),column key(column family和qualifier)和TimeStamp(时间戳)这个三个维度可以对H...
1、HBase安全重启HRegionServer 以上命令执行的时候,HBase会把hostname下的region安全转移到集群的其他机器中,然后再重启,重启完成后再迁移回...
上图是HBase的存储架构图。 由上图可以知道,客户端是通过Zookeeper找到HMaster,然后再与具体的Hregionserver进行沟通读写数据的。 具体到物理实现...
上图是HBase的存储架构图。 由上图可以知道,客户端是通过Zookeeper找到HMaster,然后再与具体的Hregionserver进行沟通读写数据的。 具体到物理实现...
一、LSM树的原理 讲LSM树之前,需要提下三种基本的存储引擎,这样才能清楚LSM树的由来: 哈希存储引擎是哈希表的持久化实现,支持增、删、改以及随机读取操作,但不支持顺序扫...
一、添加节点 将新节点的网络地址添加到include文件中 运行以下命令,将审核过的一系列datanode集合更新至namenode信息: hdfs dfsadmin -...
在hadoop中实现了一套自己的序列化框架,相对于JDK自带的序列化工具,它更加简洁,在集群信息的传递上速度更快,容量更小。特点如下: 1. 数据紧凑带宽是集群中信息传递的最...
Hadoop 作为一个较通用的海量数据处理平台,每次运算都会需要处理大量数据,我们会在 Hadoop 系统中对数据进行压缩处理来优化磁盘使用率,提高数据在磁盘和网络中的传输速...
以下使用Hadoop的经典程序WordCount来说明MapReduce的处理过程,完整代码如下: 输入数据: 则以上的程序处理过程如下: 上图中从Mapping阶段到Shu...
在Yarn中有三种调度器可以选择:FIFO Scheduler ,Capacity Scheduler,FairS cheduler。它们的区别如下: 1、FIFO Sche...