Hbase笔记

hbase是谷歌bigdata论文的一个代码实现，hbase是开源软件，在大数据处理领域应用广泛。今天楼主先来介绍一些基本原理，后面用工程代码方式来叙述API的用法。楼主是新手，如有错误，欢迎大家指正。

简介

Hbase（Hadoop database）是一个高可靠性（数据存储在HDFS文件存储系统上，十分可靠，有机会楼主再写HDFS的博文）、高性能（传统单机数据库在数据量高于百万数量级后性能很差）、面向列、可伸缩实时读写的分布式数据库。

hbase主要用来存储非结构化和半结构化的松散数据。

数据结构

首先介绍一下基本概念

row key

决定一行数据；按照字典顺序排序，数据有结构；row key最大为64K（注意只能存储字节数组，要先转换成字节数组才能存入hbase）

time stamp 时间戳

hbase每个cell存储单元对同一份数据由多个版本，根据时间戳来区分不同版本，不同版本的数据按照时间倒序排列，最新的数据排在最前面。时间戳是64为整形数据，在写入数据时自动赋值（用户也可以自己给时间戳赋值）。hbase并不会存储每个时间戳的历史数据，由用户设置一个最大版本数来约束版本的数量，多余的版本在合并时被删除。

column family

（新手可以暂时这样理解：传统关系型数据库里面的列的集合就是hbase里面的列族）hbase把同一列族里面的数据存在同一目录下，一个列族可以有多个列成员（eg：course这个列族可以有以下几列 math、cs

访问时，列名为：course：math）

cell

由行和列的坐标决定，单元格是有版本的。

Hbase 表结构

Hbase的存储机制

1、Hbase 表依赖于HDFS，当数据到达一个程度则会切分为一个region。

2、一个用户的数据表会被气氛为很多个region，然后分别存储到不同的regionserver上。hbase文件在HDFS上落地成HFile 。

3、HMaster 作为hbase 的管理节点，HMaster 不负责存储表数据，只负责管理regionserver的状态和 regionserver 的负载均衡。

Hbase的寻址机制

1、一张庞大的用户数据表，会被分割为若干个region。每一个region会有一个起始行键，和结束行键。

2、每个表所属的主机，每个region的起始结束行键等信息都会被保存到一个系统表MATE中。一个region就在这张系统表MATE中产生一条记录。

3、其中MATE可能非常庞大，MATE表也是分布式存储。一定数据量也会形成一个region。相当于计算机系统的分级索引。

4、ROOT表将会保存在一台RegionServer上。并会记录在Zookeeper中。

5、需要寻找一张表的内容，Zookeeper =》 ROOT表 =》MATE表 =》 RegionServer中的region

Hbase基本操作：https://blog.csdn.net/vbirdbest/article/details/88236575?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1&utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1

最后编辑于：2020.04.14 23:10:03

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,179评论 5赞 476
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,229评论 2赞 380
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,032评论 0赞 336
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,533评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,531评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,539评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,916评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,574评论 0赞 256
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,813评论 1赞 296
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,568评论 2赞 320
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,654评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,354评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,937评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,918评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,152评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 42,852评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,378评论 2赞 342

Hbase笔记

推荐阅读更多精彩内容