HBase环境部署

3.png
](http://upload-images.jianshu.io/upload_images/3068725-574284fb7d9f4eac.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
HBase可以被看做一个主-从架构的数据库

  • ** Master **:为HBase的主节点,用来协调客户端应用程序和RegionServer的关系,监控和记录数据库表的元数据的变化。一般来讲一个集群中有多个Master,而且一般和Hadoop中的NameNode运行同一主机上。
  • ** RegionServer **:为HBase的从节点,用region的形式存储实际的表。region是HBase表的基础单元。一般和Hadoop中的DataNode运行在同一主机上。
  • ** ZooKeeper **:用来选举集群主节点Master,维持只有一个master提供访问和运行,同时存储集群的元数据。

HBase的数据存储模型

2.png

** 行健(rowkey) **:是HBase表中每个记录的主键,可以提高查找 功能的速度。
** 列簇(column family) **:是一个字符串名称,包含一个或者多个列,这样做也是为了提高检索速度(检索所需的列的时间更快)。
** 列 **:列一定属于某一个列簇。
** 版本(version) **:一个单元格可以保存多个值,一个version代表着一个单元格可以同时存储几个值。
** 时间戳(timestamp) **:对于每条插入的数据,当前的时间戳与值是相关的,它表示了数值插入到这个单元格中的时间。
** 单元格 :最小的存储单元,是一行的一个列中的实际值, 值都是用字节数组存储的 **
** namespace **:hbase中数据库的概念,表名对应有一个namespace

综上所述,插入一个单元格数据必须包含
** rowkey+columnfamily(列簇名)+columname(列名)+timestamp:value **
其中rowkey+列簇名+列名 确定一个单元格;
rowkey+列簇名+列名+timestamp 确定一个单元格中的一个值。

安装部署伪分布式HBase

  1. 启动hadoop


    3.png
  2. 启动zookeeper


    4.png
  3. 下载解压hbase


    5.png
  4. 修改配置文件
  • hbase-env.sh文件
    export JAVA_HOME=/opt/modules/jdk1.7.0_67
# Tell HBase whether it should manage it's own instance of Zookeeper or not.
    export HBASE_MANAGES_ZK=false
  • hbase-site.xml文件
  <property >
        <!-- hbase临时存储数据的目录 -->
        <name>hbase.tmp.dir</name>
        <value>/opt/modules/hbase-0.98.6-hadoop2/datas</value>
  </property>
  <property >
        <!-- hbase在hdfs存储表的根目录 -->
        <name>hbase.rootdir</name>
        <value>hdfs://bigdata-00:8020/hbase</value>
  </property>
  <property >
        <name>hbase.cluster.distributed</name>
        <value>true</value>
  </property>
  <property>
        <!-- 配置zookeeper节点的位置 -->
        <name>hbase.zookeeper.quorum</name>
        <value>bigdata-00</value>
 </property>
  1. 启动hbase
$ bin/hbase-daemon.sh start master
$ bin/hbase-daemon.sh start regionserver
6.png

登陆web界面查看(bigdata-00:60010)


7.png

HBase中shell的基本使用

进入hbase命令行bin/hbase shell
list_namespace查看有哪些namespace

8.png

create_namespace 'test'创建一个namespace,后面接namespace名
describe_namespace 'test'描述一个namespace
9.png

drop_namespace 'test'删除一个namespace
list查看有哪些表
create 'ns:表名','列簇名'
describe 'ns:表名'显示表的详细信息
10.png

drop 'ns:tbname'删除一个表
put 'ns:tbname','行键','列簇:列名','值'插入一个数据
get 'ns:tbname','行键','列簇','列'获取一个单元格的数据,如果不加后面的列簇和列,即为获取一行的数据。
scan 'ns:tbname'查看一个表的所有数据
11.png

scan 'nstest:tb1',{STARTROW => '20161119_10001',STOPROW => '20161119_10003'}scan+过滤条件查询数据
delete 'ns:tbname','键值','列簇:列名'删除一个值

HBase表的物理模型

HBase在实际的存储中,每个列簇存储在单独的一个HDFS上。表格中的行都是按照RowKey字典序列进行排序的,并且表格在行的方向上被分割为多个Region。如下图:


12.png

如下图,表A按照行被分为相等大小的4个Region,这些Region分别被RegionServer管理,但是每个RegionServer可以管理不同表格中的Region。为了负载尽量相同,每个RegionServer管理的Region数据基本上是相同的。


13.png

15.png

Region是按照大小进行分割的,每个表最开始只有一个Region,随着数据增多,Region不断增大,当增大到一个阈值的时候,Region就会等分成两个新的Region,之后的过程也同样,随着数据量的增加,不断分割Region。
14.png

Region虽然是分布式存储的最小单元,但不是存储的最小单元

  • 一个Region由一个或多个Store组成,每个Store保存一个列簇
  • 每个Store又由一个memStore和0到多个StoreFile
  • memStore存储在内存中,StoreFile存储在HDFS中
  • memStore是内存中的写入缓冲区,HBase写入数据到硬盘之前是将数据累积在memStore中,当这个内存缓冲区写满后将数据写到StoreFiel上。
  • 每个Region包含一个HLOG,它是预写式日志WAL,但存储数据的时候只有当把数据写入到WAL和每个Store中的memStore才算成功,这样可以保证数据的安全性。


    16.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,064评论 5 466
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,606评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,011评论 0 328
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,550评论 1 269
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,465评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 47,919评论 1 275
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,428评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,075评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,208评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,185评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,191评论 1 328
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,914评论 3 316
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,482评论 3 302
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,585评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,825评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,194评论 2 344
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,703评论 2 339

推荐阅读更多精彩内容

  • 简介 [HBase]——Hadoop Database的简称,Google BigTable的另一种开源实现方式,...
    高广超阅读 2,328评论 1 27
  • 1. HBase介绍,Hbase是什么? HBase -- Hadoop Database ,是一个高可靠、高性能...
    奉先阅读 3,721评论 1 36
  • 比特科技: 存储、数据库、大数据技术 » HBase原理和设计 http://www.bitstech.net/...
    葡萄喃喃呓语阅读 723评论 0 11
  • HBase那些事 @(大数据工程学院)[HBase, Hadoop, 优化, HadoopChen, hbase]...
    分痴阅读 3,921评论 3 17
  • 最近在逐步跟进Hbase的相关工作,由于之前对Hbase并不怎么了解,因此系统地学习了下Hbase,为了加深对Hb...
    飞鸿无痕阅读 50,158评论 19 271