在上图中经常出现splits这个单词,它是什么意思呢?我们从表中数据开始分析。HBase的表的数据是存在Region里面的,Region有[startkey,endkey),并且是包头不包尾的,每个Region都有一个范围。
预分区方式
- 方式一:
利用建表语句create ‘表名’, ’列族’,splits => [‘Rowkey1’,‘Rowkey2’……]
create 'bflogs' ,'info',SPLITS =>['10','20','30']
-
方式二:
指定一个文件,我们可以把我们要分区的Rowkey放在一个文件当中,然后通过建表命令的SPLITES_FILE=>’文件名’来指定
创建bflogs-split.txt的文件作为rowkey的文件
编辑bflogs-split.txt文件,写上Rowkey,写的时候是不用加引号的:
create 'student3', 'info', SPLITS_FILE => '/opt/datas/bflogssplits.txt'