Hive的安装配置教程(Mysql为元数据库)

Hive

1、什么是hive

Hive是构建在hadoop HDFS上的一个数据仓库,本质是一个数据库,但又有所区别,数据仓库是一个面向主题的、集成的、不可更改的、随时间不变化的数据集合。它用于支持企业或组织的决策分析处理。

2、Hive是SQL解析引擎,它将SQL语句转移成M/R Job,然后在hadoop中执行,hive的表其实是HDFS中的一个目录,hive中的数据其实是HDFS中的文件。

3、hive的体系结构

Hive的元数据:hive将元数据存储在数据库中(metastore),支持mysql、oracle、derby等数据库,默认采用的是derby。

Hive的下载

1、下载hive

下载安装之前,首先是安装并运行了hadoop,因为hive是安装在HDFS上的应用,打开hive官网

hive官网首页

选择要下载的hive版本,这里我下载的是hive-2.3.4

版本信息

通常下载bin安装包,文件中包含了下载介质和执行程序,也可以下载源代码src文件,它可以通过web图形化的工具管理数据库,bin文件不包含。

2、hive的三种安装模式

(1)嵌入模式:元数据信息被存储在hive自带的derby数据可中,只允许创建一个连接,同一时间只能有一个人操作hive数据仓库,多用于demo。

(2)本地模式:元数据信息被存储在mysql数据库中,mysql数据库与hive运行在同一台物理机器上,多用于开发和测试,优于嵌入模式。

(3)远程模式:与本地模式运行方式相似,但是mysql和hive运行在不同的操作系统上,允许创建多个连接,是hive最常应用的模式。

hive的安装配置

在这里我们使用的是本地模式安装hive,我使用的是阿里云的服务器。首先我们将下载好的安装包上传到服务器中,这里我使用的是Xftp上传的,创建hive的文件夹,然后上传进去。

1、安装之前确定hadoop已经启动,关于hadoop的安装部署,可以上网查找教程,后期如果有时间我会把hadoop、spark的安装部署详细写出来供大家参考。

2、解压tar包

解压
删除tar包,并将名字改为hive2.3.4

3、将hive添加到系统环境变量

别忘记使系统变量生效

4、命令行中测试hive是否安装成功

5、在哪个目录下启动hive,就会在当前目录下创建metastore_db保存源信息

MySQL安装部署

接下来我们在服务器中安装部署mysql数据库,只需要几条命令即可

1、apt-get install mysql-server

2、apt-get install mysql-client

3、apt-get install libmysqlclient-dev

安装过程中会提示设置密码,注意设置了不要忘记,安装完成之后可以使用如下命令来检查是否安装成功:

netstat -tap | grep mysql

通过上述命令检查后,如果看到有mysql的socket处于listen状态表示安装成功。

登陆mysql数据库可以通过如下,命令:

mysql -u用户名 -p密码

然后我们创建一个hive的数据库,因为后面我们会用到

create database  hive;

接下来我们设置一下mysql的远程连接:

其中一个方法可以是:

登入数据库,敲入以下命令:

grant all privileges on *.* to 'root'@'%' identified by '123456' with grant option;

flush privileges;(不可缺少)

登陆MySQL中查看:

或者也可以:

也可以在mysql数据库中更新表中host的内容:

update user set host='%' where user='root' and host='localhost';

flush privileges;

最后退出数据库,重启一下。

接下来我们在Windows系统下,使用Navicat(用于连接数据库的工具,非常好用)远程连接测试一下

如果连接不上有可能是阿里云服务器没有将3306的端口开放,这时候只要把3306端口添加到安全组中就可以了。


hive内部文件配置

1、安装完mysql后,我们返回到hive的安装目录下,进入conf文件夹,复制hive-env.sh.template为hive-env.sh并进行配置。

cp hive-env.sh.template hive-env.sh

vim hive-env.sh

分别设置HADOOP_HOME和HIVE_CONF_DIR两个值:

2、将连接数据库的jar包放到hive目录下lib文件夹中,这个jar可以在官网中下载,百度或者谷歌搜索:mysql-connection-java,选择下载的版本,我下载的是mysql-connector-java-5.1.47.zip版本


3、在hive/conf目录下创建hive-site.xml配置文件,在该配置文件中加入以下配置内容:

启动验证

所有的这些都配置完成之后,在命令行里开启hive

然后在Navicat中查看mysql中的hive数据库的table中是否多了几张表,大概有57张表,这是hive的一些内部表,此时说明配置成功。

这是我写的第一篇博客文章,有什么不对的地方欢迎大家指出来,如果还有什么不懂的地方可以在评论区留言,我看到后会立刻回复,大家一起学习,一起进步!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,132评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,802评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,566评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,858评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,867评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,695评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,064评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,705评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,915评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,677评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,796评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,432评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,041评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,992评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,223评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,185评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,535评论 2 343

推荐阅读更多精彩内容

  • 一、初识Hive 1、Hive简介     (1) 什么是Hive? Hive是基于Hadoop的一个数据仓库可以...
    这个太难了阅读 2,436评论 0 1
  • HIVE是一个基于Hadoop的数据仓库,适用于一些高延迟性的应用。如果对延迟性要求比较高,则可以选择Hbase。...
    夏无忧阳阅读 5,017评论 0 12
  • Linux第11课:Hive数据库安装 时间 2019-03-15 下午3:30 主讲张春志 地点 四楼电教室 在...
    启蒙时代阅读 761评论 0 1
  • 接下来的日子,无疑是燥热难耐的太阳明晃晃的刺的我睁不开眼,还好教室里有两台空调前后各一台,喘着粗气,尽最大的能力将...
    九夜和语阅读 100评论 0 0
  • 今天的主角是麦琪,永远在吸奶嘴的奇迹婴儿虽然不能说话,但是非常的聪明机智。
    小鱼儿61阅读 90评论 0 1