Hive编程指南读书笔记0001

Hive概述

  • 1.Hive提供了一个被称为Hive查询语言(简称HiveQL或HQL)的SQL方言,来查询存储在Hadoop集群中的数据。其实,hive的功能远不止查询,还有对Hadoop集群上数据的各种操作的能力。
  • 2.Hive可以将大多数的查询转换为MapReduce任务(job),进而在街上一个令人熟悉的SQL抽象的同时,拓展Hadoop的可扩展性。
  • 3.Hive最适合于数据仓库应用程序,使用该应用程序进行相关的静态数据分析,不需要快速响应给出结果,而且数据本身不会频繁变化。
  • 4.Hive的缺陷:
    • 1.Hive最大的限制是不支持**纪录级别的更新,插入或删除操作;
    • 2.Hive查询延时比较严重,传统数据库在秒级别可以完成的查询,在Hive中需要更长时间
    • 3.Hive不支持事务

数据类型和文件格式

Hive支持关系型数据库中的大多数基本数据,同时也支持3种集合数据类型,如下。

Hive基本数据类型

以上是基本数据类型,需要注意的是所有的这些数据类型都是对Java接口的实现,因此,这些数据类型的具体行为细节和Java中对应的数据类型完全一致。如:STRING是Java中的String,FLOAT是Java中的float。另外,和其他SQL一样,以上名称类型都是保留字。

Hive支持structs,maps,arrays这三种集合类型。


Hive集合类型

以上名称类型都是保留字。
以上集合类型是Hive区别于其他大部分关系型数据库的特色。

  • 采用以上数据模型创建一个员工信息表:

<code>
CREATE TABLE employees(
name STRING,
salary FLOAT,
subordinates ARRAY<STRING>,
deductions MAP<STRING,FLOAT>,
address STRUCT<street:STRING,city:STRING,state:STRING,zip:INT>
);
</code>

分隔符:

  • 分隔符的作用:将表格转换为文本时,用分隔符标识文字分隔的位置,或在将文本转换为表格时,用其标识新行或新列的起始位置。一般用户比较熟悉以逗号或者制表符为分隔符的文件文本,逗号符分隔值即CSV,制表符分隔值即TSV
  • 默认分隔符:
    Hive默认分隔符
    Hive默认分隔符
  • 指定分隔符:用户可以根据需要指定分隔符,当然需要注意的是在指定分隔符的时候,ROW FORMAT DELIMITED这组关键字必须要写在其他子句之前。
  • 警告:分隔符只会影响到Hive在读取到文件后如何进行划分。

展开阅读


HiveQL:数据定义

HiveQL是Hive的查询语言,它不完全遵循任何一种ANSI SQL标准的修订版,在各大SQL方言中,它可能是MySQL方言最为接近。二者最大不同是:HiveQL不支持行级别的数据的插入,更新和删除操作,也不支持事务,查询延时较高。

所谓HiveQL的数据定义语言是指:用于创建,修改和删除数据库,表,视图,函数和索引,简而言之是对表结构的操作。

所谓HiveQL的数据操作语言是指:用于将数据导入到Hive的表中,以及将数据抽取到文件系统中。还包括对数据的查询,分组,过滤,连接等操作。

  • 区别:数据定义指定义数据表的结果,数据操作是指对数据实行增删改查操作。

拓展阅读:数据定义语言和数据操作语言的区别

Hive下的数据库

  • Hive中数据库的概念本质上是表的一个目录或者命名空间。对于具有很多组和用户的大集群来说,这是非常有用的,因为这样可以避免表命名冲突
  • 如果用户没有显示的指定数据库,那么将会使用默认数据库default。使用命令:SHOW DATABASES可以查看Hive中所包含的数据库。
  • Hive会为每个数据库创建一个目录,数据库中的表以子目录的形式存储。但是default数据库除外,这个数据库没有自己的目录。数据库的目录会在hive.metastore.warehouse.dir所配置的目录下创建,比如在默认配置下创建数据库financials时,该数据库目录为:/user/hive/warehouse/financials.db;当然用户可以通过LOCATION命令修改db位置。

注意:Hive定位为数据仓库而不是数据库,Hive和Hbase根据不同的业务需求各司其职。Hive主要用于数据的查询和分析,而并非数据的增删改查CRUD操作。Hbase是面向列的noSQL数据库,用于存储数据。

网友的点评:hbase就是一个存储key-value的大map,hive是一个做统计处理的工具,类似于awk类的。
所以如果你是一条一条读写记录用hbase,如果需要对大量数据做分析统计用hive。

拓展阅读:

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,980评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,178评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,868评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,498评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,492评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,521评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,910评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,569评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,793评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,559评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,639评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,342评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,931评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,904评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,144评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,833评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,350评论 2 342

推荐阅读更多精彩内容