大数据

(1)查看yarn日志:

yarn logs -applicationId application_1530010276125_55093

(2)设置动态分区大小:

SET hive.exec.max.dynamic.partitions=100000;

SET hive.exec.max.dynamic.partitions.pernode=100000;

set hive.exec.dynamic.partition=true;

set hive.exec.dynamic.partition.mode =nostrict;

(3)从hive导出文件到本地:

insert overwrite local directory '/tmp/test' row format delimited fields terminated by '|'

select * from default.pa_segment_active_cutoffs_ss_w;

(4)从本地导入hive

load data local inpath '/tmp/a.txt' into table cx.ai_info;

(5)查看表所占空间:

hadoop fs -du /user/hive/warehouse/pa_ubi_session_w|awk '{ SUM += $1 } END { print SUM/(1024*1024*1024)}'

(6)查杀hive job:

hadoop job -list

hadoop job -kill  jobid

(7)导入hive中文乱码解决:

ALTER TABLE default.pa_dim_city_mapping SET SERDEPROPERTIES ('serialization.encoding'='GBK');

(8)hive小知识:

';'用 '\073表示'

(9)hive 建内部表:

create table cx.ai_info(id int)  partitioned by (month int) stored as orc;

(10)mysql 导入数据:

load  data local infile 'var/lib/mysql-files/td/a.txt' into table ai.a_info fields terminated by '|' lines terminated by '\n' ignore 1 rows;

指定字段

load data local infile '/tmp/test/000000_0'

into table segment_6_cycles_remaining

fields terminated by ',' 

(period_start,period_end,type,keyname,remain0,remain1,remain2,remain3,remain4,remain5,remain6,companyid,projectid);

(11)服务器之间拷贝文件:

scp a.txt hadoop@10.20.24.103:/tmp/

(12) zip压缩解压

tar -czf all.tar.gz *.jpg

tar -xzf all.tar.gz

zip filename.zip filename

unzip filename.zip

参考:https://www.jb51.net/LINUXjishu/43356.html

(13)动态非严格分区:

set hive.exec.dynamic.partition=true;

set hive.exec.dynamic.partition.mode =nostrict;

(14)三范式:

1.第一范式(确保每列保持原子性)

2.第二范式(确保表中的每列都和主键相关)

3.第三范式(确保每列都和主键列直接相关,而不是间接相关)

(15)shell求双周

BATCH_DATE=${1} #输入日期

INIT_DAY='20181105'  #定义一个初始化的周一的日期

startDate=`date -d ${INIT_DAY} +%s`  #初始化日期所对毫秒数

endDate=`date -d ${BATCH_DATE} +%s`  #输入日期所对毫秒数

stampDiff=`expr $endDate - $startDate`  #两者之间相差的毫秒数

weekDiff=`expr $stampDiff / 1209600` #两者之间相差的周数

n_end=$(($weekDiff*14))  #两者之间相差的天数

STR_WEEK_LAST_DAY=$(date -d "$INIT_DAY +${n_end} days" +%Y%m%d) #初始化日期加上相差天数就是所对的周一

echo "双周初:"

echo $STR_WEEK_LAST_DAY

echo "双周周末:"

STR_WEEK_END_DAY=`date -d "20181126 + 13 days " +%Y%m%d`

echo $STR_WEEK_END_DAY

(16)wget数据

[hdfs@cdh-node1 20181221]$ python -m SimpleHTTPServer

[hdfs@cdhmaster load]$ wget http://10.1.1.30:8000/pa_page_group_daily_sm.txt

(17)hive 表锁

查看锁:show locks 表名

锁分为表锁,分区锁

unlock table 表名;  -- 解锁表

unlock table 表名 partition(dt='2014-04-01');  -- 解锁某个分区

(18)sqoop

sqoop export --connect jdbc:mysql://marketclouddb1.mysqldb.chinacloudapi.cn:3306/marketing_cloud --username marketclouddb1%datatist --password Datatist1506 --table t_table1 --columns name1,id1 --hcatalog-database default --hcatalog-table t_table1

sqoop export --connect  --username --password   --table ${table} --columns ${columns} --hcatalog-database ${hive} --hcatalog-table ${table} --update-key registration_id,user_id,project_id --update-mode allowinsert

(19)UDF函数

add file/xxx/person.py

selecttransform(name,idcard)USING'python person.py'AS(name,idcard,gender) from person;

(20)

du -h 查看文件/目录大小

(21)

将hdfs拷贝到本地服务器

hdfs dfs -copyToLocal inputPath outputPath

将本地文件拷贝到hdfs

hdfs dfs -copyFromLocal inputPath outputPath

(22)

查看hdfs文件大小

hadoop fs -du -s -h /user/hive/warehouse/ods.db

(23)建表

create table default.dw_dim_date_config(

date_day int

,date_hor string

)

ROW FORMAT DELIMITED FIELDS TERMINATED BY ','

LINES TERMINATED BY '\n'

STORED AS TEXTFILE

;

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,711评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,932评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,770评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,799评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,697评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,069评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,535评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,200评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,353评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,290评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,331评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,020评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,610评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,694评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,927评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,330评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,904评论 2 341

推荐阅读更多精彩内容