首先回答一个问题,数仓工程师的职责是什么?个人认为就是要使得数据流通起来,把数据从一个地方传输到另一个地方,在当前的大数据技术发展背景下,大多数的数仓人员都是使用SQL来实现...
首先回答一个问题,数仓工程师的职责是什么?个人认为就是要使得数据流通起来,把数据从一个地方传输到另一个地方,在当前的大数据技术发展背景下,大多数的数仓人员都是使用SQL来实现...
用户如何从一个现有的数据基础架构转移到Hadoop上,而这个基础架构是基于传统关系型数据库和结构化查询语句(SQL)的。对于大量的SQL用户(包括专业数据库设计师和管理员,也...
本月计划 计划在端午节之前确定技术分享内容并在端午节期间完成相关的ppt内容制作 把5月份未完成的存在主义心理治疗书籍给读完 关于数据命名规范和数据治理的学习(有个概念就行 ...
1. 序偶和笛卡尔积 有序组的定义 由两个元素按照一定的次序组成的二元组称为序偶,记作< x, y >,其中 x 是第一元素,y 是第二元素。 笛卡儿积 设 A, B 是两个...
有一个需求是按月份统计环比和同比值,每次都取一遍非常麻烦,同时也容易出错,这里我把要取的数据报表化,这里提供一个模板,这个SQL写了我好久,经过对比数据发现,这样写是没什么问...
今天读到的一段文字 不管你干什么,我都建议经常写作,不一定文辞优美,只需包含对自己领域的一些体会。 不要低估写作的力量,它能让你从琐事中抽身,透彻思考心中的问题。 写给别人看...
读点书 《存在主义心理治疗》意志 1. 责任,意志与行动 日本谚语有云:“知而不行,就是完全不知。”责任的觉察,本身并不等于改变;它只是改变过程的第一步。我在上一章说过,病...
spark中的join策略 大概可以分为三种,shuffle join 和broadcast join 非常常见,这是介绍一下桶join(hash join) 1.shuf...
对于一般的业务客流量就是简单sum(person) 但是在酒店,住宿的问题上就陷入了困难,一般的酒店订单会包含预定房间数,人数 问题1:如果使用sum(person),直接统...