240 发简信
IP属地:上海
  • 2022-10-09-数仓职业从业困惑和焦虑

    首先回答一个问题,数仓工程师的职责是什么?个人认为就是要使得数据流通起来,把数据从一个地方传输到另一个地方,在当前的大数据技术发展背景下,大多数的数仓人员都是使用SQL来实现...

  • "数据中台不是设计出来的而是沉淀出来的", 已有一定的体会, 实际工作中, 几乎所有人都被大量的业务需求埋着的, 愿意花时间解决的, 都是企业或部门长期积累到无法忍受的痛点. 想要一个完美的全面的解决方案, 短时间是不可能完成的, 往往要结合每个发展阶段, 结合痛点和各方面资源一步步解决, 累加, 迭代而成的

    分布式数据仓库

    这章看得我有点懵,对我来说没什么用,这章有点数据中台的味道,记得我上司说过数据中台不是设计出来的而是沉淀出来的 大部分环境中采用一个集中式数据仓库,但是在某些特定场合,可以建...

  • java 好久没写了,俺也不会写了。。。😥

    2021-07-14-Hive-27(Hive编程指南-基础知识)

    用户如何从一个现有的数据基础架构转移到Hadoop上,而这个基础架构是基于传统关系型数据库和结构化查询语句(SQL)的。对于大量的SQL用户(包括专业数据库设计师和管理员,也...

  • 120
    2021-07-14-Hive-27(Hive编程指南-基础知识)

    用户如何从一个现有的数据基础架构转移到Hadoop上,而这个基础架构是基于传统关系型数据库和结构化查询语句(SQL)的。对于大量的SQL用户(包括专业数据库设计师和管理员,也...

  • 2021-06(完成事项)

    本月计划 计划在端午节之前确定技术分享内容并在端午节期间完成相关的ppt内容制作 把5月份未完成的存在主义心理治疗书籍给读完 关于数据命名规范和数据治理的学习(有个概念就行 ...

  • 离散数学(二元关系)

    1. 序偶和笛卡尔积 有序组的定义 由两个元素按照一定的次序组成的二元组称为序偶,记作< x, y >,其中 x 是第一元素,y 是第二元素。 笛卡儿积 设 A, B 是两个...

  • SQL-分组月度环比同比

    有一个需求是按月份统计环比和同比值,每次都取一遍非常麻烦,同时也容易出错,这里我把要取的数据报表化,这里提供一个模板,这个SQL写了我好久,经过对比数据发现,这样写是没什么问...

  • 写作的正反馈

    今天读到的一段文字 不管你干什么,我都建议经常写作,不一定文辞优美,只需包含对自己领域的一些体会。 不要低估写作的力量,它能让你从琐事中抽身,透彻思考心中的问题。 写给别人看...

  • 存在主义心理治疗(七)

    读点书 《存在主义心理治疗》意志 1. 责任,意志与行动 日本谚语有云:“知而不行,就是完全不知。”责任的觉察,本身并不等于改变;它只是改变过程的第一步。我在上一章说过,病...

  • 2021-06-15-Hive-25(spark中的join)

    spark中的join策略 大概可以分为三种,shuffle join 和broadcast join 非常常见,这是介绍一下桶join(hash join) 1.shuf...

  • 关于客流量问题的讨论(多使用方的一致性)

    对于一般的业务客流量就是简单sum(person) 但是在酒店,住宿的问题上就陷入了困难,一般的酒店订单会包含预定房间数,人数 问题1:如果使用sum(person),直接统...

  • 不会休息了,唉,又佩服又羡慕又无奈

    制定一个计划(5.1学习计划)-2021-05-01

    5.1把ihub上要完成的考试给完成了适当休息了,一下,其实也没怎么休息....发现不会休息了.....怎么才是高效的休息计划5.2-5.4的学习计划,坚决不能出去玩 计划如...

  • 120
    维度建模示例

    以库存模块和零售模块这两个模块来谈一谈维度建模的相关事项梳理库存业务中的表的构造与设计思想梳理一下缓慢变化维的处理方法与优缺这篇博客计划用周末来完成,只能简单的讨论一下建模概...

  • 用户行为分析 SQL 整理

    笔者从事大数据行业快三年时间,在用户行为分析方向也有所沉淀。现在整理一些常用的 SQL ,希望本文对用户行为分析的初学者的 SQL 学习有所帮助。 行业内用的数据系统各式各样...