240 发简信
IP属地:西藏
  • 问题list

    一、机器学习相关 1、 基本概念 2、 经典机器学习 特征工程 基础算法原理和推倒 Knn 支持向量机 朴素贝叶斯模型 线性回归 逻辑回归 FM模型 决策树 随机森林(RF)...

  • 数仓笔记

    分层ods:合规,高效,成本敏感数据处理平台工具提效增量,全量,存储生命周期 dwd:建模方式方法,可扩展性,稳定性,复用性方法:维度建模方式:自底向上(面向业务过程,设计阶...

  • 120
    什么是指标体系

    什么是指标: 指标:通过特定的统计逻辑计算出来能量化事物发展程度的度量,如pv,uv; 维度:可以简单理解为我们分析观察指标的角度,如时间、年龄、渠道、终端; 北极星指标 指...

  • 120
    sql优化核心思想读书笔记

    oracle存储:block extent segment (clob字段影响:单独存放一个段)10046事件监控等待事件 10046 trace文件等待事件为db...

  • 数仓规范

    转自: https://mp.weixin.qq.com/s/mGkYRj8iV5_QvNMjS7bpIQ[https://mp.weixin.qq.com/s/mGkYRj...

  • 120
    基本概念

    https://mp.weixin.qq.com/s/iwC0iKXBFFBVwxCQPhBAxg[https://mp.weixin.qq.com/s/iwC0iKXBFF...

  • 120
    2022-04-07

    0x00 概述 随着大数据时代的带来,数据的应用也日趋繁茂,越来越多的应用和服务都基于数据而建立,数据的重要性不言而喻。而且,数据质量是数据分析和数据挖掘结论有效性和准确性的...

  • 120
    维度建模(Kimball架构)

    一、概念解读 业务板块 业务板块是逻辑空间的定义,是基于业务特征划分的命名空间 数据域 指面向业务分析,将业务过程或者维度进行抽象的集合。其中,业务过程可以概括为一个个不可拆...

  • 120
    ER建模

    https://zh.wikipedia.org/zh-hans/ER%E6%A8%A1%E5%9E%8B[https://zh.wikipedia.org/zh-hans/...

  • 120
    模型规范

    待增加data vault ,anchor 建模方法了解 模型规范位于数据治理的地位 重要性 思考 规范和标准要结合业务的特点和现状,没有最好,只有最合适治理不是单点解决...

  • 120
    数据成本

    待补充计算成本相关内容 存储成本1、结合数据资产等级和数据仓分层,对数据生命周期进行管理(数据清理)2、利用谁生产谁负责和榜单机制进行自驱式管理 成本管理架构 成本管理难点 ...

  • 120
    数据质量

    保障目标 准确、及时、完整、一致准确性:正确的描述对象;合规性:以标准、合规格式存储数据;一致性:同一指标数据值保持一致,不冲突;重复性:同一数据记录保持唯一、不重复;及时性...

  • 120
  • 120
    经营分析

    分析框架1、制定KPI指标及目标值2、按月分解目标(注意周期趋势),然后拆分到部分或个人3、跟进目标完成(当期和累计)情况,根据结构分析法和趋势分析法看是哪块没完成,是一直没...

  • 120
    行业分析

    行业分析分类投资类:买股票用咨询类:企业制定战略用学术类:学术教学用 分析框架:(当前)行业基本面(定性):参与者与行业玩法,宏观经济,政策环境等PEST分析,行业面临的问题...

  • 120
    数据湖

    一、什么是数据湖 AWS定义:数据湖是一个集中式存储库,允许您以任意规模存储所有结构化和非结构化数据。您可以按原样存储数据(无需先对数据进行结构化处理),并运行不同类型的分析...