一、机器学习相关 1、 基本概念 2、 经典机器学习 特征工程 基础算法原理和推倒 Knn 支持向量机 朴素贝叶斯模型 线性回归 逻辑回归 FM模型 决策树 随机森林(RF)...
一、机器学习相关 1、 基本概念 2、 经典机器学习 特征工程 基础算法原理和推倒 Knn 支持向量机 朴素贝叶斯模型 线性回归 逻辑回归 FM模型 决策树 随机森林(RF)...
分层ods:合规,高效,成本敏感数据处理平台工具提效增量,全量,存储生命周期 dwd:建模方式方法,可扩展性,稳定性,复用性方法:维度建模方式:自底向上(面向业务过程,设计阶...
什么是指标: 指标:通过特定的统计逻辑计算出来能量化事物发展程度的度量,如pv,uv; 维度:可以简单理解为我们分析观察指标的角度,如时间、年龄、渠道、终端; 北极星指标 指...
oracle存储:block extent segment (clob字段影响:单独存放一个段)10046事件监控等待事件 10046 trace文件等待事件为db...
转自: https://mp.weixin.qq.com/s/mGkYRj8iV5_QvNMjS7bpIQ[https://mp.weixin.qq.com/s/mGkYRj...
https://mp.weixin.qq.com/s/iwC0iKXBFFBVwxCQPhBAxg[https://mp.weixin.qq.com/s/iwC0iKXBFF...
0x00 概述 随着大数据时代的带来,数据的应用也日趋繁茂,越来越多的应用和服务都基于数据而建立,数据的重要性不言而喻。而且,数据质量是数据分析和数据挖掘结论有效性和准确性的...
一、概念解读 业务板块 业务板块是逻辑空间的定义,是基于业务特征划分的命名空间 数据域 指面向业务分析,将业务过程或者维度进行抽象的集合。其中,业务过程可以概括为一个个不可拆...
https://zh.wikipedia.org/zh-hans/ER%E6%A8%A1%E5%9E%8B[https://zh.wikipedia.org/zh-hans/...
待增加data vault ,anchor 建模方法了解 模型规范位于数据治理的地位 重要性 思考 规范和标准要结合业务的特点和现状,没有最好,只有最合适治理不是单点解决...
待补充计算成本相关内容 存储成本1、结合数据资产等级和数据仓分层,对数据生命周期进行管理(数据清理)2、利用谁生产谁负责和榜单机制进行自驱式管理 成本管理架构 成本管理难点 ...
保障目标 准确、及时、完整、一致准确性:正确的描述对象;合规性:以标准、合规格式存储数据;一致性:同一指标数据值保持一致,不冲突;重复性:同一数据记录保持唯一、不重复;及时性...
分析框架1、制定KPI指标及目标值2、按月分解目标(注意周期趋势),然后拆分到部分或个人3、跟进目标完成(当期和累计)情况,根据结构分析法和趋势分析法看是哪块没完成,是一直没...
行业分析分类投资类:买股票用咨询类:企业制定战略用学术类:学术教学用 分析框架:(当前)行业基本面(定性):参与者与行业玩法,宏观经济,政策环境等PEST分析,行业面临的问题...
一、什么是数据湖 AWS定义:数据湖是一个集中式存储库,允许您以任意规模存储所有结构化和非结构化数据。您可以按原样存储数据(无需先对数据进行结构化处理),并运行不同类型的分析...