20190805
第一章
一、DW/BI系统,即数据仓库和商业智能(Data Warehousing and Business Intelligence)系统,主要用于数据的使用,也就是分析。
二、信息用作的两个目的:操作型记录的保存和分析型决策的制定。
三、该系统要实现的目标:
1.让业务用户能够简单、快捷的以各种形式分割和合并分析数据。
2.必须展现一致的信息,也就是要有统一的标准,数据质量要保证,数据定义要统一。
3.最好做到兼容性比较强大,在用户需求、业务环境、数据及技术产生变化时,能够兼容或者在必须做出改变时也能保证之前的数据和应用不被修改。
4.必须要能够及时展现信息,保证数据安全
5.要能成为提高决策制定能力的权威和可信的基础,也就是要准确权威,有价值。该系统早期被称为决策支持系统。
6.让业务群体能够接受并积极使用该系统。
四、需要用到的技能包括数据库管理的技能和商业分析师的技能
五、创建该系统三大步骤:理解业务用户;对业务用户发布高质量、相关的、可访问的信息和分析;维护DW/BI环境
六、维度建模简介
1.维度建模是战线分析数据的首选技术:
原因如下:* 以商业用户可理解的方式发布数据
*提供高效的查询性能
2.从简单的数据模型开始是保持设计简单性的基础。如果从复杂的数据模型起步,那么最终会导致模型过度复杂,从而导致查询性能低下,最终是商业用户反感。
3.第三范式(3NF):即第三范式是要求一个数据库表中不包含已在其他表中包含的非主关键字信息。数据库中强调的3NF主要是为了消除冗余。
规范化的3NF将数据划分为多个不同的实体,每个实体构成一个关系表。尽管维度模型通常应用在关系数据库管理系统之上,但是并不要求维度模型必须满足第三范式3NF。
4.维度模型与规范化模型(如3NF模型)的区别:
维度模型包含的信息和规范化模型包含的信息相同,但对数据以一种用户可理解的、满足查询性能要求的、灵活多变的方式进行了包装。
5.星型模式与OLAP多维数据库
(1).星型模式:在关系数据库管理系统中实现的维度模型称为星型模式
(2).OLAP多维数据库:在多维数据库环境中实现的维度模型通常称为联机分析处理(OnLine Analytical Processing,OLAP)多维数据库。
OLTP:业务类系统主要供基层人员使用,进行一线业务操作,通常被称为OLTP(OnLine Transaction Processing)联机事务处理。
(3).OLAP:数据分析的目标是探索并挖掘数据价值,作为企业高管进行决策的参考。
基本分析操作有:钻取、切片、切块、旋转等。
OLAP软件通常使用于:销售与市场业务报表,管理报表,趋势分析等类似的领域中。
6.用于度量的事实表
(1).维度模型中的事实表存储组织机构业务过程事件的性能度量结果。
应该尽量将来源于同一个业务过程的底层度量结果存储于一个维度模型中;应该允许多个组织的业务用户访问同一个单一的集中式数据仓库,确保整个企业使用一致的数据。
(2).事实表中的每行对应一个度量事件。每行中的数据是一个特定级别的细节数据,称为粒度。
(3).维度建模的核心原则之一是同一事实表中的所有度量行必须具有相同的粒度;
基本原则是:物理世界的每一个度量事件与对应的事实表行具有一对一的关系。
7.用于描述环境的维度表:
数据仓库的好坏直接取决于维度属性的设置;DW/BI环境的分析能力直接取决于维度属性的质量和深度。
为维度属性提供详细的业务术语耗费的精力越多,效果就越好;为属性列填充领域值耗费的精力越多,效果就越好;为确保属性值的质量耗费时间越多,效果就越好。强大的维度属性带来的回报是健壮的分片-分块分析能力。
8.维度建模:
(1).维度模型中不仅包含汇总数据,汇总数据只是在针对公共查询时能够比粒度数据提供更好的性能,但它不能取代细节数据。维度模型中可用的历史数据的数量必须有业务需求驱动。
(2).维度模型应该围绕业务过程组织,例如订单、发货、服务调用等,避免多次获取同一个数据源的数据,免的产生多个不一致的分析数据库。
(3).维度模型非常易于扩展。不仅仅用于预测。维度模型可以被集成。