数据挖掘比较专业化的解释如下
Data mining (knowledge discovery from data)
KDD 是一个以知识使用者为中心,人机交互的探索过程,包括了在指定的数据库中用数据挖掘算法提取模型,以及围绕数据挖掘所进行的预处理和结果表达等一系列的步骤
模型
比较官方的说法是通过数据挖掘过程所得到的知识通常被称为模型(model)或模式(pattern)。模型或者模式是数据挖掘的结果。
我对模型或者模式的理解是这样的,当你面对一个实际的数据分析需求时,首先你要做的就是如何获取和整理你的数据集,使之有用的呈现出来,并且合理的服务于之后的分析。如何进行数据集的获取,存储,呈现就是建立模型的过程,类比于Web应用程序开发中的数据建模,同数据表创建,定义实体及关联。
ETL
引用知乎中对ETL的解释
ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。 ETL是BI项目重要的一个环节。 通常情况下,在BI项目中ETL会花掉整个项目的1/3的时间,ETL设计的好坏直接关接到BI项目的成败。
作者:李晓文
链接:https://www.zhihu.com/question/26528031/answer/57860607
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
数据挖掘是一项过程,是将数据进行分析后的一个商业行为。在这个“过程”的描述中,除了指数据挖掘是一种行为外,还指数据挖掘需要一种操作的模式。事实上在大量的数据挖掘实践中,数据挖掘工作不是一蹴而就的,往往需要通过大量反复的数据工作并且需要更多业务相关元素的参与才能完成