数据(data)是信息的载体。它能够被计算机识别、存储和加工处理,是计算机程序加工的"原料"。数据包括:整数、实数、字符串、图像和声音等。
属性(attribute)是一个数据字段,表示数据对象的一个特征。属性可以是标称的(枚举)、二元的(布尔属性)、序数的或数值的。
标称属性,可以取整数值,但是也不能把它视为数值属性,因为并不打算定量地使用这些整数。
序数属性,可以通过把数值量的值域划分成有限个有序类别,把数值属性离散化而得到。
数值属性,是定量的,即它是可度量的量,用整数或实数值表示。数值属性可以是区间标度的(例:温度的属性)或比率标度的(例:度量重量、高度、速度和货币量的属性)。
参考:数据挖掘:概念与技术