两个属性(或一个属性、一个标签)的相关程度可以由皮尔森相关系数(Pearson’s correlation coefficient)来量化。
多个属性间的相关性很高(相关系数>0.7),即多重共线性(multicollinearity),往往会导致预测结果不稳定。属性与标签的相关性则不同,如果属性和标签相关,则通常意味着两者之间具有可预测的关系。
两个属性(或一个属性、一个标签)的相关程度可以由皮尔森相关系数(Pearson’s correlation coefficient)来量化。
多个属性间的相关性很高(相关系数>0.7),即多重共线性(multicollinearity),往往会导致预测结果不稳定。属性与标签的相关性则不同,如果属性和标签相关,则通常意味着两者之间具有可预测的关系。