数据挖掘必须建立在原有的训练集上得出算法模型,
然后再通过测试数据,对算法模型进行评估、检测。
但是对于车站分类这回事情,好像没有原始的训练集给你,也就是说,没有已经分好的a/b/c/d/e等等。那我们应该如何去分类呢?
—————————————我是可爱的分割线——————————————
前面所述的需要训练集得出算法模型的方法,属于数据挖掘的分类一支。
而数据挖掘包罗万象。
其中聚类也属于数据挖掘。
而聚类,它就不需要这种原先的数据集了。
在聚类中,我们可以尽可能地找出数据之间的相似性进行聚类划分。这也是可以的。