http://www.linkedin.com/pulse/approaching-almost-any-machine-learning-problem-abhishek-thakur
里面提到了原始数据可以分为三类:文本,数值,类别。
文本信息可以用TF,IDF进行处理,这个还是比较有新意
http://www.linkedin.com/pulse/approaching-almost-any-machine-learning-problem-abhishek-thakur
里面提到了原始数据可以分为三类:文本,数值,类别。
文本信息可以用TF,IDF进行处理,这个还是比较有新意