1. 前言
特征 = 数据中抽取出来对结果预测有用的信息
2. 数据与特征处理
2.1 数据采集
2.2 数据格式化
2.3 数据清洗
2.4 数据清洗实例
2.5 数据采样
2.6 正负样本不均衡
2.7 特征处理
2.7.1 数值型
2.7.2 类别型
one-hot 解决了均等性
bucket代表不同的主题
性别和爱好的交叉关系
2.7.3 时间型
2.7.4 文本型
n-gram 把几个词组合在一起
word2vec
特征 = 数据中抽取出来对结果预测有用的信息
one-hot 解决了均等性
bucket代表不同的主题
性别和爱好的交叉关系
n-gram 把几个词组合在一起
word2vec