原因:
数据:数据不规范,数据量少,数据穿越,统计特征用到了未来的信息或者标签信息
算法:算法过于复杂
解决办法:
将数据规范化,处理缺失值,增加数据量,采样,添加噪声数据
正则化,控制模型复杂程度,early stoping,减少迭代次数,减少树的深度,学习率调大点
融合几个模型
原因:
数据:数据不规范,数据量少,数据穿越,统计特征用到了未来的信息或者标签信息
算法:算法过于复杂
解决办法:
将数据规范化,处理缺失值,增加数据量,采样,添加噪声数据
正则化,控制模型复杂程度,early stoping,减少迭代次数,减少树的深度,学习率调大点
融合几个模型