https://www.jianshu.com/p/be343414dd24-----转载
1.采样数据:
过采样(对少的一方进行加噪声复制)
欠采样(对多的一方进行采样)
2.生成数据:
使用算法(抗生成网络,SMOTE等),对少类别数据进行扩充
3.调整数据分布(Bagging,Boosting类方法):
调整数据权重(如:AdaBoost)对数据多类别减小权重,对少类别数据加大权重;
4.采用不同评判标准(AUC/ROC曲线)
https://www.jianshu.com/p/be343414dd24-----转载
1.采样数据:
过采样(对少的一方进行加噪声复制)
欠采样(对多的一方进行采样)
2.生成数据:
使用算法(抗生成网络,SMOTE等),对少类别数据进行扩充
3.调整数据分布(Bagging,Boosting类方法):
调整数据权重(如:AdaBoost)对数据多类别减小权重,对少类别数据加大权重;
4.采用不同评判标准(AUC/ROC曲线)