随机森林算法是我们经常使用到的一种集成式的机器学习算法,由多棵决策树组合而成。那么怎么使用随机森林判定特征的重要性呢?代码如下:
from sklearn.ensemble import RandomForestClassifier
feat_labels = X.columns[0:]
forest = RandomForestClassifier(n_estimators=10000,
random_state=0,
n_jobs=-1)
forest.fit(X_train,y_train)
importances = forest.feature_importances_
indices = np.argsort(importances)[::-1]
for f in range(X_train.shape[1]):
print(feat_labels[f],importances[indices[f]])
我是一只不会南飞的燕!