需求 波士顿房价数据集在scikit-learn1.2版本以后被移除了。目前自己用的刚好是1.2版本,但是需要复现书中的一些代码(Python机器学习基础教程),所以需要从其...
需求 波士顿房价数据集在scikit-learn1.2版本以后被移除了。目前自己用的刚好是1.2版本,但是需要复现书中的一些代码(Python机器学习基础教程),所以需要从其...
xgboost 已然火爆机器学习圈,相信不少朋友都使用过。要想彻底掌握xgboost,就必须搞懂其内部的模型原理。这样才能将各个参数对应到模型内部,进而理解参数的含义,根据需...
搞机器学习的人,都会有自己偏爱的某种算法,有的喜欢支持向量机(SVM),因为它公式表达的优雅和可利用方法实现的高质量;有的人喜欢决策树,因为它的简洁性和解释能力;还有人对神经...
背景 最近在训练树模型的时候遇到了一个问题:在一次手动特征工程之后,我从原始数据衍生了3个类别型特征,随后加入模型训练,以期望带来模型效果的提升。但最终实验结果出乎意料:加入...
不同的机器学习任务有着不同的性能评价指标。例如,分类问题,可以使用准确率 (Accuracy)、对数损失函数 (log-loss)、AUC等评价方法。实数序列数据预测问题,可...
此文主要用于个人备忘 kaggle 目前是散兵游勇使用真实数据进行机器学习实践的最佳场所,拥有真实的数据和大量有经验的参赛者,以及良好的讨论共享氛围。 基于树的 boosti...
本文内容结构主要参考Complete Guide to Parameter Tuning in XGBoost with codes in Python 及其 中文翻译 XG...
xgboost入门非常经典的材料,虽然读起来比较吃力,但是会有很大的帮助: 英文原文链接:https://www.analyticsvidhya.com/blog/2016/...
在 Kaggle 的很多比赛中,我们可以看到很多 winner 喜欢用 xgboost,而且获得非常好的表现,今天就来看看 xgboost 到底是什么以及如何应用。 本文结构...
第1章 准备工作第2章 Python语法基础,IPython和Jupyter第3章 Python的数据结构、函数和文件第4章 NumPy基础:数组和矢量计算第5章 panda...