综述 GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种...
综述 GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种...
简介 K均值聚类,也叫做K-Means Clustering,是一种著名的用于分类问题的无监督机器学习聚类算法。聚类是针对给定的样本, 依靠它们特征的相似度或者距离,将其归到...
简介 Visual Transformer (ViT) 出自于论文《AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE...
简介 Transformer出自于Google于2017年发表的论文《Attention is all you need》[https://arxiv.org/abs/170...
简介 本文的目的是通过实际代码编写来实现ViT模型,进一步加对ViT模型的理解,如果还不知道ViT模型的话,可以先看下博客[https://www.jianshu.com/p...
简介 集成学习,顾名思义就是将多种学习器或算法结合在一起,共同做出决策。这符合人类集思广益的做法,在业界也是应用最为广泛的方法之一。注意,集成学习的本质是如何找到不同的模型,...
简介 大概是今年6月份参加微信大数据挑战赛的时候,我才开始认识到特征选择也是机器学习中非常重要的一环。在诸如CTR等比赛中,原始特征往往是不足以挖掘出数据中隐藏的信息的,因此...
简介 决策树模型是最常见的机器学习方法之一,也是入门机器学习必须掌握的知识。决策树模型呈现树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then...
简介 特征离散化指的是将连续特征划分离散的过程:将原始定量特征的一个区间一一映射到单一的值。离散化过程也被表述成分箱(Binning)的过程。特征离散化常应用于逻辑回归和金融...