半监督学习 当我们的训练集标签缺失,也就是有训练集X1=[(x.y)....],X2=[(x)...]。前者数据有标签,后者数据无标签。我们训练一个模型时,如果只使用前者对后...
IP属地:青海
半监督学习 当我们的训练集标签缺失,也就是有训练集X1=[(x.y)....],X2=[(x)...]。前者数据有标签,后者数据无标签。我们训练一个模型时,如果只使用前者对后...
kaggle比赛利器stacking 模型叠加 我们以二层叠加为例子理解它 我们有模型model1(可以是GBDT.xgboots等等) 有训练集500,验证集200 首先我...
LR+GBDT 在推荐问题中,我们一般都预测用户是否做某事,是一个二分类问题。 对于二分类问题一般我们使用的是逻辑回归。逻辑回归是广义的线性模型,增加sigma函数使其输出值...
矩阵分解funkSVD:该矩阵分解不像是线代中的,他属于伪分解。其主要思想是,用两个m*k和k*n的矩阵代替m*n的矩阵。 因为在推荐系统中,矩阵十分稀疏,分解后的矩阵一般是...
我们平时很容易遇到说排序,并取前N个的状况。我们根据数据类型可以简单分为重复键和不重复键的topN MapReduce 对于MR来说,topN代码比较多一些,在这里我只讲讲思...
fasttext作为NPL领域中机器学习的优秀范例值得研究。 模型架构 我对fasttext模型架构理解与CBOW很像。在训练时,通过N-gram把词向量喂入模型,输出属于各...
stocker是基于google时间序列预测模型 - 预测者实现的股票预测。 因为项目要求股票分析,所以使用了该库,对该库进行简短总结。预测者模型的论文地址https://p...
之前在文章《<模型汇总_1>牛逼的深度卷积神经网络CNN》详细介绍了卷积神经网络的基本原理,以及常见的基本模型,如LeNet,VGGNet,AlexNet,ReseNet,I...