喆科 - 简书

喆科

IP属地：广东

基于物品的协同过滤--理论
基于item的协同过滤，通过用户对不同item的评分来评测item之间的相似性，基于item之间的相似性做出推荐。简单来讲就是：给用户推荐和他之...

839 0 0
基于用户的协同过滤--理论
协同过滤推荐（Collaborative Filtering Recommendation） User-based CF: 基于User的协同过...

292 0 0

scrapy.Request和response.follow的区别
在写scrapy的spider类的parse方法的时候，有些链接需要提取出来继续爬取，这里scrapy提供了一些方法可以方便的实现这个功能，总结...

1282 0 0
FM算法
因子分解机(Factorization Machine, FM)是由Steffen Rendle提出的一种基于矩阵分解的机器学习算法。目前，被广...

133 0 0
MinMaxScaler
MinMaxScaler作用是每一列，即每一维特征。将每一维特征线性地映射到指定的区间，通常是[0, 1]。MinMaxScaler计算数据集的...

5064 0 0
VectorAssembler 用法
从源数据中提取特征指标数据，这是一个比较典型且通用的步骤，因为我们的原始数据集里，经常会包含一些非指标数据，如 ID，Description 等...

5830 0 1
QuantileDiscretizer用法
QuantileDiscretizer（分位数离散化）将一列连续型的数据列转成分类型数据。通过取一个样本的数据，并将其分为大致相等的部分，设定范...

1730 0 0

名词解释
残差残差在数理统计中是指实际观察值与估计值（拟合值）之间的差。“残差”蕴含了有关模型基本假设的重要信息。如果回归模型正确的话，我们可以将残差...

623 0 0
SQL语句中LEFT JOIN ON WHERE和LEFT JOIN ON AND的区别
众所周知，数据库的表都是单独存在的，但是当我们进行联合查询(多表查询)时，我们获得数据库返回的值时就好像在一张表里一样，这是因为在进行联合查询时...

934 0 0