first 减少对人工采集的依赖 1、可以技术的就用技术,尽可能依靠技术去实现,比如我们需要拿到商家的相关信息,我们可以先从大众点评上去爬取名称...
-- 转自挖数网 自己备份用 这个网貌似挂掉了 数据质量是数据应用的核心基础,数据测试是非常重要的一环,若质量把控不够严格,后续所有的行为都可能...
问题描述: 我正在尝试使用xgboost算法预测解决多类分类,但是我不知道 predict_proba 是如何工作的.实际上, predict_...
转自终端研发部[https://www.zhihu.com/people/zhimengrensheng]某大佬的文章,发现这个解释的非常通俗清...
起因:公司有组织一些狼人杀活动,后来感觉还蛮有趣的于是去下了网杀,然后发现了一些有关狼人杀有趣的点,而且狼人杀一部分是现实的映射,所以记录下自己...
背景是公司买了一个神策分析系统,包含了神策分析和报表两部分,使用下来发现有一些局限,想正好写下来。记录日期是2022/02/16日。 神策分析优...
取球问题 背景:抖音上看到一个视频:一个大爷在街上摆摊,用一个袋子装了红绿蓝各8个珠子。玩家把手伸进口袋摸出12个珠子,数出不同颜色珠子个数,就...
基于K-means给客户分群 一、背景描述 1、我们的想要将客户进行分类,分类后是为了对不同的客户进行分类管理,给与不同的营销资源于不同的客户,...
记录用: 一.等距分箱/等宽分箱 1.概念:将变量的取值范围分为k个等宽的区间,每个区间当作一个分箱。 2.方法 二.等频分箱 1.概念:把观测...