前言 今天突然想了想这事,后面正好也在群里有了讨论。所以这篇文章大体是做个总结。 夜间漫谈 目前来看,从数据本身进行各种转换和查询,大致分成三个类型: 明细查询 聚合统计 关...
IP属地:北京
前言 今天突然想了想这事,后面正好也在群里有了讨论。所以这篇文章大体是做个总结。 夜间漫谈 目前来看,从数据本身进行各种转换和查询,大致分成三个类型: 明细查询 聚合统计 关...
社区发现(Community Detection)算法用来发现网络中的社区结构,也可以看做是一种聚类算法。 分层聚类 两两对比,最相似的两个聚类为一个中间态,中间态再参与两两...
统计学有两大主要分支,分别是描述性统计学和推断统计学。描述性统计学用于描述和概括数据的特征以及绘制各类统计图表。总体数据,往往因为数据量太大而难以被获取,所以就有了通过较小的...
《WestWorld》第一季第二集有一句很有意思的台词:游客William来到西部世界公园,遇到一个美女接待员,但无法区分对方是否是人类,于是产生了如下对话: 对于很多编写机...
当特征选择完成后,可以直接训练模型了,但是可能由于特征矩阵过大,导致计算量大,训练时间长的问题,因此降低特征矩阵维度也是必不可少的。但不要盲目降维,当你在原数据上跑到了一个比...
谢谢余博的指导,Daisy同学的作业也有所启发。 第5课 中心极限定理 & 区间估计 本课基本作业 用t分布求房屋平均面积在95%的置信区间,数据为house_size.cs...
接着上一篇:《机器学习实战-数据探索》介绍,机器学习更多内容可以关注github项目:machine learning《机器学习实战-数据探索》介绍了1、变量识别;2、单变量...