remychan - 简书

发简信

remychan

7
关注
4
粉丝
7
文章
3916

字数
1

收获喜欢
1

总资产

IP属地：北京

remychan

Lareina林暖暖
写了 35464 字，被 15 人关注，获得了 42 个喜欢
remychan

文哥的学习日记
写了 704974 字，被 8152 人关注，获得了 5857 个喜欢

评论较多，简书回复也不太方便，如有问题麻烦关注下面的公众号，加入我的微信群一起讨论。公众号ID：小小挖掘机

remychan

one-hot encoding 与dummy encoding
One-Hot编码和哑变量应该怎么用考虑一个具有三个类别的离散型特征，采用One-Hot 编码后：其中因此有从上面的公式可以看出，参数(θ0, θ1, θ2, θ3)...

1630 0 0
remychan

How spark executes a job on the cluster
In the cluster mode, when a j ob is submitted for execution, the j ob is sent to the dr...

159 0 0
remychan

spark
yodatech2016 编，5 篇文章，30 人关注

Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用并行框架，Spark，拥有Hadoop MapReduce所具有的优点；但不同于MapReduce的是Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
remychan

KMP字符串模式匹配算法Java实现
版权声明：本文源自简书tianma，转载请务必注明出处： http://www.jianshu.com/p/e2bd1ee482c3 本文灵感来自于July的博客从头到尾彻底...

tianma
20130 7 15
remychan

zz-hive的基本原理
原文链接：http://www.cnblogs.com/uttu/archive/2013/02/28/2936953.html 1、组件：元存储（Metastore ）－...

433 0 0

remychan

Spark核心数据模型-RDD
1：可以抽象地理解为一个大数组（Array）。这个数组是分布在集群上的，逻辑上RDD的每个分区是一个Partiton 2： 4种创建方式；2种操作算子 3：cache()函数...

418 0 0
remychan

slade_sal
写了 50079 字，被 616 人关注，获得了 504 个喜欢

@公众号：ml_trip<br>@github : <a href="https://links.jianshu.com/go?to=https%3A%2F%2Fgithub.com%2Fsladesha" target="_blank">https://github.com/sladesha</a>
remychan

工程师milter
写了 57738 字，被 7104 人关注，获得了 2048 个喜欢

哔哩哔哩：李文举说
remychan

离散化
离散化指把连续型数据切分为若干“段”，也称bin，是数据分析中常用的手段。切分的原则有等距，等频，优化，或根据数据特点而定。在营销数据挖掘中，离散化得到普遍采用。究其原因，有...

1057 0 1
remychan

Cer_ml
写了 34511 字，被 559 人关注，获得了 553 个喜欢

机器学习以及深度学习领域的学习者，永远在路上~~<br>我的github：<a href="https://links.jianshu.com/go?to=https%3A%2F%2Fgithub.com%2Fapplenob" target="_blank">https://github.com/applenob</a><br>个人博客：<br><a href="https://links.jianshu.com/go?to=https%3A%2F%2Fapplenob.github.io%2F" target="_blank">https://applenob.github.io/</a><br>大多数需要编辑公式的文章在个人博客上~~

remychan

王雨城
写了 21093 字，被 474 人关注，获得了 387 个喜欢

一个学生
remychan

降维与度量学习
1.kNN算法：给定测试样本，基于某种距离度量，找出训练集中与其最近靠近的k个训练样本，然后基于这k个邻居的信息进行预测.通常分类任务中，使用“投票”法；回归任务中，使用“平...

357 0 0
remychan

我的宝贝

144 0 0
remychan

数据库开发岗面试准备（2）——面试通用问题+python
1.对于加班什么看法？自己非常愿意XXXX 2.为什么选择金融这个行业？基金行业看法，以后想在这个行业里做什么？（1）大学了解到金融的魅力，那种通过各种手法变魔术般进行资本...

是蓝先生
982 0 3
remychan

是蓝先生
写了 97635 字，被 687 人关注，获得了 596 个喜欢

愿我长命百岁，yu你终老

个人介绍

机器学习、深度学习 l 大数据 hive hadoop spark | 人工智能 l 数理逻辑