很久之前练习过的一个kaggle项目,有点记不清了,今天来温习下,嘻嘻~kaggle给初学者或者富有挑战能力的选手们提供了一个非常好的平台,希望...
在运行spark程序时,报java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.native...
逻辑回归是机器学习算法中常用的算法之一,其简单,容易理解,故被后人广泛使用。今天来总结下它的损失函数及其推导过程。 1.损失函数及其求解 线性回...
1.persist 与 cache 区别 persist源码内部调用了persist(self, storageLevel=StorageLev...
要用python操作Cassandra,首先需要安装Cassandra的驱动模块(cassandra-driver),可以通过pip安装。 1....
1. 什么是Apache Cassandra? Apache Cassandra是一个开源,分布式和分散式/分布式存储系统(数据库),用于管理遍...
Shiny是RStudio公司开发的新包,有了它,可以用R语言轻松开发交互式web应用。想查看更详细的介绍和实例,请访问shiny的官方主页。今...
kaggle注册完邮箱,今天下载数据的时候一直提示:You did not enter the correct captcha response...
1.缺失值/异常值处理 这里分四种情况讨论(当然具体使用哪种方法还是要根据具体业务进行分析和调整哈~): 数据量很大,缺失值较少:因为有足够的数...