Kaggle是全球最大的数据分析在线平台,吸引了全球范围内数十万的顶级数据科学家,同时也是检测我们机器学习技能的最佳平台。
一、Kaggle简介
Kaggle成立于2010年,网址:https://www.kaggle.com/。
Kaggle是全球范围内最大的数据众包平台。
企业或者研究者与Kaggle合作之后,可以将数据、问题描述、期望的指标发布到Kaggle上,以竞赛的形式向广大的数据科学家征集解决方案,类似于KDD-CUP(国际知识发现和数据挖掘竞赛)。
Kaggle上的参赛者将数据下载下来,分析数据,然后运用机器学习、数据挖掘等知识,建立算法模型,解决问题得出结果,最后将结果提交,如果提交的结果符合指标要求并且在参赛者中排名第一,将获得比赛丰厚的奖金。
二、参加Kaggle比赛的基本流程
1.选择一个比赛项目
2.加入竞赛,理解项目需求“Competition Details”
3.下载数据,训练模型,得出结果“Get the Data”
4.提交结果“Make a submission”
三、解题思路
“模仿是最好的学习方式!”
这里为大家推荐几篇非常好的文章,里面手把手的教了大家入门级的三个经典练习项目,供大家学习。
1.Titanic(泰坦尼克之灾)
中文教程: 逻辑回归应用之Kaggle泰坦尼克之灾
英文教程:An Interactive Data Science Tutorial
2.House Prices: Advanced Regression Techniques(房价预测)
中文教程:Kaggle竞赛 — 2017年房价预测
英文教程:How to get to TOP 25% with Simple Model using sklearn
3.Digital Recognition(数字识别)
中文教程:大数据竞赛平台—Kaggle 入门
英文教程:Interactive Intro to Dimensionality Reduction
欢迎关注微信公众号:kaggle数据分析!