去https://my.datascientistworkbench.com/ 网站,整个平台已经帮你搭好了数据科学相关的一些常用软件平台。
包括数据清洗的OpenRefine,数据分析的Ipython notebook,Rtudio……就是网站有点慢,不知道白天会不会好一些。做这个网站的一个团队(成员是IBM Analytics的大数据专家),对网站的相关用法做了视频介绍(https://youtu.be/9ySrOPBq4tQ?list=PL0tstRIBCkTTxdohkYd3hG6OU-srESLe2 油管需翻墙)。 网站不仅有工具你能直接用,还有一些简单的入门教程。当然视频里也说了,不能跟软件本身比,网站提供的只是学习这些软件的平台,真正运行起来肯定会有限制,用来初步实践、建模还是挺轻便。所以最适合初学者~
我还在研究好不好用,先mark在这里。
开源工具真的太多太多了,就连搭建环境都有人帮你想到了,不怕你学不会,就怕你不学。