说实话一开始写这个公众号的时候还是挺想写一些技术文章去帮助一些初学者的,虽然我也是刚入行没多久,但是毕竟刚经历过这个阶段,想着写出来肯定会比较接地气。但是后来我慢慢意识到其实现在有太多技术文章了,什么类型的其实都有,那不如将我看过的学习资料全部整理出来,一方面帮助对这一行还不太了解的人能够清楚的知道学习的路径是什么。另一方面可以帮助苦于没有资料的人,节省这部分人的搜索时间。
下面废话不多,直接上干货。
Python 基础篇
1、首先推荐 「A Byte of Python3(中文版)」这本书
这本书是我读过的最适合初学者的一本,内容尽量简洁易懂,虽然不会将一些知识的复杂用法全部讲透,但是说实话很多复杂功能尤其在初学阶段真的用不到。
这本书原版是英文,但由于英文版更新了,而国内的官方指定中文译本还未更新,所以被 GitHub 上的一位大佬翻译,并将其放在 GitHub 上供大家下载。不过我时间有点长我已经找不到当初的网站了,只有电子版的书。另外也可以阅读官方中文译本。
官方中文译本:介绍 · 简明 Python 教程
但我依然推荐大家阅读电子版,真的排版做的很棒。大家可以后台回复「电子书」来获取。
2、廖雪峰的 Python 教程
这可以说是国内 Python 最全面的免费教程了。甚至可以当做工具书来查看,不过对于初学者可能内容跨度会稍微有点大,导致连贯性欠佳,所以建议先看完上面推荐的电子书,再来看这个。
课程网址:Home - 廖雪峰的官方网站
3、「利用Python进行数据分析·第2版」
当 Python 已经入门后,就可以看这本关于数据分析的书。这本书可以说是不可多得的关于数据分析的好书,里面不光对 Python 数据分析的工具(Jupyter notebook)进行了讲解,而且还详细的讲解了 Numpy 库和 Pandas 库,这两个可以说是数据分析的最重要的库了。
而且还是根据数据分析的流程一步步的去讲解每个流程、需要的操作以及这些操作需要用到的函数。虽说没有一个完整的项目,但看完后完全可以当做工具书来查询。强烈推荐。
电子书网址:《利用Python进行数据分析·第2版》第1章 准备工作 - 简书
4、科赛网(Kesci)的「这十套练习,教你如何使用Pandas做数据分析」
在学习了上面的 Python 知识后,那么也该实战一下了。这个网站提供了十个实际问题的练习,并且提供在线的编程环境(和 Jupyter notebook的界面很像),最重要的是提供了数据集。可以说是帮你准备了一切,让你可以专心的去思考。
5、当你将上面的都全部学完,这时候就可以正式开始你数据分析师的第一个项目了,这个项目就是「泰坦尼克号数据分析」,这可以说是数据分析的经典项目了,很多人进入数据分析行业都是从这个项目开始的。虽然将这个项目写入简历没什么,但对提升自己而言,绝对是非常棒的。为什么这么说?因为网上关于该数据集的分析文章非常多,这样你自己做完整个项目后可以参考很多其他人的意见,吸取别人的分析思维,这是非常关键的地方。初学阶段最快的提升办法其实就是模仿。
如果你懒得去网上找,那么这里我也推荐一篇我觉得不错的文章供你参考。
分析参考文章:python 分析泰坦尼克号生还率 - 掘金
数据集介绍:Titanic: Machine Learning from Disaster | Kaggle
SQL篇
1、「撩课3Mysql数据库基础入门教程」
这可以说是免费 SQL 教程中最棒的视频教程了。不光有免费视频课,还可以根据课程加公众号获取视频中的思维导图用于复习,真的是不可多得的免费教程。
2、「SQL-W3Cschool」
这是W3C学院的课程,相信大家也都听说过,非常适合当做工具书查询。
3、「LeetCode」
其实大部分人学完 SQL 后发现自己还是不会写,哪怕是让你筛选个排名第二的人出来可能都要想一会。其实针对这种情况早就有人提出了解决办法,那就是做一个题库供大家在线编写,另外还能够互相交流学习,看别人的代码是如何编写。LeetCode 就是这类网站之一,说实话里面的数据库提型我还真在面试的时候碰到过。
非常建议找工作前先刷一下题,说不定面试就碰上了呢。
网址:力扣 (LeetCode) 中国官网 - 全球极客挚爱的技术成长平台
Excel
1、「跟王佩丰学Excel视频教程:Excel实战1800分钟」
毕竟 Excel 都已经出现了几十年了,所以网上 Excel 的课程实在太多了,这里就推荐网易云课堂的这门课吧,一样是免费的。学习 Excel 我是建议直接看视频的,毕竟很多操作都是鼠标直接点,看视频反而比看书效率高。
网址:跟王佩丰学Excel视频教程:Excel实战1800分钟 - 网易云课堂
2、「Excel职场小白到精通高手速成」
如果你想将 Excel 学的比较精通一些,那么也可以购买这门网易云课堂的课程,讲的非常细致,200 多个课时,也就一百多块钱,算是非常便宜了。
统计学
1、「可汗学院公开课:统计学」
统计学作为数据分析的基础是非常重要的,至少你得知道最大值、最小值、平均值、中位数、平方差等这些基础统计知识。另外也需要知道饼图、箱线图这些图标的含义和用法,这样在数据分析时对数据才能有一定的感知。这里推荐可汗学院的统计学课程,可以说将这门课程看完统计学的大部分知识就够用了。
网址:可汗学院:统计学
爬虫
1、「Python 3 网络爬虫开发实战教程」
这本书估计很多想学爬虫的人都听说过,或者有的已经买了本书。不过这本书前七章可以直接在作者崔庆才的个人博客直接访问的,有兴趣的可以看一看,如果真的把前七章都看完了再买本书也不迟。
为什么要放一个爬虫教程呢?因为想做数据分析的人大多都听说过爬虫,而且爬虫是了;灵活获取数据的最佳手段,加上我本人最近也在学习爬虫,所以就将我发现的爬虫教程也放上来了。那么不找爬虫类工作是否需要学习爬虫呢?我觉得如果有时间还是非常值得一学的,这里前提是如果有时间啊,毕竟数据分析最缺的就是数据,网络上的数据并不是都可以直接下载下来的,比如一个城市的房价如何?工作岗位分布如何?等。想要获取这些数据最好的办法就是爬虫。
好了,这次就先整理出这么些。资料在精不在多,更何况资料太多,自己选择起来也会纠结。上面的这些资料如果全部看完入门妥妥的没问题。
下篇文章我会着重讲一下数据分析师的两个发展方向,让未入行的人知道这一行是什么样的,也让一入行的可以了解未来自己该往哪个方向发展。
2019第二季度,继续努力!
如果觉得不错不妨点个「喜欢」
公众号是「转行做DT」,所有文章第一时间会发布在公众号上,欢迎大家关注。