机器学习基础
https://zh.coursera.org/course/ntumlone
机器学习技法
https://zh.coursera.org/course/ntumltwo
这两门都是很好的入门课程,唯一遗憾的是,林轩田老师去工业界了,不会亲自再开这两门课,但是 Course Materials 仍然可以访问。hw可能有点难,我上学期上技法的时候,每次都要花一两天才能拿到勉强 325+/400。但是他的用意是把课上不会讲的东西放在hw里,所以大可不必太过担心,实在有不会的,可以去看看《Learning from data》这本书(我没有看,但他声称这本书覆盖了他的内容), 或者把讲义再看一遍。这门课的 note 基本每周都有(非官方),这个要自己搜一下。我这有保存着技法 note 的一个网址:
Stanford 的 cs229
https://zh.coursera.org/learn/machine-learning
有史以来最有代表性的公开课,Andrew Ng (这个人物很有名,coursera的co-founder,百度dl院的首席科学家)亲自授课,超简单,只有技术细节,少有理论解释,与台大的课形成鲜明对比。但同时是有一些 insight 的。使用 matlab ,其实很容易,我现学的。
这两门课上完,应该机器学习的基础是有了(我也就只有这两门课的水平,但是如果不搞学术,大家都差不多)。当然,要是搞研究还早。只不过 PRML, MLAPP 这些书我也看不下去,所以也没法给推荐。不过几个月前入了周志华老师(南大LAMDA实验室的头,学术大牛)的一本《机器学习》,新书,感觉很不错,主要是读着有意思,推荐给你。周志华老师的微博:
http://weibo.com/zhouzh2012?from=myfollow_all
《统计学习基础》这本书也有很多人推,我买来看了很少(就一两个算法),是主要介绍算法的,如果想对某些算法做不深不浅的了解,非常合适。作者是李航博士,wb:
http://weibo.com/u/2060750830?from=myfollow_all
至于语言方面,我差不多就是你这个时候学了 python,坦白讲 python 用的最多,但以后做统计的时候,很有可能导师非要用 R 或者 Matlab, 但是它们能做的, python 也能做, 反过来就不是了。这是python的一个基础教程,不太建议上 MOOC ,我当时上了一个 Rice 的课,教的很慢,学不到什么。建议看教程,直接上py3:
http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000
python 基本语法,和几个糖学会了,就能写程序了,「写」python 本来就很容易。
但是平时还要用到别的几个库:比如scipy numpy matplotlib sklearn sympy 我一般就是要用的时候就翻 API 。还要使用IPython。
对了,别上JH的课,他家是圈钱的。
一门没上过的,不负责推荐:
https://zh.coursera.org/course/scicomp
339390736,一个讨论较多的群。