语音类
介绍了百度 Deep Voice(已经做到了实时的语音合成,这相比以前的 WaveNet 推理的实现有 400 倍的加速),端到端语音合成模型 Char2wav,谷歌端到端的文本转语音合成模型 Tacotron(Tacotron 在美式英语测试里的平均主观意见评分达到了 3.82 分(总分是 5 分),在自然感(naturalness)方面优于已在生产中应用的参数系统(parametric system)。此外,由于 Tacotron 是在帧(frame)层面上生成语音,所以快。)
一种全新的启迪音乐创作的合成方法。
NSynth 可帮助音乐人凭直觉掌控音色、(音乐中的)力度强弱以及探索借由手动调节合成器而非常难或不可能实现的新声音的能力。所学习乐器的声学质量依赖于实用的模型和可用的训练数据,
视觉类
涵盖了传统检测算法核心、深度神经网络框架、检测技术难点等方面。
专栏 | 对比激光SLAM与视觉SLAM:谁会成为未来主流趋势?
人工智能从入门到进阶,机器之心高分技术文章全集(2017-01-29)
一、学习资源;二、基础介绍文章;三、技术起点;四、继续进阶;五、前沿研究
文章建议了一个文件架构,合理的基础框架。
先思考必须要做的是什么?根据思路总结出合理框架:
README,main.py 文件(独特的 endpoint),数据文件夹(一个文件夹,包含一个脚本来下载数据集),模型文件夹(该文件夹用来放模型文件),__init__ file(python 助手,更容易找到模型),basic_model.py 文件( TensorFlow 中的大部分模型能共享一个通用架构),hysearch 文件夹(存放任何做自定义超参数搜索的助手),测试文件夹,结果文件夹。
1. 五大流派
①符号主义:使用符号、规则和逻辑来表征知识和进行逻辑推理,最喜欢的算法是:规则和决策树
②贝叶斯派:获取发生的可能性来进行概率推理,最喜欢的算法是:朴素贝叶斯或马尔可夫
③联结主义:使用概率矩阵和加权神经元来动态地识别和归纳模式,最喜欢的算法是:神经网络
④进化主义:生成变化,然后为特定目标获取其中最优的,最喜欢的算法是:遗传算法
⑤Analogizer:根据约束条件来优化函数(尽可能走到更高,但同时不要离开道路),最喜欢的算法是:支持向量机
常见算法:(简述了各自特点,优点,以及场景)
1. 决策树(Decision Tree),2. 支持向量机(Support Vector Machine),3. 回归(Regression),4. 朴素贝叶斯分类(Naive Bayes Classification),5. 隐马尔可夫模型(Hidden Markov model),6. 随机森林(Random forest),7. 循环神经网络(Recurrent neural network),8. 长短期记忆(Long short-term memory,LSTM)与门控循环单元神经网络(gated recurrent unit nerual network),9. 卷积神经网络(convolutional neural network)
数据
各领域公开数据集下载 (2017/02/08)
公开课
蒙特利尔大学开放MILA 2017夏季深度学习与强化学习课程视频
吴恩达Deeplearning.ai课程学习全体验:深度学习必备课程
其实这篇文章是对课程的总结和学习技巧的分享。作者也是没读博士的码农,比较了几个可能直接的学习技巧。十分值得借鉴。
CS231n: Convolutional Neural Networks for Visual Recognition 李飞飞
Kaggle
Kaggle 是一个流行的数据科学竞赛平台,已被谷歌收购。为了帮助初学者入门 Kaggle,EliteDataScience 发表了一篇入门介绍文章,解答了一些初学者最常遇到的问题。机器之心2017-07-22
搞公司
机器学习: 如何成为ML-ready的公司?(有很好的指示图帮你分析)
我的业务是否适合机器学习模型?我可以从机器学习模型中获得什么收益?这是一个降低成本的问题,还是增加收入的问题?我现在的数据积累足够吗,如果不够的话该怎么办?我需要什么样的人才帮助我实现企业人工智能的升级?
题目?🙃呵呵
end