【贡献者】ty4z2008、pkuphy、peimin、jappre、CSerxy
【整理者】ty4z2008
【源链接】https://github.com/ty4z2008/Qix/blob/master/dl.md
【备注】源链接为总链接,共包括626个子链接
【编辑】Major术业,在原文基础上,为每篇标记上序号,方便大家区分和查阅
401《How to Choose a Neural Network》
介绍:deeplearning4j官网提供的实际应用场景NN选择参考表,列举了一些典型问题建议使用的神经网络
402《Deep Learning (Python, C/C++, Java, Scala, Go)》
介绍:一个深度学习项目,提供了Python, C/C++, Java, Scala, Go多个版本的代码
403《Deep Learning Tutorials》
介绍:深度学习教程,github
404《自然语言处理的发展趋势——访卡内基梅隆大学爱德华·霍威教授》
介绍:自然语言处理的发展趋势——访卡内基梅隆大学爱德华·霍威教授.
405《FaceNet: A Unified Embedding for Face Recognition and Clustering》
介绍:Google对Facebook DeepFace的有力回击—— FaceNet,在LFW(Labeled Faces in the Wild)上达到99.63%准确率(新纪录),FaceNet embeddings可用于人脸识别、鉴别和聚类.
406《MLlib中的Random Forests和Boosting》
介绍:本文来自Databricks公司网站的一篇博客文章,由Joseph Bradley和Manish Amde撰写,文章主要介绍了Random Forests和Gradient-Boosted Trees(GBTs)算法和他们在MLlib中的分布式实现,以及展示一些简单的例子并建议该从何处上手.中文版.
407《Sum-Product Networks(SPN) 》
介绍:华盛顿大学Pedro Domingos团队的DNN,提供论文和实现代码.
408《Neural Network Dependency Parser》
介绍:基于神经网络的自然语言依存关系解析器(已集成至Stanford CoreNLP),特点是超快、准确,目前可处理中英文语料,基于《A Fast and Accurate Dependency Parser Using Neural Networks》 思路实现.
409《神经网络语言模型》
介绍:本文根据神经网络的发展历程,详细讲解神经网络语言模型在各个阶段的形式,其中的模型包含NNLM[Bengio,2003]、Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要变形,总结的特别好.
410《Classifying Spam Emails using Text and Readability Features》
介绍:经典问题的新研究:利用文本和可读性特征分类垃圾邮件。
411《BCI Challenge @ NER 2015》
介绍:Kaggle脑控计算机交互(BCI)竞赛优胜方案源码及文档,包括完整的数据处理流程,是学习Python数据处理和Kaggle经典参赛框架的绝佳实例
412《IPOL Journal · Image Processing On Line》
介绍:IPOL(在线图像处理)是图像处理和图像分析的研究期刊,每篇文章都包含一个算法及相应的代码、Demo和实验文档。文本和源码是经过了同行评审的。IPOL是开放的科学和可重复的研究期刊。我一直想做点类似的工作,拉近产品和技术之间的距离.
413《Machine learning classification over encrypted data》
介绍:出自MIT,研究加密数据高效分类问题.
414《purine2》
介绍:新加坡LV实验室的神经网络并行框架Purine: A bi-graph based deep learning framework,支持构建各种并行的架构,在多机多卡,同步更新参数的情况下基本达到线性加速。12块Titan 20小时可以完成Googlenet的训练。
415《Machine Learning Resources》
介绍:这是一个机器学习资源库,虽然比较少.但蚊子再小也是肉.有突出部分.此外还有一个由zheng Rui整理的机器学习资源.
416《Hands-on with machine learning》
介绍:Chase Davis在NICAR15上的主题报告材料,用Scikit-Learn做监督学习的入门例子.
417《The Natural Language Processing Dictionary》
介绍:这是一本自然语言处理的词典,从1998年开始到目前积累了成千上万的专业词语解释,如果你是一位刚入门的朋友.可以借这本词典让自己成长更快.
418《PageRank Approach to Ranking National Football Teams》
介绍:通过分析1930年至今的比赛数据,用PageRank计算世界杯参赛球队排行榜.
419《R Tutorial》
介绍:R语言教程,此外还推荐一个R语言教程An Introduction to R.
420《Fast unfolding of communities in large networks》
介绍:经典老文,复杂网络社区发现的高效算法,Gephi中的[Community detection](The Louvain method for community detection in large networks)即基于此.
421《NUML》
介绍: 一个面向 .net 的开源机器学习库,github地址
422《synaptic.Js》
介绍: 支持node.js的JS神经网络库,可在客户端浏览器中运行,支持LSTM等 github地址
423《Machine learning for package users with R (1): Decision Tree》
介绍: 决策树
424《Deep Learning, The Curse of Dimensionality, and Autoencoders》
介绍: 讨论深度学习自动编码器如何有效应对维数灾难,国内翻译
425《Advanced Optimization and Randomized Methods》
介绍: CMU的优化与随机方法课程,由A. Smola和S. Sra主讲,优化理论是机器学习的基石,值得深入学习 国内云(视频)
426《CS231n: Convolutional Neural Networks for Visual Recognition》
介绍: "面向视觉识别的CNN"课程设计报告集锦.近百篇,内容涉及图像识别应用的各个方面
427《Topic modeling with LDA: MLlib meets GraphX》
介绍:用Spark的MLlib+GraphX做大规模LDA主题抽取.
428《Deep Learning for Multi-label Classification》
介绍: 基于深度学习的多标签分类,用基于RBM的DBN解决多标签分类(特征)问题
429《Google DeepMind publications》
介绍: DeepMind论文集锦
430《kaldi》
介绍: 一个开源语音识别工具包,它目前托管在sourceforge上面
431《Data Journalism Handbook》
介绍: 免费电子书《数据新闻手册》, 国内有热心的朋友翻译了中文版,大家也可以在线阅读
432《Data Mining Problems in Retail》
介绍: 零售领域的数据挖掘文章.
433《Understanding Convolution in Deep Learning》
介绍: 深度学习卷积概念详解,深入浅出.
434《pandas: powerful Python data analysis toolkit》
介绍: 非常强大的Python的数据分析工具包.
435《Text Analytics 2015》
介绍: 2015文本分析(商业)应用综述.
436《Deep Learning libraries and ?rst experiments with Theano》
介绍: 深度学习框架、库调研及Theano的初步测试体会报告.
437《DEEP learning》
介绍: MIT的Yoshua Bengio, Ian Goodfellow, Aaron Courville著等人讲深度学习的新书,还未定稿,线上提供Draft chapters收集反馈,超赞!强烈推荐.
438《simplebayes》
介绍: Python下开源可持久化朴素贝叶斯分类库.
439《Paracel》
介绍:Paracel is a distributed computational framework designed for machine learning problems, graph algorithms and scientific computing in C++.
440《HanLP:Han Language processing》
介绍: 开源汉语言处理包.
441《Simple Neural Network implementation in Ruby》
介绍: 使用Ruby实现简单的神经网络例子.
442《Hacker's guide to Neural Networks》
介绍:神经网络黑客入门.
443《The Open-Source Data Science Masters》
介绍:好多数据科学家名人推荐,还有资料.
444《Text Understanding from Scratch》
介绍:实现项目已经开源在github上面Crepe
445《 Improving Distributional Similarity with Lessons Learned from Word Embeddings》
介绍:作者发现,经过调参,传统的方法也能和word2vec取得差不多的效果。另外,无论作者怎么试,GloVe都比不过word2vec.
446《CS224d: Deep Learning for Natural Language Processing》
介绍:Stanford深度学习与自然语言处理课程,Richard Socher主讲.
447《Math Essentials in Machine Learning》
介绍:机器学习中的重要数学概念.
448《Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks》
介绍:用于改进语义表示的树型LSTM递归神经网络,句子级相关性判断和情感分类效果很好.实现代码.
449《Statistical Machine Learning》
介绍:卡耐基梅隆Ryan Tibshirani和Larry Wasserman开设的机器学习课程,先修课程为机器学习(10-715)和中级统计学(36-705),聚焦统计理论和方法在机器学习领域应用.
450《AM207: Monte Carlo Methods, Stochastic Optimization》
介绍:《哈佛大学蒙特卡洛方法与随机优化课程》是哈佛应用数学研究生课程,由V Kaynig-Fittkau、P Protopapas主讲,Python程序示例,对贝叶斯推理感兴趣的朋友一定要看看,提供授课视频及课上IPN讲义.
451《生物医学的SPARK大数据应用》
介绍:生物医学的SPARK大数据应用.并且伯克利开源了他们的big data genomics系统ADAM,其他的内容可以关注一下官方主页.
452《ACL Anthology》
介绍:对自然语言处理技术或者机器翻译技术感兴趣的亲们,请在提出自己牛逼到无以伦比的idea(自动归纳翻译规律、自动理解语境、自动识别语义等等)之前,请通过谷歌学术简单搜一下,如果谷歌不可用,这个网址有这个领域几大顶会的论文列表,切不可断章取义,胡乱假设.
453《Twitter Sentiment Detection via Ensemble Classification Using Averaged Confidence Scores》
介绍:论文+代码:基于集成方法的Twitter情感分类,实现代码.
454《NIPS 2014 CIML workshop》
介绍:NIPS CiML 2014的PPT,NIPS是神经信息处理系统进展大会的英文简称.
455《CS231n: Convolutional Neural Networks for Visual Recognition》
介绍:斯坦福的深度学习课程的Projects 每个人都要写一个论文级别的报告 里面有一些很有意思的应用 大家可以看看 .
456《A Speed Comparison Between Flexible Linear Regression Alternatives in R》
介绍:R语言线性回归多方案速度比较具体方案包括lm()、nls()、glm()、bayesglm()、nls()、mle2()、optim()和Stan’s optimizing()等.
457《Back-to-Basics Weekend Reading - Machine Learning》
介绍:文中提到的三篇论文(机器学习那些事、无监督聚类综述、监督分类综述)都很经典,Domnigos的机器学习课也很精彩
458《A Probabilistic Theory of Deep Learning》
介绍:莱斯大学(Rice University)的深度学习的概率理论.
459《Nonsensical beer reviews via Markov chains》
介绍:基于马尔可夫链自动生成啤酒评论的开源Twitter机器人,github地址.
460《Deep Learning for Natural Language Processing (without Magic)》
介绍:视频+讲义:深度学习用于自然语言处理教程(NAACL13).
461《Introduction to Data Analysis using Machine Learning》
介绍:用机器学习做数据分析,David Taylor最近在McGill University研讨会上的报告,还提供了一系列讲机器学习方法的ipn,很有价值 GitHub.国内
462《Beyond Short Snippets: Deep Networks for Video Classification》
介绍:基于CNN+LSTM的视频分类,google演示.
463《How does Quora use machine learning in 2015?》
介绍:Quora怎么用机器学习.
464《Amazon Machine Learning – Make Data-Driven Decisions at Scale》
介绍:亚马逊在机器学习上面的一些应用,代码示例.
465《Parallel Machine Learning with scikit-learn and IPython》
介绍:并行机器学习指南(基于scikit-learn和IPython).notebook
466《Intro to machine learning with scikit-learn》
介绍:DataSchool的机器学习基本概念教学.
467《DeepCLn》
介绍:一个基于OpenGL实现的卷积神经网络,支持Linux及Windows系.
468《An Inside Look at the Components of a Recommendation Engine》
介绍:基于Mahout和Elasticsearch的推荐系统.
469《Forecasting in Economics, Business, Finance and Beyond》
介绍:Francis X. Diebold的《(经济|商业|金融等领域)预测方法.
470《Time Series Econometrics - A Concise Course》
介绍:Francis X. Diebold的《时序计量经济学》.
471《A comparison of open source tools for sentiment analysis》
介绍:基于Yelp数据集的开源情感分析工具比较,评测覆盖Naive Bayes、SentiWordNet、CoreNLP等 .
472《Pattern Recognition And Machine Learning》
介绍:国内Pattern Recognition And Machine Learning读书会资源汇总,各章pdf讲稿,博客.
473《Probabilistic Data Structures for Web Analytics and Data Mining 》
介绍:用于Web分析和数据挖掘的概率数据结构.
474《Machine learning in navigation devices: detect maneuvers using accelerometer and gyroscope》
介绍:机器学习在导航上面的应用.
475《Neural Networks Demystified 》
介绍:Neural Networks Demystified系列视频,Stephen Welch制作,纯手绘风格,浅显易懂,国内云.
476《swirl + DataCamp 》
介绍:{swirl}数据训练营:R&数据科学在线交互教程.
477《Learning to Read with Recurrent Neural Networks 》
介绍:关于深度学习和RNN的讨论 Sequence to Sequence Learning with Neural Networks.
478《深度强化学习(Deep Reinforcement Learning)的资源》
介绍:Deep Reinforcement Learning.
479《Machine Learning with Scikit-Learn》
介绍:(PyCon2015)Scikit-Learn机器学习教程,Parallel Machine Learning with scikit-learn and IPython.
480《PDNN》
介绍:PDNN: A Python Toolkit for Deep Learning.
481《Introduction to Machine Learning》
介绍:15年春季学期CMU的机器学习课程,由Alex Smola主讲,提供讲义及授课视频,很不错.国内镜像.
482《Big Data Processing》
介绍:大数据处理课.内容覆盖流处理、MapReduce、图算法等.
483《Spark MLlib: Making Practical Machine Learning Easy and Scalable》
介绍:用Spark MLlib实现易用可扩展的机器学习,国内镜像.
484《Picture: A Probabilistic Programming Language for Scene Perception》
介绍:以往上千行代码概率编程(语言)实现只需50行.
485《Beautiful plotting in R: A ggplot2 cheatsheet》
介绍:ggplot2速查小册子,另外一个,此外还推荐《A new data processing workflow for R: dplyr, magrittr, tidyr, ggplot2》.
486《Using Structured Events to Predict Stock Price Movement: An Empirical Investigation》
介绍:用结构化模型来预测实时股票行情.
487《International Joint Conference on Artificial Intelligence Accepted paper》
介绍:国际人工智能联合会议录取论文列表,大部分论文可使用Google找到.
488《Why GEMM is at the heart of deep learning》
介绍:一般矩阵乘法(GEMM)对深度学习的重要性.
489《Distributed (Deep) Machine Learning Common》
介绍:A Community of awesome Distributed Machine Learning C++ projects.
490《Reinforcement Learning: An Introduction》
介绍:免费电子书<强化学习介绍>,第一版(1998),第二版(2015草稿),相关课程资料,Reinforcement Learning.
491《Free ebook: Microsoft Azure Essentials: Azure Machine Learning》
介绍:免费书:Azure ML使用精要.
492《A Deep Learning Tutorial: From Perceptrons to Deep Networks》
介绍:A Deep Learning Tutorial: From Perceptrons to Deep Networks.
493《Machine Learning is Fun! - The world’s easiest introduction to Machine Learning》
介绍:有趣的机器学习:最简明入门指南,中文版.
494《A Brief Overview of Deep Learning》
介绍:深度学习简明介绍,中文版.
495《Wormhole》
介绍:Portable, scalable and reliable distributed machine learning.
496《convnet-benchmarks》
介绍:CNN开源实现横向评测,参评框架包括Caffe 、Torch-7、CuDNN 、cudaconvnet2 、fbfft、Nervana Systems等,NervanaSys表现突出.
497《This catalogue lists resources developed by faculty and students of the Language Technologies Institute.》
介绍:卡耐基梅隆大学计算机学院语言技术系的资源大全,包括大量的NLP开源软件工具包,基础数据集,论文集,数据挖掘教程,机器学习资源.
498《Sentiment Analysis on Twitter》
介绍:Twitter情感分析工具SentiTweet,视频+讲义.
499《Machine Learning Repository @ Wash U》
介绍:华盛顿大学的Machine Learning Paper Repository.
500《Machine learning cheat sheet》
介绍:机器学习速查表.
(未完待续......)