2015-8-4至 8-7 收集资料

《爱可可老师今日视野(15.08.07)》( 分享自@简书O网页链接

《爱可可老师今日视野(15.08.04)》 ( 分享自@简书O网页链接

【IPN:用Python实现神经网络模型】《How to implement a neural network》Linear regression/Logistic classification function/Logistic regression (classification)/Hidden layer/Softmax classification function/VectorizationO网页链接ipn:O网页链接

【(pymc)Python下的状态空间模型:Metropolis-Hastings(Classical/Bayesian Estimation)】《State space models in Python: Metropolis-Hastings》O网页链接

【Quora:"增加DNN层数是否会导致性能下降?"Bengio给出的回答】《Deep Learning: Assuming a deep neural network is properly regulated, can adding more layers actually make the performance degrade?》O网页链接  真实情况不是这样的。添加参数是否增大假设函数空间复杂性取决于参数的实际值范围。纵向添加是否增加复杂度要看增加层之后的Lipschitz是否有界及其范围。横向添加参数增大模型复杂是基本没有异议的。深度学习应用统计学习理论看参数数量太过于简化不符合实际。

什么是英特尔 INDE?我为何应当关注?O网页链接更多:O网页链接《码农周刊》官方客户端下载地址:O网页链接

【微软:R编程入门】R作为各个领域数据专家的不二之选,已经成为数据科学与统计世界的通用语言。微软的这门新课不仅将助你掌握R的基本知识,还会通过DataCamp提供的大量互动挑战来提高你的实战能力。你将会分析真实世界中的数据问题,并且获得个人化的反馈来提升技能。#今日开课#O网页链接

今天分享一个git学习网站,网站详细的介绍了git的使用方法,学习git的童鞋可以看看,地址:O网页链接

发表了博文《在Xcode中玩转Git》Git是个好东西!!!!!!我与Git的第一次邂逅是在visualstudio上,从那时开始被Git迷得神魂颠倒。那啥是Git呢?在此之前脮们应该听过CVS、SVO在Xcode中玩转Git

【(Torch实例教学)基于Torch在CIFAR-10上跑出92.45%】《92.45% on CIFAR-10 in Torch》 by Sergey ZagoruykoO网页链接GitHub:O网页链接btw,O网页链接是Torch新开的官方Blog,值得关注  这个其实有个很大的问题 要是lr调的不好 给了模型似乎也不容易复现结果//@星空下的巫师:额,以前做过,32x32原图,只做mirror,no crop的8层简单网络single模型跑到了93.38%,觉得太差,没脸见人就放弃了。。。//@winsty:@antinucleon你的inception来show下

《机器学习中的逻辑回归模型简介》逻辑回归(Logistic Regression)是机器学习中的一种分类模型,由于算法的简单和高效,在实际中应用非常广泛。本文主要关注逻辑回归算法的数学模型和参数求解方法,最后也会简单讨论下逻辑回归和贝叶斯分类的关系......O网页链接(by 美团网 - Fin)

【集成学习方法通俗入门】《Basics of Ensemble Learning Explained in Simple English》by Tavish SrivastavaO网页链接  非常通俗,我自己的实际应用几乎都要应到ensemble,不太可能用单一模型做到很牛逼,搞一堆弱智能的teller,组合起来就结果的稳定性就特别好,而且随着增加的teller越多,效果越提升,且不用担心有些teller很烂。 //@phunter_lau:涵盖全面还有例子,不错

【Logistic回归简介】《Logistic Regression 模型简介》O网页链接

【IPN:基于PyMC的LDA实现/分析】《Implementing and analyzing LDA algorithm using PyMC package 》O网页链接参阅:O网页链接

【易部署/易扩展的Python私有计算云框架py-beach】"Python private compute cloud framework with a focus on ease of deployment and expansion rather than pure performance"O网页链接

【(Python)用PyTables处理超过内存大小的数据集】《Using PyTables for Larger-Than-RAM Data Processing》O网页链接

【基于Theano/GPU的高效深度学习】《Faster deep learning with GPUs and Theano》by Manojit NandiO网页链接

【*大数据全栈式开发语言 – Python*】前段时间,ThoughtWorks在深圳举办一次社区活动上,有一个演讲主题叫做“FullstackJavaScript”,是关于用JavaScript进行前端、服 .. ...O网页链接

【IPN:(基于Chainer的)变分自动编码器】《Variational Auto-Encoder》O网页链接

【入门:Python下K近邻方法实例】《K-nearest neighbors in python》O网页链接

【(Python)神奇的异步修饰器Tomorrow(附爬虫多线程提速实例)】"Magic decorator syntax for asynchronous code in Python" GutHub:O网页链接

Quora上关于“为什么Python是数据科学家最爱”的讨论,O网页链接几个原因:数值计算库(等statsmodel成熟了就完全可以与R媲美了);通用语言、丰富的库,一站式数据处理;与高性能语言互操作性强(便于渐进优化);R, Matlab/Octave, Mathematica/Sage有的Python都有了;缺点:大规模数据

K-nearest neighbors in python - Dataquest BlogO网页链接

【十大妙招可大大节省Python开发者的时间】O网页链接

【R/Python数据操作基础】《Data manipulation primitives in R and Python》O网页链接  可参考另一篇《Dataframes – Julia/R/Python》O网页链接

【交互式Python profiler工具——Profiling】"The profiling package is an interactive Python profiler" GitHub:O网页链接

【(Python)深度学习框架/库/工具汇总介绍】《Frameworks and Libraries for Deep Learning》Theano/Pylearn2/Blocks/Keras/LasagneO网页链接 提供的译文《从Theano到Lasagne:基于Python的深度学习的框架和库》O网页链接

【Prof. Karypis' Lab成员开放工具集(数据挖掘/信息检索/协同过滤/高性能计算)】METIS/CLUTO/BDMPI/SLIM/NERSTRAND/L2AP/PAFI/AFGen/SUGGEST/MGridGen/PSPASESO网页链接

PyStruct - Structured Learning in PythonO网页链接

【PyData Seattle 2015视频集锦】"PyData Seattle talks"O网页链接Youtube:O网页链接

【(Python)RNN简单实现】《Simple Recurrent Neural Network》O网页链接

RNN简单介绍及其Python实现:Simple Recurrent Neural NetworkO网页链接  有些瑕疵,作者删了该文,在github的提交记录里可以看见:O网页链接

RNN简单介绍及其Python实现:Simple Recurrent Neural NetworkO网页链接

#100行代码实现深度学习问答#Question-answering Deep RNN in ~100 lines of Python #keras code,GitHub:O网页链接

【IPN:Scikit-Image教程】《Scikit-Image Tutorials》O网页链接GitHub:O网页链接

【机器学习API排行Top10】《Top 10 Machine Learning Apis: At&t Speech, Ibm Watson, Google Prediction》 AT&T Speech/IBM Watson/Google Prediction/Wit.ai/AlchemyAPI/Diffbot/BigML/PredictionIO/Microsoft Azure Machine Learning/Amazon Machine LearningO网页链接

【论文+代码:Top-N推荐的稀疏线性方法SLIM】《SLIM: Sparse Linear Methods for Top-N Recommender Systems》X Ning, George Karypis (ICDM2011)O网页链接SLIM library:O网页链接GitHub::O网页链接

【视频:R下的贝叶斯推理】《Bayesian Inference in R》"How to do Bayesian inference with some sample data, and how to estimate parameters for your own data. It's easy!"O网页链接Dataset:O网页链接云:O网页链接

【代码 工具 平台】【ipython notebook 】【开源:类似Jupyter的多用途NoteBook项目——Apache Zeppelin】Data Ingestion/Data Discovery/Data Analytics/Data Visualization&CollaborationO网页链接GitHub:O网页链接 

【时间序列】【异常检测】【论文:社交媒体流数据关键时刻发现(突发检测)——LABurst算法】《Learning to Discover Key Moments in Social Media Streams》C Buntain, J Lin, J Golbeck (2015)O网页链接

【时间序列 可视化】【开源:(Python)多数据集定量密集展示图TrendVis(适合时序数据展示)】GitHub:O网页链接

【时间序列】【非抽样CNN】【论文:基于非抽样全CNN(UFCNN)的时序建模】《Time-series modeling with undecimated fully convolutional neural networks》R Mittelman (2015)O网页链接 

【时间序列】【异常检测】KDD创新奖得主Vipin Kumar的博士生Varun Chandola专注异常检测。1)09年博士论文<离散和时序数据中的异常检测>O网页链接2)09年CompuSur引用过千的文章Anomaly detection: A surveyO网页链接3)12年TKDE调研文章O网页链接应用:信用欺诈 网络入侵 生物序列 广告 

数盟论坛上的小伙伴收集的关于特征工程、特征选择的文章汇总,持续更新中~O网页链接需要自取~

特征工程工具包Venus  看到几篇特征工程文章,我也分享下以前的PPT,里面介绍了自己的第二款开源软件,特征工程工具包Venus。工作太忙以致还是半成品,不过其思想还是可参考。注意PPT中的特征工程其实算是数据分析领域的方法,如果有一个机器学习生产环境,可以以其作为迭代对象,玩法会很不一样。O网页链接 

特征工程模型  大家用的都差不多,效果的好坏其实就是你特征处理的好坏O最近看到的“特征工程”相关文章,特汇总在一起方便浏览~  

【特征工程 vs. 特征提取】《Feature Engineering versus Feature Extraction: Game On!》O网页链接

【Lasagne新增RNN/LSTM支持】O网页链接

Faster deep learning with GPUs and TheanoO网页链接

【深度学习框架Chainer/Theano-based/Torch7/Caffe的简单比较】《(Chainer)Comparison with Other Frameworks - A table for quick comparison》"We are preparing for the benchmarks"O网页链接

用于深度神经网络学习的NVIDIA cuDNN 3.0版本现在可以下载了。O网页链接

NVIDIA发布了cuDNN,以及Digits2的RC版,O网页链接  cuDNN v3百度云地址,Linux:O网页链接,Windows:O网页链接,Samples:O网页链接

【代码 】QA on Facebook bAbi w/ 175 lines of Python + Keras 训练RNN模型一个任务只需几分钟。主页O网页链接GitHubO网页链接

【GPU平台上的深度学习工具AMD MLP及其使用详解】《基于OpenCL的深度学习工具:AMD MLP及其使用详解》 via@CSDN云计算O网页链接

Alex Graves 三年前写的这本《Supervised Sequence Labelling with Recurrent Neural Networks》是一本很好的RNN/LSTM入门读物,笔风简朴,通俗易读,算法及应用举例描述清晰。 BookZZ下载:O网页链接百度云:O网页链接

有同学询问,对于信息抽取方向有无比较简单易懂的入门材料?在此我推荐一下纽约大学的IE领域著名教授Ralph Grishman撰写的信息抽取笔记📒:O网页链接   Information Extraction: Capabilities and Challenges

【约翰霍普金斯大学:数据科学课】数据科学家的工具箱(中文版)O网页链接R 语言程序开发(中文版)O网页链接获取和整理数据(中文版)O网页链接探索性数据分析(中文版)O网页链接可重复性研究O网页链接统计推断O网页链接  回归模型O网页链接实用机器学习O网页链接数据产品开发O网页链接| 更多数据科学课程:O网页链接

Caffe实例教程  "忘记上次答应谁写个简单的Caffe C++使用教程了,今天抽空写了一个教程和Test代码,适合新人入门。另外附上LeNet+BN,将MNIST调参到99.5±0.05%的Log文件,配置和参数都在其中了,需要自取:O网页链接 

【(Kaggle)机器学习/预测模型实战指南】"Hacker's Guide to Machine Learning and Predictive Modelling" Titanic: Machine Learning from Disaster/Digit Recognizer/Sentiment Analysis on Movie Reviews/Forecast use of a city bikeshare system GitHub:O网页链接

CVPR2015的总结分享,真正是好文,Deep down the rabbit hole: CVPR 2015 and beyondO网页链接  提供的译文《CVPR 2015深度学习回顾:ConvNet、Caffe、Torch及其他》O网页链接//@爱可可-爱生活: "Deep down the rabbit hole: CVPR 2015 and beyond"  Video summary of the paper: Youtube:O网页链接云:O网页链接

《Deep Neural Networks are Easily Fooled: High Confidence Predictions for Unrecognizable Images》愚弄DNN的图片,讨论DNN机器视觉的泛化能力O网页链接相关另一篇《Intriguing properties of neural networks》前面说到的DNN缺陷可能与其中提到DNN的两个特性有关O网页链接

【MIT Technoloy Review关于LeCun及其深度学习研究的特别报道】《Teaching Machines to Understand Us - A reincarnation of one of the oldest ideas in artificial intelligence could finally make it possible to truly converse with our computers...》O网页链接

【幻灯:(DLSS2015)深度神经网络训练】《Training Deep Neural Networks》by Hugo Larochelle [University of Sherbrooke] (Deep Learning Summer School 2015) 云:O网页链接参阅:O爱可可-爱生活

【幻灯:(DLSS2015)流形与自动编码器】《On manifolds and autoencoders》 by Pascal Vincent (University of Montreal), Deep Learning Summer School 2015 pdf:O网页链接

【幻灯:(DLSS2015)RBM堆叠(DBN)】《Stacks of Restricted Boltzmann Machines》by Honglak Lee (University of Michigan), Deep Learning Summer School 2015 pdf:O网页链接

【幻灯:(DLSS2015)机器学习介绍】《Introduction to Machine Learning (Deep Learning Summer School 2015)》by Pascal Vincent pdf:O网页链接

Deep Learning Summer School 2015,正在进行#深度学习#O网页链接

【视频:(Skymind.io)基于深度学习的视频检索】《Image Retrieval with DeepLearning》by Jeffrey Tang [Skymind.io] Youtube:O网页链接云:O网页链接

继DeepMind2015Nature文章深度强化学习O网页链接麻省理工Narasimhan将其用于文本博弈O网页链接附:Narasimhan的ACL15文章:在机器理解中利用篇章信息O网页链接  文本博弈已被#EMNLP15#录取:Language Understanding for Text-based Games Using Deep Reinforcement Learning [Narasimhan, EMNLP15] 附: Accepted PapersO网页链接

Jiwei Li (李纪为)近期工作: 1) 情感分析的反思 [Reflections on Sentiment/Opinion Analysis,arxiv15] 2) 用于短语和文档生成的层次神经自编码器LSTM [A Hierarchical Neural Autoencoder for Paragraphs and Documents,ACL15];有代码;可用于文档摘要 3) 其他O网页链接  Jiwei Li两篇文章已被#EMNLP15#录取:1)Do Multi-Sense Embeddings Improve Natural Language Understanding? 2)When Are Tree Structures Necessary for Deep Learning of Representations? 附: Accepted PapersO网页链接

【幻灯:情感分析概要】《Sentiment Analysis Essentials》by Bing Liu (2014) Document and Sentence Sentiment Classification/aspect-Based Sentiment AnalysisO网页链接云:O网页链接参阅:O爱可可-爱生活

【开源:(Go)情感分析API服务Sentiment Server】GitHub:O网页链接

【大数据如何帮助人工智能实现情感计算?】工智能的研究更要强调机器与人之间的感性化交互,强调情感计算。智能化的机器在满足人类需求的同时,还应让用户对其产生一种情感上的信任和依赖,而小冰目前就是这样一个“感性化的人工智能助手”。O网页链接

Deep Learning for NLP without Magic, NAACL 2013 Tutorial By Richard Socher and Christopher ManningO网页链接

【IPN:(Pandas/Scikit-Learn/Matplotlib)算法(DGA)生成域名的自动检测】《Exercise to detect Algorithmically Generated Domain Names》O网页链接参阅:O乌云知识库

【IPN:(Python)Bokeh仿Gapminder可视化实例教程】O网页链接  链接更新:O网页链接多谢@豆瓣迪卡斯提醒!

【Python上的NLP工具库汇总】《Python NLP Tools》NLTK/Pattern/TextBlob/Gensim/PyNLPl/spaCy/Polyglot/MontyLingua/BLLIP ParserO网页链接pdf:O网页链接  伯乐在线提供的译文《Python 自然语言处理(NLP)工具库汇总》O网页链接

《Python迭代器和生成器》在Python中,很多对象都是可以通过for语句来直接遍历的,例如list、string、dict等等,这些对象都可以被称为可迭代对象。至于说哪些对象是可以被迭代访问的,就要了解一下迭代器相关的知识了。O网页链接(作者:田小计划 )

【神经网络交互式介绍NeuroVis】《NeuroVis | An interactive introduction to neural networks》O网页链接

【“Python之父”Guido谈Python】O网页链接(分享自@一点资讯

《Python 开发者节省时间的 10 个方法》Python 是一个美丽的语言,可以激发用户对它的爱。所以如果你试图加入程序员行列,或者你有点厌倦C++,Perl,Java 和其他语言,我推荐你尝试Python.O网页链接(oschina 译)

3000+常用的Python模块代码 (有搜索功能):O网页链接【人生苦短,快用Python!】

【回归模型可信度评估方法】《Is Regression Trustworthy? Or How To Use Metrics To Trust The Prediction Of Regression》O网页链接

【分类器评价基础】《The Basics Of Classifier Evaluation》by Tom Fawcett "If it’s easy, it’s probably wrong." Part1.O网页链接

【维数灾难】《Curse of Dimensionality》O网页链接参阅:O爱可可-爱生活O爱可可-爱生活

【机器学习里的偏差vs.方差】《On the Bias/Variance tradeoff in Machine Learning》O网页链接参阅O爱可可-爱生活

【视频+代码:如何提高预测模型精度】《Techniques to improve the accuracy of your Predictive Models》by Phil BrierleyO网页链接云(视频):O网页链接pdf:O网页链接

【论文:(Science)可重用保留样本——保证自适应数据分析(推理)有效性】《The reusable holdout: Preserving validity in adaptive data analysis》C Dwork[Microsoft], V Feldman[IBM ARC], M Hardt[Google], T Pitassi[Toronto], O Reingold[Samsung], A Roth (2015)O网页链接  相关介绍《The reusable holdout: Preserving validity in adaptive data analysis》by Moritz HardtO网页链接《Preserving Validity in Adaptive Data Analysis》By Chris SciaccaO网页链接

【 基于Keras的QA实现(100+行代码)】其性能可与Facebook论文《Towards AI-Complete Question Answering: A Set of Prerequisite Toy Tasks》描述的方法相比 GitHub:O网页链接参阅O爱可可-爱生活  Reddit:O网页链接//@爱可可-爱生活: 相关说明文章《Question answering on the Facebook bAbi dataset using recurrent neural networks and 175 lines of Python + Keras》O网页链接  相关说明文章《Question answering on the Facebook bAbi dataset using recurrent neural networks and 175 lines of Python + Keras》O网页链接

【信息图:R语言数据分析常用包汇总】《List of useful packages (libraries) for Data Analysis in R》by Manish SaraswatO网页链接

【FAQ:R语言绘图十五问】《15 Questions All R Users Have About Plots》O网页链接

【机器视觉开源代码集合】O网页链接

【IPN:Tim Hopper的Dirichlet processes笔记系列文章】"IPython notebooks explaining Dirichlet Processes, HDPs, and Latent Dirichlet Allocation"O网页链接GitHub:O网页链接

【(GOV.UK)数据可视化指南】《Data visualisation - Creating valuable and meaningful graphics to help analyse data》O网页链接

【(Python/D3.js)LinkedIn关系图可视化】《Visualizing your LinkedIn graph》O网页链接

【Python 之 Python与MATLAB 作图小结】O网页链接

【Word2Vec/Gephi议会发言可视化分析】《Visualizing Parliamentary Discourse with Word2Vec and Gephi》by Kaspar BeelenO网页链接

【Python数据可视化利器:graph-tool】图和网络的统计分析及可视化库,C++实现核心算法,基于Boost图形库进行绘制,性能比igraph、NetworkX等高出不少,更重要的是,画出的图还很漂亮,社区、主题、趋势的分析可视化都很适合,推荐O网页链接

【(R)基于tabplot的大数据集可视化】《Visualization of large datasets with tabplot》O网页链接

【论文:数据驱动的ISIS(战略)挖掘分析】《Mining for Causal Relationships: A Data-Driven Study of the Islamic State》A Stanton, A Thart, A Jain… (2015)O网页链接BBC相关报道《Artificial intelligence decodes Islamic State strategy》O网页链接

【论文:(Science)可重用保留样本——保证自适应数据分析(推理)有效性】《The reusable holdout: Preserving validity in adaptive data analysis》C Dwork[Microsoft], V Feldman[IBM ARC], M Hardt[Google], T Pitassi[Toronto], O Reingold[Samsung], A Roth (2015)O网页链接  相关介绍《The reusable holdout: Preserving validity in adaptive data analysis》by Moritz HardtO网页链接《Preserving Validity in Adaptive Data Analysis》By Chris SciaccaO网页链接

【基于马尔可夫模型的文本生成】《Generating Text Using a Markov Model》O网页链接ipn(code):O网页链接MegaHAL:O网页链接参阅:O爱可可-爱生活

【用RNN学习/模仿莫奈作品】《Teaching recurrent Neural Networks about Monet》by Manuel GarridoO网页链接GitHub:O网页链接Reddit:O网页链接

【(char-rnn)用RNN生成CSS】"Training A Neural Net To Generate CSS"O网页链接

解决ad, item的Position Bias的参考方法 A User Browsing Model to Predict Search Engine Click Data from Past Observations.O网页链接

【Reddit上关于2015最酷机器学习想法的讨论】《What's the coolest machine learning idea so far in 2015?》O网页链接

【大数据分析的痛点】《Big Data Analytics Pain Points》O网页链接

【如何成为数据科学专家】《What it means to “go pro” in data science - A look at what it takes to be a professional data science programmer》O网页链接

【人工智能展望】《Future Of Artificial Intelligence》by Andrew TrabulsiO网页链接云:O网页链接

【数据科学博客推荐】《Data science blogs》O网页链接

【Reddit上最值得关注的数据科学话题大盘点】《Get Knowledge from Best Ever Data Science Discussions on Reddit》O网页链接

今天在组会上读了一遍由于提出把Pearson Correlation和Significant Test用在机器翻译质量预测上而获得ACL 2015最佳论文的文章。O网页链接根据我了解的情况,此论文争议比较大:有的人觉得贡献很大,最佳论文当之无愧。有的人不太感冒。你怎么看?

【论文:数据集选择】《Data Set Selection》D LaLoudouana, M Bonouliqui Tarare (2003) "to improve the presentation of algorithms in literature and to make them more appealing"O网页链接

【开放数据:(1.6TB)暗网市场数据集(DNM)(2013-2015)】《Black-Market Archives》O网页链接

【Hacker News数据集(stories/comments)】"Grey Panther's Hacker News Archiver"O网页链接Torrent:O网页链接

【五个"怪异"又奇妙的数据集】《5 Weird and Wonderful Data Sets You Can Use》The MOMA Art Collection/The Gutenberg Project/The Enron Emails/FEC Campaign Finance Data/Diaries of the Royal Secretariat from the Joseon DynastyO网页链接

【Kaggle新手技巧】《Kaggle Beginner Tips》O网页链接文中提到视频请参阅:O爱可可-爱生活

【赢取Kaggle竞赛的10点提示】《How To (Almost) Win Kaggle Competitions》O网页链接Slide:O网页链接参阅:O爱可可-爱生活O爱可可-爱生活

【Kaggle代码:Kaggle's Flavours of Physics竞赛粒子衰变数据t-SNE聚类可视化】"t-SNE Embedding of tau -> 3 mu events"O网页链接参阅:O爱可可-爱生活

【(Kaggle优胜方案)论文+代码:ANN出租车目的地预测】《Artificial Neural Networks Applied to Taxi Destination Prediction》A Brébisson, É Simon, A Auvolat, P Vincent, Y Bengio (2015)O网页链接Code:O网页链接参阅O爱可可-爱生活

【论文+视频:根据手机拍摄视频的动态三维"阿凡达"效果合成】《Dynamic 3D Avatar Creation from Hand-held Video Input》A Ichim, S Bouaziz, M Pauly (SIGGRAPH 2015)O网页链接HomePage:O网页链接云(视频):O网页链接

#周末福利#用Python玩转大数据:网络爬虫。L用Python玩转大数据:网络爬虫

【开源:天气/气候数据可视化支持库SciTools(Iris/Cartopy)】O网页链接

【Python数据可视化利器:graph-tool】图和网络的统计分析及可视化库,C++实现核心算法,基于Boost图形库进行绘制,性能比igraph、NetworkX等高出不少,更重要的是,画出的图还很漂亮,社区、主题、趋势的分析可视化都很适合,推荐O网页链接  graph-tool的主要用途不在于数据可视化啊,翻译成中文应该是“图论工具包”,是一堆封装好的图论算法的实现模块,和networkx的主要区别是用了boost的库(networkx是纯python实现的),所以速度上快了不少,po主这样写标题会误导的呀

【Python绘制地图(信息图)】《Working with maps in Python》O网页链接

【R语言重现Tufte可视化效果】《Tufte in R》by Lukasz PiwekO网页链接

【论文+代码:生成式矩匹配网络(GMMNs)】《Generative Moment Matching Networks》Y Li, K Swersky, R Zemel [University of Toronto] (ICML2015)O网页链接GitHub:O网页链接  GitXiv:O网页链接Y Li的gmmn主页:O网页链接

【IPN:混合密度网络MDN】《Mixture Density Networks》by KarpathyO网页链接

【流处理/无界数据处理核心概念解析】《The world beyond batch: Streaming 101 - A high-level tour of modern data-processing concepts》by Tyler AkidauO网页链接

对函数式编程的一点理解 (@nixzhu)O网页链接更多:O网页链接《码农周刊》官方客户端下载地址:O网页链接

[1508.01211] Listen, Attend and SpellO网页链接跳过音素直接把语音识别为字符且不需CTC的完整模型,用到了金字塔双向LSTM和注意力机制,合成了约4万小时音频,在Google DistBelief上至少跑了俩星期,最后还加上语言模型。技术是真先进,可惜最后没达到state-of-art

SLAM系统的研究点介绍:O网页链接。分5个部分:Basic Theory(基础理论:滤波器和优化方法)、Sensor(传感器:激光传感器、深度相机等)、Mapping(建图:路标地图、拓扑地图、度量地图、混合地图)、Loop Detection(回环检测)、Advanced Topic(动态场景、语义地图、多机器人协作)

RT@视觉机器人Kinect视觉SLAM技术介绍:O网页链接。本文介绍SLAM的历史、理论以及实现的方式,且主要介绍基于视觉(Kinect)的实现方式,包括Kinect数据、坐标转换、端优化理论、闭环检测等。

【数说·大数据圈】当我们谈论“细分”(segmentation)的时候我们在谈论什么?我们经常听到一些创业者说,“我做的这个产品主要面向XX客户”,不同的客户群之间存在很大差异。一个“细分”,决定了公司的战略和发展方向。而细分正是我们数据科学家们索要解决的问题之一。O【数说·大数据圈】当我们谈论“细分”(segmentation)的时候我们在谈论什么

大数据思维的十大原理:当数量够大,其实每个人都是一样O网页链接

Neural Translation Online Demo by LISA Lab  O网页链接 demo的github地址,也就是groundHog:O网页链接

【幻灯:面向NLP的统计机器学习(130+页)】《Statistical Machine Learning for NLP》by Xiaojin Zhu (2013) Graphical Models/Bayesian Non-Parametric ModelsO网页链接云:O网页链接

【论文:(Graph/Random Walk)社交媒体争议话题量化分析(检测)】《Quantifying Controversy in Social Media》K Garimella, GDF Morales, A Gionis, M Mathioudakis (2015)O网页链接  MIT Technology Review报道《This Is What Controversies Look Like in the Twittersphere》O网页链接

【课程资料:(Harvard)可视化】《CS 171 - Visualization》by Alexander LexO网页链接Video:O网页链接Slides:O网页链接Resources:O网页链接

【Bokeh的R语言接口rbokeh】O网页链接GitHub:O网页链接

【面向统计计算的Scala/Breeze简介】《Brief introduction to Scala and Breeze for statistical computing》by darrenjwO网页链接

【论文:网络百科随机游走】《Random Surfers on a Web Encyclopedia》F Geigl, D Lamprecht, R Hofmann-Wellenhof… (2015)O网页链接

avazu移动广告点击率预测比赛文档分享:Orandom walkers solution.pdf。欢迎大家一起讨论研究。

推荐系统大会 RecSys 2015 accepted papers "List of papers accepted for RecSys 2015O网页链接

【SIGIR2015论文集】"SIGIR '15- Proceedings of the 38th International ACM SIGIR Conference on Research and Development in Information Retrieval"O网页链接

【实时流数据分析模式】《Patterns for Streaming Realtime Analytics》by Srinath PereraO网页链接云(Slide):O网页链接GitHub:O网页链接

【Kafka、Samza与分布式(流)数据处理的Unix哲学】《Apache Kafka, Samza, and the Unix Philosophy of Distributed Data》by Martin KleppmannO网页链接

【论文+代码+数据:视频小样本识别/事件检测多媒体嵌入方法VideoStory】《VideoStory: A New Multimedia Embedding for Few-Example Recognition and Translation of Events》A Habibian, T Mensink, C Snoek (MM2014)O网页链接Data+Code:O网页链接GitXiv:O网页链接

【(Python)GoogLeNet逐层可视化】《Deep dream: Visualizing every layer of GoogLeNet》O网页链接  继“Visualizing GoogLeNet Classes” (O网页链接O网页链接O网页链接)之后又一篇博文+代码 (O网页链接)。

【GoogLeNet作画】《Drawing with GoogLeNet》O网页链接

【开放数据:社会动态全球数据项目GDELT】"GDELT - A Global Database of Society - ...monitors the world's broadcast, print, and web news from nearly every corner of every country in over 100 languages..."O网页链接

【(R)交互界面Shiny速查】《Interactive Web Apps with shiny Cheat Sheet》O网页链接

【IPN:Spark DataFrames实例介绍】《Getting Started with Spark DataFrames》O网页链接

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,390评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,821评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,632评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,170评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,033评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,098评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,511评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,204评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,479评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,572评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,341评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,213评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,576评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,893评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,171评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,486评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,676评论 2 335

推荐阅读更多精彩内容