作为大数据和机器学习的入门材料,这本书是一本经典的材料,大黄通过safari online book账户开始阅读本书的原版电子版并记录一些笔记以供之后回看。本书同时也有中文版,书名为集体智慧编程。这里先贴一小段豆瓣上的内容简介:
《集体智慧编程》以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web 上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web 网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。
《集体智慧编程》是Web 开发者、架构师、应用工程师等的绝佳选择。
本书吸引大黄的另一点就是编程的实例颇多,阅读可与实践结合,加深理解,从第一章中了解到书中使用的是python, 所以