sklearn介绍
sklearn,全称scikit-learn,是一个开源的基于python语言的机器学习工具包。它通过numpy、scipy、matplotlib、pandas等python库实现高效的算法应用,涵盖了几乎所有主流机器学习算法。
在工程中,用python的基础库来搭建机器学习算法非常低效(但还是推荐在学习阶段使用基础库去搭建机器学习算法,可以进一步深入算法),且还容易出错,而在机器学习中经常大部分时间(70%)是在对数据进行处理,构建合格的数据集,只有少部分时间在构建模型代码,直接调用成熟算法工具包,可以在实现工程应用效率和效果之间找到一个平衡,这也正是sklearn带给我们的优势。
sklearn有一个完整而丰富的官网,里面详细讲解了skLearn实现的算法数学原理、优化方式和简单应用,是一套非常优秀的文档,我相信在学习阶段仔细查阅官网文档会收获颇丰!!
下面我提供sklearn的官方文档链接,由于原文是英文的,我还提供了第三方的中文文档。