4.9 更多关于k近邻算法的思考 K近邻算法是解决分类问题,天然可以解决多分类问题。不仅如此,思想简单,效果强大。使用K近邻算法还可以解决回归问...
4.8 scikit-learn中的Scaler 上节讲了数据归一化,但是真正用到机器学习算法中的时候,一个注意事项就是,之前将原始数据集拆分成...
4.6网格搜索与k近邻算法中更多的超参数 关于网格搜索,sklearn为我们提供了一个方法,叫Grid Search在使用它之前,我们首先要定义...
数据归一化 Feature Scaling 首先我们开看一下为什么要进行数据归一化。我们使用前边说道的肿瘤的例子: 那么这两个样本的距离是多少呢...
4.5 超参数 超参数就是指在运行机器学习算法之前,需要指定的参数。 模型参数:算法过程中学习的参数。 KNN算法没有模型参数,k是典型的超参数...
4.1 K近邻算法 思想极度简单 应用数学知识少 可以解释机器学习算法使用过程中的很多细节问题 更完整的刻画机器学习的应用流程 K近邻算法的...
3.9 Numpy中的比较和Fancy Indexing Fancy Indexing 运行结果为:array([ 0, 1, 2, 3,...
4.2 scikit-learn中的机器学习算法的封装 新建文件夹myscript,创建KNN.py 在jupyter中调用封装好的knn方法,...
4.3训练数据集、测试数据集 1.判断机器学习算法的性能 测试我们的算法 train_test_split 将原始数据集拆分成两部分,一部分是训...