240 发简信
IP属地:江苏
  • Python机器学习之交叉验证

    交叉验证是一种非常常用的对于模型泛化能力进行评估 方法,交叉验证既可以解决数据集的数据量不够大问题,也可以解决参数调优的问题。常用的交叉验证方法...

  • Python二维数组转为一维数组的四种方法

    二维数组转为一维数组 1.列表推导式 2. itertools 3.sum小技巧 4. operator 列表推导式参:《Python列表推导式...

  • Resize,w 360,h 240
    机器学习之特征工程

    一、哑变量 关于哑变量,这篇博文写的很好,相关概念可以参阅:《机器学习总结之——Dummy Coding(哑变量)》[https://blog....

  • Resize,w 360,h 240
    聚类算法

    分类是算法基于已有标签的数据进行学习并对新数据进行分类,而聚类则是在完全没有标签的情况下,有算法“猜测”哪些数据像是应该“堆”在一起的,并且让算...

  • Resize,w 360,h 240
    PCA和NMF

    主成分分析(Principal Component Analysis,PCA)是最常用的一种降维方法,通常用于高维数据集的探索与可视化,还可以用...

  • Resize,w 360,h 240
    数据预处理

    使用 make_blobs 生成数据集,指定样本数据量 n_samples=40,分类 centers=2,随机状态 random_state=...

  • Resize,w 360,h 240
    Python机器学习之神经网络手写识别

    引言 使用现成的 MNIST 数据集训练图像识别,包含 70000 个手写数字图像,其中 60000 个是训练数据,另外 10000 个是测试数...

  • Resize,w 360,h 240
    Python机器学习之神经网络MLP

    引言 MLP算法,也叫前馈神经网络或多层感知器。关于MLP网上有很多,可以参考,比如《神经网络基础-多层感知器(MLP)》[https://bl...

  • SVM算法项目实践---波士顿房价回归分析

    引言 采用波士顿房价数据,因为SVM算法对数据预处理 要求较高,房价数据特征量级差异大,因此需要进行预处理 代码 执行结果 注释: 《Sklea...