240 发简信
IP属地:黑龙江
  • Scikit-learn使用总结

    在机器学习和数据挖掘的应用中,scikit-learn是一个功能强大的python包。在数据量不是过大的情况下,可以解决大部分问题。学习使用scikit-learn的过程中,...

  • 时间序列分析

    时间序列简介 时间序列分析是数据分析过程中,尤其是在金融数据分析过程中会经常遇到的。时间序列,就是以时间排序的一组随机变量。例如国家统计局每年或每月定期发布的 GDP 或 C...

  • 240
    分类与预测

    常见的分类算法 感知机 感知机是神经网络以及支持向量机的基础。通过w*x + b = 0这样一条直线将二维空间划分为两个区域,落在这两个区域中的点被归为正类和负类。感知机的学...

  • 240
    了解数据

    数据收集及读取 数据收集 数据接口 -- 一些网站有API接口,通过相应的API请求方式就能获取到想要的数据,一般情况下数据会非常规范,完整。 数据库 -- 需要得到授权。 ...

  • 240
    matplotlib

    matplotlib基础 matplotlib是面向对象的绘图工具包,绘制的图形中的每一个元素都是一个对象,可以修改这些对象的属性,从而改变图样式。 matplotlib中主...

  • Pandas处理json文件

    用Pandas读取json文件,截取其中一段json文件如下图: 编写一个解析并统计学习数据的函数,统计user_id的总学习时间和学习次数。 用pandas.read_js...

  • Pandas

    Pandas建立在NumPy基础上,处理二维数据更加得心应手。 Series和DataFrame Series和DataFrame是Pandas中的两种核心数据结构,大部分P...