240 投稿
收录了13篇文章 · 13人关注
  • Resize,w 360,h 240
    数读小米2018财报——使用Dash构建数据报告

    1 项目说明   本项目是基于 Dash 开发的一个演示项目,对小米集团 2018 年的财报,进行了简单的解读,其界面如下:   共包括 5 部...

  • Resize,w 360,h 240
    苏轼的朋友圈——基于 networkx 进行社交网络分析(SNA)

      社交网络分析方法(Social Network Analysis, SNA),是由社会学家根据数学方法、图论等发展起来的定量分析方法。历史学...

    1.9 Gaius_Yao 1 19
  • Resize,w 360,h 240
    鸢尾花(iris)数据集分析

      Iris 鸢尾花数据集是一个经典数据集,在统计学习和机器学习领域都经常被用作示例。数据集内包含 3 类共 150 条记录,每类各 50 个数...

    4.3 Gaius_Yao 9 58
  • Resize,w 360,h 240
    网易云评论爬虫及情感分析

    1.1 API 分析   网易云音乐的评论区一直为人们所津津乐道,不少人因其优质的评论被圈粉。近日看到篇通过 SnowNLP 对爬取的云音乐评论...

    0.9 Gaius_Yao 5 15
  • Resize,w 360,h 240
    轻量级BI工具Superset的搭建与使用

    系统环境:Windows 10Python:3.6.6Superset:0.27.0 0 Superset 简介   Superset 是一款由...

    9.6 Gaius_Yao 16 118
  • Resize,w 360,h 240
    LSI 和 LDA 提取川普推特主题

      川普号称“推特治国”,这个数据集收集了川普 2015 年 7 月到 2016 年 11 月七千余条推特的内容,并尝试使用 LSI 和 LDA...

  • 简明 jieba 中文分词教程

    0 引言   jieba 是目前最好的 Python 中文分词组件,它主要有以下 3 种特性: 支持 3 种分词模式:精确模式、全模式、搜索引擎...

    6.2 Gaius_Yao 3 82
  • Resize,w 360,h 240
    分析了上千个谷歌职位,发现...

    0 引言   Google 通过其招聘网站发布了大量的职位,这些数据有助于我们了解当今互联网巨头之一的 Google 需要怎么样的人才,也从一...

  • Resize,w 360,h 240
    分析星球大战正传剧本

    0 引言   星球大战是一部伟大的电影,讲述了一段在遥远的银河发生的故事,对世界流行文化影响深远。Kaggle 上有星球大战正传三部曲的剧本,虽...

  • Resize,w 360,h 240
    拉勾爬虫实战

    0 引言   一次简单的 Python 爬虫练习:输入 目标城市 和 目标职位,从 拉勾网 爬取相关的职位列表数据(受拉勾网的展示机制限制,只能...

专题公告

分享在学习 Python数据科学 过程中的点滴