240 发简信
IP属地:湖北
  • 120
    数据挖掘识别招聘平台招聘诈骗黑产

    一、项目背景 2017年8月,“李文星遭BOSS直聘求职诈骗误入传销死亡”事件,让网络求职诈骗第一次大规模曝光在大众视野范围内。此后,网络招聘平台的高薪高待遇诈骗、培训贷诈骗...

  • 120
    数据分析之SQL面试题

    作为数据分析师,使用的最多的莫过于SQL语句,这里拿几道典型的SQL面试题为例,学习一下数据库知识。自己搭建MySQL服务器太麻烦,可以使用在线数据库 发现sqlzoo是个不...

  • 120
    Kmeans聚类 - 旅游企业客户洞察案例

    1.案例说明 一般案例客户聚类分析流程(个人理解) 提取客户消费行为变量 对提取的行为变量进行正态化(使聚类结果更有商业解读意义),和Z-score处理(消除纲量) 对处理后...

  • 120
    Pyspark DataFrame基础

    1.读取csv 2. 查看字段类型 同pandas [('PassengerId', 'int'),('Survived', 'int'),('Pclass', 'int')...

  • Pyspark DataFrame读写

    1. 连接本地spark 2. 创建DataFrame 2.1 从变量创建 2.2 使用自动类型推断的方式创建dataframe 2.3 读取json文件 2.4 读取csv...

  • 120
    决策树-网球运动员排名分析

    1.案例说明 数据来源狗熊会,数据完整,无缺失值,错误值通过网球运动的技术指标探究运动员的技术水平对世界排名的影响 2.变量修改及探索性分析 读取数据 男性运动员数据 男性运...

  • 120
    逻辑回归-泰坦尼克号获救问题

    1.案例说明 通过已知获救数据,预测乘客生存情况 2.查看数据 3.数据预处理 其中Age,Cabin,Embarked有缺失值Age变量缺失率19%,填充中位数Cabin缺...

  • 120
    多元线性回归 - 北京高档酒店价格影响因素分析

    1. 案例说明 通过收集相关网站对酒店评价,poi地理数据,和酒店自身介绍探索影响酒店入住价格的因素数据来源:狗熊会 2.变量分析探索 查看酒店价格分布,酒店价格集中在100...

  • 120
    Python决策树可视化,并显示中文

    生成可视化决策树代码 错误解决方式 下载安装GraphViz(这是一个独立软件)https://graphviz.gitlab.io/_pages/Download/Down...

  • 120
    Mysql 所遇问题汇总

    1. mysql不是内部或外部命令 安装Mysql后,当我们在cmd中敲入mysql时会出现‘Mysql’不是内部或外部命令,也不是可运行的程序或其处理文件 解决方案:控制面...

  • 120
    个人贷款违约预测模型

    案例背景 案例来源《python数据科学:技术详解与商业实践》数据下载地址该案例使用一套来自某银行真实数据集构建贷款违约预测模型 本案例遵循数据挖掘项目通用流程CRISP-D...

  • 120
    聚类分析-航空公司客户价值分析

    1. 案例背景 国内某航空公司面临客户流失,竞争力下降和航空资源未充分利用等经营危机。 通过建立合理的客户价值评估模型,对客户进行分群,分析比较不同客户群的客户价值,并制定相...

  • 120
    聚类分析典型应用

    1. 聚类分析的典型应用场景 聚类分析的一个重要用途就是针对目标群体进行多指标的群体划分,类似这种目标群体的分类就是精细化经营,个性化运营的基础和核心,只有进行了正确的分类,...