240 发简信
IP属地:天津
  • 120
    异常检测Task5

    高维数据异常检测 背景 在实际场景中,很多数据集都是多维度的。随着维度的增加,数据空间的大小(体积) 会以指数级别增长,使数据变得稀疏,这便是维度诅咒的难题。维度诅咒不止给异...

  • 120
    异常检测Task4

    基于相似度的方法 基于距离的度量 基于密度的度量 概述 “异常”通常是一个主观的判断,什么样的数据被认为是“异常”的,需要结合业务背景和环境来具体分析确定。   实际上,数据...

  • 异常检测Task3

    线性模型 基本介绍 真实数据集中不同维度的数据通常具有高度的相关性,这是因为不同的属性往往是由相同的基础过程以密切相关的方式产生的。这在古典统计学中被称为统计建模 一类相关性...

  • 异常检测Task2

    基于统计学的方法 参数方法 假定数据由一个以为参数的参数分布产生,然后利用已知数据求出分布里参数的估计(MLE),这样就得到了概率密度函数。判断新的数据是不是异常点时,将数据...

  • 异常检测Task1

    异常检测常用方法 基于统计学的方法统计学方法对数据的正常性做出假定。它们假定正常的数据对象由一个统计模型产生,而不遵守该模型的数据是异常点。统计学方法的有效性高度依赖于对给定...

  • SQL-Task06

    1.各部门工资最高的员工(难度:中等) 注意:使用group by的时候,出现在select后面的字段,要么是是聚合函数中的,要么就是group by 中的字段比如错误答案:...

  • 120
    SQL-Task05

    窗口函数 窗口函数也称为OLAP函数。OLAP 是OnLine AnalyticalProcessing 的简称,意思是对数据库数据进行实时分析处理。 为了便于理解,称之为窗...

  • SQL-Task04

    1.表的加减法 集合在数据库领域表示记录的集合.具体来说,表、视图和查询的执行结果都是记录的集合, 其中的元素为表或者查询结果中的每一行.加法:UNION(并集) UNION...

  • 120
    SQL-Task03

    主键(PRIMARY KEY)的理解 这种主键里有两个列时叫组合键,用来唯一确定每一行数据,意思是这两种变量的各个水平组合只能出现一次(因为单独使用商店编号(shop_id)...

  • 120
    SQL-Task02

    Task02 1.SELECT语句 符号*代表全部列设定汉语别名需要用双引号""括起来 在SELECT语句中使用DISTINCT可以删除重复行。 希望选取NULL记录时,需要...

  • 120
    SQL-Task00&01

    Task00 在win10下安装MySQL,根据步骤进行安装即可 安装好之后,使用MySQL Workbench连接MySQL,根据步骤进行设置。设置完成后就可以在里面写SQ...