240 发简信
IP属地:上海
  • 概率题

    1. 抛硬币游戏 两个人玩抛硬币的游戏,谁先抛到正面就获胜。那么先抛的人获胜概率为多少? 思路一:把A、B都抛硬币一次看成一局游戏。情况1: A第一次抛正面 -> A胜 p=...

  • 数据仓库

    1. 范式 1.1 函数依赖 完全依赖通过AB能得出C,但是AB单独得不出C,那么说C完全依赖于AB 部分依赖通过AB能得出C,通过A也能得出C,或者通过B也 能得出C,那么...

  • 120
    Flink

    1. Flink的CheckPoint存在哪里? 默认情况下,State会保存在TaskManager的内存中,CheckPoint会存储在JobManager的内存中。St...

  • 120
    SQL

    1. posexplode reference: https://www.jianshu.com/p/d333e70c21d1[https://www.jianshu.com...

  • 二叉树的遍历

    相信只要了解过二叉树,都知道二叉树的3种遍历方式:前序遍历、中序遍历、后序遍历。甚至不夸张的说,其递归的遍历方法闭着眼睛也能写出来。所以本篇意不在记录其递归的写法,而是探寻其...

  • 120
    并查集

    (本来想写个并查集的文章,发现这一篇写得很好,就直接摘抄过来了,也做个记录【union-find[https://github.com/azl397985856/leetco...

  • 120
    最小生成树算法

    什么是生成树? 连通无向图中的所有顶点且任意两个顶点间只有一条通路的子图。生成树中边的数量 = 顶点数 - 1。如下图均为生成树。 什么是最小生成树? 最小生成树是指所有生成...

  • IDEA打包jar的pom.xml配置

    使用IDEA创建spark项目,会用到 pom.xml的配置,现简单做个记录。 1. 固定部分 当我们创建好项目时,会默认生成pom.xml,其中有部分是不需要我们手动更改的...

  • leetcode - 动态规划 - Part3

    121. 买卖股票的最佳时机[https://leetcode-cn.com/problems/best-time-to-buy-and-sell-stock/] 题目描述 ...

  • 120
    leetcode - 动态规划 - Part4

    377. 组合总和 Ⅳ[https://leetcode-cn.com/problems/combination-sum-iv/] 题目描述 题目分析:由于数组中的数字可以重...

  • leetcode - 单调栈

    496. 下一个更大元素 I[https://leetcode-cn.com/problems/next-greater-element-i/] 题目描述 暴力解法最容易想到...

  • 滑动窗口最大值

    239. 滑动窗口最大值[https://leetcode-cn.com/problems/sliding-window-maximum/] 题目描述 提到滑动窗口,首先便想...

  • 10. 大数据基础

    1. shuffle 过程 https://blog.csdn.net/zpf336/article/details/80931629[https://blog.csdn.n...

  • 算法面试知识点

    1. 模型的评估 精确率、召回率;、;[宏精确率、宏召回率、微精确率、微召回率] 、、;[代码敏感错误率、代价曲线] 不平衡样本的处理 偏差与方差、偏差与方差分解(推导过程)...

  • groupByKey、reduceByKey、aggregateByKey区别

    三者都可以做分组操作。reduceByKey、aggregateByKey不但分组还做了聚合操作 groupByKey直接进行shuffle操作,数据量大的时候速度较慢。 r...

  • RDD、Dataframe、Dataset的异同

    1. 三者之间的关系 DataFrame是特殊的RDD(它相当于RDD+schema,即RDD+表信息),可以将他看成数据库中的一张数据表,但是只知道这个"表"中的各个字段,...

  • leetcode - 动态规划 - Part2

    198. 打家劫舍 题目描述 分析求解因为不能同时偷窃相邻的两间房屋,当我们考察第 间房屋的时候,能偷到的总体金额和前面 间房屋能偷取的金额有关,因其状态转移能从 任何...