240 发简信
IP属地:上海
  • 《我和我的家乡》2020-10-07

    刚刚看完我和我的家乡,感觉还不错哈~主要讲了:1.北京-《北京好人》医保问题(没有买医保,导致看病贵,蒲公英那段是很多家庭的真实写照)2.贵州-...

  • Redis 面试

    1 redis 的工作原理 答: redis 是一个 k-v 存储系统和 memcached 类似,它支持存储的value 类型相对的多,包括 ...

  • Resize,w 360,h 240
    数据仓库-Hive

    数据仓库(Data Warehouse ) 1.1 基本概念 数据仓库的目的是构建面向分析的集成化的数据环境, 为企业提供决策支持 (Decis...

    2.6 1545 0 19
  • Resize,w 360,h 240
    SparkStreaming

    大纲 1.SparkStreaming 介绍2.SparkStreaming 原理与架构3.DStream 介绍4.DStream 相关操作5....

  • Resize,w 360,h 240
    spark的shuffle 和原理分析

    1. 概述 shuffle 就是对数据进行重组,由于分布式计算的特性和要求,在实现细节上更加繁琐和复杂.在 MapReduce框架,Shuffl...

  • Resize,w 360,h 240
    Spark_day04

    RDD的 Shuffle 和 分区 RDD的分区操作2.Shuffle 的原理 分区的作用 RDD 使用分区来分布式并行处理数据,并且要做到尽量...

  • Resize,w 360,h 240
    Spark_day06

    1.新建一个文件夹,并放入我们的winutils.exe文件. 2. 我们把这个路径写上去就好了. 3. 目前的结构 4. 这是mode 和 我...

  • Resize,w 360,h 240
    2019-08-05

    Spark core Insight 1.深入理解 RDD 的内在逻辑 能够使用 RDD 的 算子 理解 RDD 算子的 Shuffle 和 缓...

  • Resize,w 360,h 240
    Spark_day01

    1.1 Spark 是什么 Apache Spark 是一个快速的,多用途的集群计算系统,相当于Hadoop MapReduce ,Spark ...

个人介绍
什么大数据橙子小哥