b0f1f120aecc - 简书

发简信

b0f1f120aecc

88
关注
3
粉丝
0
文章
0

字数
0

收获喜欢

IP属地：广东

b0f1f120aecc

Hive优化(五)-避免数据倾斜
1.数据倾斜什么是数据倾斜在单个节点任务所处理的数据量远大于同类型任务所处理的数据量,导致该节点成为整个作业的瓶颈，这是分布式系统不可能避免的问题。从本质上说，导致数据倾...

bigdata张凯翔
2368 0 11
b0f1f120aecc

Apache Flink 进阶（一）：Runtime 核心机制剖析
简介： Flink 的整体架构如图 1 所示。Flink 是可以运行在多种不同的环境中的，例如，它可以通过单进程多线程的方式直接运行，从而提供调试的能力。它也可以运行在 Ya...

bigdata张凯翔
1524 0 3

b0f1f120aecc

tracy_668
写了 2058439 字，被 1003 人关注，获得了 2604 个喜欢
b0f1f120aecc

Spark SQL简介
Spark SQL是Spark生态系统中非常重要的组件，其前身为Shark。Shark是Spark上的数据仓库，最初设计成与Hive兼容，但是该项目于2014年开始停止开发，...

tracy_668
557 0 2
b0f1f120aecc

从0到1搭建大数据平台
大数据时代这个词被提出已有10年了吧，越来越多的企业已经完成了大数据平台的搭建。随着移动互联网和物联网的爆发，大数据价值在越来越多的场景中被挖掘，随着大家都在使用欧冠大数据，...

数据社
1027 0 13
b0f1f120aecc

姜小明同学
写了 20829 字，被 28 人关注，获得了 364 个喜欢
b0f1f120aecc

mysia
写了 158435 字，被 244 人关注，获得了 168 个喜欢

b0f1f120aecc

高质量的数据分析之七种数据库的对比
摘要：在数据分析中，我们可能需要使用各种数据库，目前大概有七种常用数据库，包括4种常用的关系型数据库，3种常用NoSQL数据库(NoSQL = Not Only SQL 泛...

我们都很努力着
10729 0 6
b0f1f120aecc

我们都很努力着
写了 53766 字，被 141 人关注，获得了 466 个喜欢

万丈红尘三杯酒，千秋大业一壶茶
b0f1f120aecc

宋懵懵的数据生活
写了 0 字，被 322 人关注，获得了 521 个喜欢

一个特立独行的数据分享者！
b0f1f120aecc

spark面试题
1、rdd有哪些算子？主要分为转换算子和action算子。 transformation：map、filter、flatmap、mappartitions、union、...

becooner
505 0 1
b0f1f120aecc

becooner
写了 13200 字，被 4 人关注，获得了 5 个喜欢

jennie的现男友，未公开。

b0f1f120aecc

2020数据库面试题
索引 1. 那你能说说什么是索引吗？索引其实是一种数据结构，能够帮助我们快速的检索数据库中的数据 2. 那么索引具体采用的哪种数据结构呢？常见的MySQL主要有两种结构：...

Tim在路上
440 1 10
b0f1f120aecc

Tim在路上
写了 482242 字，被 872 人关注，获得了 1325 个喜欢

抓住生活的蝉<br><br>欢迎关注公众号：Tim在路上<br>欢迎关注知乎账号：天天来了
b0f1f120aecc

从源码解密spark内存管理
内存不过是计算机分级存储系统中的靠近cpu的一个存储介质。1.spark运行起来内存里都存的啥？2.如何管理里面所存的东西？3.spark用java和scala这样的jvm语...

曾二爷耶
1086 0 9
b0f1f120aecc

hive调优实战系列文章-hive调优和问题排查思路
本文将介绍Hive调优的整体过程，以及本人对Hive调优过程的一些思考，包括Hive调优的一般步骤，和调优方法。 1，Hive一般优化方法 1，查看HiveSQL执行计划 H...

数据的艺术2
436 0 5
b0f1f120aecc

hive
数据的艺术2 编，4 篇文章，1 人关注

b0f1f120aecc

hive调优实战系列文章-hive数据准备
本文主要讲解利用python 生成hive数据，主要包括python数据生成，数据上传hdfs，hive建库建表，hive导入数据，hive验证数据的正确性。 hive建库建...

数据的艺术2
391 2 7
b0f1f120aecc

数据的艺术2
写了 9671 字，被 13 人关注，获得了 31 个喜欢
b0f1f120aecc

大数据之Hive03-分区partition详解（静态分区，动态分区）
一、前言 Hive分区是为了方便数据管理Hive的分区方式：由于Hive实际是存储在HDFS上的抽象，Hive的一个分区名对应一个目录名，子分区名就是子目录名，并不是一个实际...

数据蝉
758 0 9

暂无个人介绍