杨杨_f97a - 简书

发简信

杨杨_f97a

1
关注
5
粉丝
16
文章
6262

字数
5

收获喜欢
0

总资产

IP属地：广东

杨杨_f97a

hive更新UDF的正确步骤
1. 删除原函数和jar包 1.1 在hive窗口e中执行删除原函数 1.2 在beeline中执行删除jar包 1.3 从hdfs上删除jar包 2 重新上传jar包，注册...

2815 0 1
杨杨_f97a

在CDH环境集成Hudi
一、Hudi简介 Hudi是Hadoop Updates and Incrementals的缩写，用于管理HDFS上的大型分析数据集存储，主要目的是高效的减少入库延时。Hud...

5863 0 1

杨杨_f97a

MongoDB数据增量同步到Hive（方案二通过MongoSpark）
一、背景本文续接上文 MongoDB数据增量同步到Hive（方案一通过BSON文件映射）[https://www.jianshu.com/p/ebc96cf0cabe]考...

1753 1 1
杨杨_f97a

MongoDB数据增量同步到Hive（方案一通过BSON文件映射）
一、背景随着monggo中数据量越来越大，全量同步到数仓，已不太现实，考虑增量同步的方式，我们在探索增量同步的过程中，方案不断在改进优化，这里记录一下我们mongo增量同步...

2704 4 0 1
杨杨_f97a

mysql数据增量同步到hive
一、背景同步业务库的数据到ODS层，之前一直是全量同步数据，主要考虑IO太大，耗时太长，重复拉取同样的数据，现在考虑增量同步的方式实现，同时对库表数据做分区。二、同步方案...

2936 0 1
杨杨_f97a

生信石头
写了 558061 字，被 9888 人关注，获得了 7237 个喜欢
杨杨_f97a

Spark高级编程之TopN及分组TopN
1、获取文本内最大的前三个数字输入数据： 3544426732133542313523733216782156 1）Java版top3：输出结果： [133, 78, 73...

1264 0 0

杨杨_f97a

Spark高级编程之二次排序
原始数据： 2 63 71 52 43 61 32 13 1 1、Java版二次排序首先定义排序的key 然后实现二次排序 2、Scala版二次排序首先定义排序的key 然后...

338 0 0
杨杨_f97a

RDD讲解
1、RDD的创建的三种方式1）使用程序中的集合创建RDDjava版代码如下： scala版代码如下： 2）使用本地文件创建RDDwordcount就是例子3）使用HDFS文件...

332 0 0
杨杨_f97a

提交wordCount程序到spark集群上运行
1、Java版wordCount1）Java代码： 2)打包代码上传到服务器 3）上传文件到hdfs上去 4)使用spark-submit提交这里的输入路径和输出路径可以不...

296 0 0
杨杨_f97a

Actor入门
Actor就是Scala中的多线程编程，Actor尽可能避免锁和共享状态，从而避免多线程并发时出现资源争用的情况，进而提升多线程的性能。此外，Actor的这种模型还可以避免死...

311 0 0
杨杨_f97a

Scala中的隐式转换和隐式参数
Scala提供的隐式转换和隐式参数功能，允许你手动指定，将某种类型的对象转换成其他类型的对象，通过这些功能，可以实现非常强大而且特殊的功能。scala的隐式转换，最核心的就是...

233 0 0

杨杨_f97a

Scala中trait相关知识和应用
1、trait基础知识1-1 将trait作为接口使用运行结果： Hello,JackHello,my name is leo,your name is Jack 1-2 ...

528 0 0
杨杨_f97a

scala的模式匹配
模式匹配是scala中非常有特色，非常强大的一种功能，模式匹配其实类似与Java中的switch case语句，即对一个值进行判断，然后针对某种条件，采取不同的处理。但是Sc...

197 0 0
杨杨_f97a

NumPy的操作与运算
基本操作 1、数组上的算术运算符会应用到元素级别运行结果：[ 9.12945251 -9.88031624 7.4511316 -2.62374854][ True...

323 0 0
杨杨_f97a

matplotlib.pyplot画象棋棋盘
目前很简易，后期会不断完善，棋盘的代码如下：运行结果：未完，待续。。。

3754 0 0
杨杨_f97a

numpy创建数组与打印
本篇文章主要是讲解numpy的创建与打印输出，首先导入numpy库用numpy创建数组的几种方式使用array函数从常规Python列表或元组中创建数组。得到的数组的类型...

884 0 1

杨杨_f97a

暂无个人介绍