Spark数据倾斜表现
1.Executor lost,OOM,Shuffle过程出错
2.DriverOOM
3.任务卡在某个阶段
4.正常任务突然失败
Spark定位数据倾斜
Spark数据 倾斜只会在shuffle阶段
初现数据倾斜可能是使用了一下产生shuffle的算子:distinct、groupByKey、reduceByKey、aggregateByKey、cogroup、repartition
Spark数据倾斜解决方案
1.Executor lost,OOM,Shuffle过程出错
2.DriverOOM
3.任务卡在某个阶段
4.正常任务突然失败
Spark数据 倾斜只会在shuffle阶段
初现数据倾斜可能是使用了一下产生shuffle的算子:distinct、groupByKey、reduceByKey、aggregateByKey、cogroup、repartition
Spark数据倾斜解决方案