8080 资源监控页面 4040计算监控页面
1,提交任务
bin目录下
./spark-submit --master spark://xutianyu1:7077 --class 包名+类名 位置
客服端下提交
命令一样,只需要在节点搭建好spark,不用配置节点
yarn提交
spark-env 下配置 export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
./spark-submit --master yarn
--class org.apache.spark.examples.SparkPi../lib/spark-examples-1.6.0-hadoop2.6.0.jar
100
2,创建rdd
sc.parallelize(List((1,2),(3,4),(5,6),3))
3,为分区数量
sc.makeRDD(List((1,2),(3,4),(5,6),3))
4,sortwith
https://www.bbsmax.com/A/QV5ZwNAZdy/
5,广播变量
在driver 端 sc.broadcast(list)
在executer端 .value
6,累加器
因为executer 中的变量无法传进driver端
相当于集群的全局变量