直接在ipynb文件一开始输入如下内容并点击运行
spark最新版本可以到这边查找https://downloads.apache.org/spark/
请将spark版本更改为自己需要使用的版本,并将SPARK_HOME路径更改
!apt-get install openjdk-8-jdk-headless -qq > /dev/null
!wget -q https://downloads.apache.org/spark/spark-3.3.0/spark-3.3.0-bin-hadoop2.tgz
!tar -xvf spark-3.3.0-bin-hadoop2.tgz
!pip install -q findspark
import os
os.environ["JAVA_HOME"] ="/usr/lib/jvm/java-8-openjdk-amd64"
os.environ["SPARK_HOME"] ="/content/spark-3.3.0-bin-hadoop2"
import findspark
findspark.init()