1 . 安装py4j
pip install py4j
2 . 配置pycharm
在PYTHON_HOME\lib\site-packages
下新建pyspark.pth文件内容为:
E:\spark-1.5.1-bin-hadoop2.4\python
记得把python前面替换成你的spark在本地的安装路径
3 . 配置SPAKR_HOME
这个没什么好说的,就是windos设置环境变量
4 . 安装 psutil
pip install psutil
pyspark在windows下的依赖包,还是安装下的好