1 下载安装Anaconda
1.1 Anaconda简介
1.2 Anaconda下载安装
打开如下链接直接下载(这里是windows版本的下载链接,macOS找对应链接自己下载):https://repo.anaconda.com/archive/Anaconda3-2024.06-1-Windows-x86_64.exe。
安装过程中注意遇到如下选择时全选再进行下一步,否则要自己为Anaconda配置环境变量(其他步骤直接选择下一步)。
2 在命令行测试conda命令
2.1 Conda介绍
Conda是一个开源的包管理和环境管理系统,最初由Anaconda Inc.创建。Conda可以安装、运行和更新包及其依赖项,并可以创建隔离的环境,以避免包版本冲突。例如,开发时可以使用conda创建多个相互隔离的环境,每个环境可以包含不同版本的包,从而避免版本冲突。建议在使用时建立一个单独的环境作为平常使用,尤其对于一些比较大的项目,可以考虑另外创建环境。
2.2 验证conda安装成功
(1)打开命令行
键盘Win+R输入cmd点击确定打开命令行。
(2)验证conda安装成功
在打开的命令行工具中输入并运行(按回车键)
conda --version
检查conda的版本。如下图,输出“conda 24.5.0”即为安装成功。
注意,安装成功后也可以在命令行中直接输入“python”或“ipython”尝试使用python。但学习时推荐使用后面介绍的Jupyter Lab。
2.3 创建新环境
(1)打开命令行
键盘Win+R输入cmd点击确定打开命令行。
(2)创建名为myenv的新环境
命令行中输入(两个命令选一个即可)
conda create --name=myenv python==3.12
conda create -n myenv python==3.12
并回车运行。出现如下输出时即为成功。
在创建过程中,conda会询问是否安装一些包,输入y确认。
2.4 查询新环境
(1)打开命令行
(2)查询新环境
在命令行中输入
conda env list
可以看到目前存在的所有conda环境。
2.5 激活/退出新环境
(1)打开命令行
(2)激活新环境
在命令行中进入对应的conda开发环境。在命令行中输入
conda activate myenv
显示如下:
(3)退出新环境
在打开某环境想要退出当前环境时,输入
conda deactivate
2.6 删除已有环境
(1)打开命令行
(2)删除环境
删除一个已存在的环境时,在命令行中输入
conda remove --name=myenv --all
,遇到询问输入y并回车继续。
(3)查询环境列表
删除后可以继续使用“conda env list”列出目前存在的环境以确定已经删除成功。
2.7 使用conda安装Python第三库/包
(1)Python标准库和第三方库的介绍
Python标准库是随Python安装附带的一组模块和包,提供了丰富的功能,用于处理各种常见的编程任务。标准库的优势在于它是Python解释器的一部分,无需额外安装,并且经过充分测试和维护。
Python第三方库是社区开发和维护的外部模块和库,可以通过conda的包管理工具“conda”进行安装,也可以通过Python的包管理工具“pip”进行安装,第三方库扩展了Python的功能,涵盖了各个领域。
(2)使用Conda安装某个包
例如在myenv环境中安装数据科学和机器学习常用的库“scikit-learn”,在命令行中输入“conda install scikit-learn”,截图如下。
这里注意:
l 第三方包的安装名可能和其名称不一样,具体要通过查询确定。
l 如果安装速度慢,可以将安装源换为清华大学的镜像源,详细操作见这一链接:anaconda | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror
2.8 查看某个环境中安装的包
(1)打开命令行
(2)激活需要查看的Conda环境
(3)在命令行输入
conda list
3 使用Jupyter Lab
3.1 对比Jupyter Notebook和Jupyter Lab
Jupyter Notebook是一个开源的Web应用程序,允许用户创建和共享包含代码、方程式、可视化和叙述性文本的文档。广泛应用于数据清理、数值模拟、统计建模、机器学习和其他数据科学任务。
Jupyter Lab是Jupyter项目中的一个新一代用户界面,比Jupyter Notebook更加灵活和强大,是数据科学和科研计算的集成开发环境(Integrated Development Environment,IDE)。
两者都是优秀的教学和学习工具,便于学生和教师进行交互式学习。
3.2 启动Jupyter Lab
(1)打开命令行
(2)进入某环境或使用base环境
使用base环境时,不需要激活任何环境。
(3)打开Jupyter Lab
在命令行中输入
jupyter lab
下面是在myenv环境中打开Jupyter Lab的截图。
3.3 关闭Jupyter Lab
在刚刚打开Jupyter Lab命令行中,按下Ctrl+C退出(推出前保存Jupyter文件)。
3.4 使用Jupyter Lab
3.4.1 ipykernel介绍
当出现如下界面时启动成功。但注意,这里启动的Lab里只有base对应的Python3这一个默认的ipykernel。当需要使用某个conda环境中的ipykernel时,需要在Jupyter Lab中添加新的ipykernel。
Ipykernel时一个为Jupyter提供Python支持的内核。Jupyter本身是一个支持多种编程语言的交互式计算环境,而ipykernel使得Jupyter能够运行Python代码。Ipykernel是Jupyter项目的一部分。
3.4.2 添加ipykernel
参考如下链接设置:jupyter notebook添加环境/添加内核(超详细)_jupyter notebook添加内核-CSDN博客
具体步骤如下:
(1)打开命令行
(2)激活myenv环境并安装ipykernel第三方包
安装时一路输入y回车。
(3)添加内核
在环境中输入
python -m ipykernel install --user --name=myenv --display-name=myenv
这里“name”参数指内核的原名,即myenv,“display-name”指在Jupyter Lab中展示的名字,可以和真实名字不同,这里为了简便使用同一名字。
如下图,修改完后再次在命令行中启动Jupyter Lab可以看到已经有myenv这一个内核了。之后可以根据需要在Jupyter Lab中选择不同内核新建Jupyter文件。
3.4.3 新建一个Jupyter文件
Jupyter的界面简介见官方中文文档:JupyterLab 接口 (API) — JupyterLab cn(beta) 0.18.4 文档 (jupyter-docs-cn.readthedocs.io)
点击一个内核即可新建Jupyter文件。可以先重命名文件。
每一行可以选code或markdown,后者利用markdown语法写分级标题。
3.5 推荐的工作流程
(1)创建自己的文件夹
(2)打开命令行进入对应文件夹路径
(3)激活conda环境
(4)启动Jupyter Lab
流程图如下:
4 Python数据科学学习路径
到这里就在自己电脑本地基本配置好环境,可以学习Python了。学习Python网上帖子很多。推荐直接用廖雪峰的官方博客Python教程 - 廖雪峰的官方网站 (liaoxuefeng.com)。
经管涉及的Python学习路径一般是Python语法基础、Python数据分析与可视化(Pandas/Numpy/Matplotlib/Seaborn/Plotly等第三方包)、Python机器学习(scikit-learn等第三方包)、Python深度学习(pytorch/transformers等第三方包)、Python强化学习等等。生成式人工智能的调用可以排在Python语法基础之后(openai第三方包)。
学会基础后,有一些具体的数据和任务成长会快一点。
以上内容网上都可以搜索到优质的帖子,或者问一些大模型产品都可以得到。当遇到代码报错时,第一选择是检查代码,第二选择是把代码和报错信息给大模型对话产品,第三选择是直接把报错信息拿去百度搜索。stakoverflow是一个比较高质量的社区。