2.2 搭建图像识别开发环境
2.2.1 Anacond
要想使用PyTorch,首先需要安装Python。
Python可以在https://www.python.org上下载,当需要某个软件包时可单独进行下载并安装。
Anaconda是一个用于科学计算的Python发行版,支持Linux、Mac、Windows系统,能让你在数据科学的工作中轻松安装经常使用的程序包。
2.2.2 conda
1.包的安装和管理 conda对包的管理都是通过命令行来实现的(Windows用户可以参考面向Windows的命令提示符教程),若想要安装包,那么在终端中输入conda install package_name即可。
例如,要安装Numpy,输入如下代码:
conda install numpy
你可以同时安装多个包。
类似conda install numpy scipy pandas的命令会同时安装所有这些包。
你还可以通过添加版本号(例如,conda install numpy=1.10)来指定所需的包版本。 conda还会自动为你安装依赖项。
例如,scipy依赖于Numpy,如果你只安装scipy(conda install scipy),则conda还会安装Numpy(如果尚未安装的话)。
conda的命令:
要卸载包,conda remove package_name;
要更新包,conda update package_name;
更新环境中的所有包,conda update--all;
列出已安装的包,conda list;
查找的包的确切名称,conda search search_term进行搜索;
例如,我想安装Beautiful Soup,但我不清楚包的具体名称,可以尝试执行conda search beautifulsoup。
conda可以打破包管理与环境管理的约束,从而能够更高效地安装各种版本的Python以及各种pack age,并且切换起来也很方便。
2.环境管理
除了管理包之外,conda还是虚拟环境管理器。
环境能让你分隔用于不同项目的包。在实际工作中常常需要使用依赖于某个库的不同版本的代码,例如,你的代码可能使用了Numpy中的新功能,或者使用了已删除的旧功能。
实际上,不可能同时安装两个Numpy版本。你要做的就是,为每个Numpy版本创建一个环境,然后在对应的环境中工作。
这里再补充一下,每一个 环境都是相互独立、互不干预的。
不同的章节需要不同的运行环境,下面举例说明: #创建第2~7章代码运行的环境:
conda create -n basic_env python=3.7
#创建一个名为basic_env的环境
source activate basic_env
#激活这个环境—Linux和macOS代码
activate basic_env
#激活这个环境—Windows代码
#创建第8~12章代码运行的环境:
conda create -n imgrecognition_env python=3.7
#创建一个名为imgrecognition _env的环境
source activate imgrecognition _env
#激活这个环境—Linux和macOS代码
activate imgrecognition_env
#激活这个环境—Windows代码
2.2.3 Pytorch的下载与安装
安装PyTorch。首先,进入PyTorch的官方网站(https://pytorch.org),下载,按照说明安装。
使用系统推荐的命令进行安装。
你的电脑没有支持的显卡进行GPU加速,那么CUDA这个选项就选择None。
2.3 Numpy使用详解
Numpy(Numerical Python的简称)是高性能科学计算和数据分析的基础包,其提供了矩阵运算的功能。Numpy提供的主要功能具体如下。
·ndarray——一个具有向量算术运算和复杂广播能力的多维数组对象,当两个维度不同的数组(array)运算的时候,可以将低维的数组复制成高维数组参与运算(因为Numpy运算的时候需要结构相同)。
·用于对数组数据进行快速运算的标准数学函数。
·用于读写磁盘数据的工具以及用于操作内存映射文件的工具。
·非常有用的线性代数,傅里叶变换和随机数操作。
·用于集成C/C++和Fortran代码的工具。 除了明显的科学计算用途之外,Numpy还可以用作通用数据的高效多维容器,定义任意的数据类型。
这些都使得Numpy能够无缝、快速地与各种数据库集成。
图像识别的本质,将图片转换为矩阵。
对图片的处理简化为向量空间中的向量运算。基于向量运算,实现图像的识别。