Anaconda是数据科学利器,它的优势之处在于小白也能快速上手。
我们知道Python的英文表达是蟒蛇,有意思的是anaconda也是蟒蛇的意思,准确是是水莽,莽中之王,更大、更重、更长。按这层意思理解,anaconda是python的大码款,倒也是有些贴切的。
Anaconda知多少
回到编程,Anaconda对于初学Python的人很友好,一键安装,不必费心配置python环境,也不用安装各种常用的库,就可以直接入手使用。对于数据科学来说,Anaconda是一个百宝箱式的存在。
Anaconda是一个免费开源的Python和R语言的发行版本,用于计算科学(数据科学、机器学习、大数据处理和预测分析),Anaconda致力于简化包管理和部署。
Anaconda的包使用软件包管理系统Conda进行管理。超过1200万人使用Anaconda发行版本,并且Anaconda拥有超过1400个适用于Windows、Linux和MacOS的数据科学软件包。
总结Anaconda的三大特点:
内置python,高度集成python数据科学生态
拥有强大的包管理工具-conda
可用超过600个python数据科学库
Anaconda拥有个人版、商业版、团队版、企业版,除个人版不收费外,其他版本都需要付费,
当然对大部分人来说个人版已经完全够用。和python一样,Anaconda不挑平台,在windows、os、linux上都可以用,目前支持python3.8版本的下载 ,下载完成后一路next就能完成安装。
官网:
Anaconda | The World's Most Popular Data Science Platform
下载地址:
安装教程:
Installation - Anaconda documentation
学习文档:
Anaconda能做什么?
前面说过Anaconda是一个python数据科学百宝箱,所以它的作用就是燃爆数据科学,让小白也可以轻松玩数据。
你可以利用Anaconda研究数据处理、数据建模、机器学习、神经网络、自然语言处理、可视化展示、教学等等。既能一人独秀,也可以团队作战。
神奇的conda
说说conda,这是Anaconda的杀手锏。
Conda是一个开源、跨平台和语言无关的软件包管理和系统管理系统,通过Conda可安装、升级和升级软件包依赖。Conda为Python程序创造,但是它可以打包、分发任意语言编写的软件(例如R语言)和包含多语言的项目。
conda和pip都可以管理python库,但最大的不同在于conda是跨平台且不限语言的,而且可以独自创建虚拟环境。因为conda立足于数据科学生态,不像pip可以安装几乎所有的python库(来自pypl),conda只能安装anaconda里支持的数据科学库(600多个)。
主要的数据科学内置库包括pandas、numpy、matplotlib、jupyter、scipy、ipython、nltk、notebook、sikit-learn、seaborn、xlrd、xlwt......
一般把这些数据科学库分为四大类:基础库(jupyter、pandas、numpy、scipy),机器学习库(keras、tensorflow、pytorch、sikit-learn、nltk),可视化库(matplotlib、seaborn、plotly)、拓展计算库(numba、dask、pyspark)
这些库可以通过conda安装,也可以在GUI界面Navigator上点击安装或更新。
有兴趣可以去官网看看这些神奇的家伙:Anaconda库大全
附conda文档:Conda - Conda documentation
Anaconda其他优秀特性
- 拥有界面化的应用程序及包管理应用-Navigator
- 支持R语言
Anaconda不仅适用于Python,还支持R,使用conda安装R并管理R包
- 学习社区
Anaconda的缺点
Anaconda的优点也是它的缺点,功能太齐全就显得很臃肿,一个安装包快500M,所以不少人去拥抱miniconda了。
但无论如何,Anaconda都是python数据科学最好的伙伴。