A.2 Python概述
让我们重温一下前面提到的Python语言的一些特性。这里不会对Python进行详细的描述,如果想全面了解Python,建议阅读Elkner, Downey和Meyers的《How to Think Like a Computer Scientist》。可以在http://openbookproject.net//thinkCSpy/找到这本书的免费版本。我们将重温在任一种编程语言中都会用到的集合类型与控制结构,来看看在Python中是如何使用的。最后,我们重新讨论一下List的生成,我认为这是Python入门中最让人困惑的部分。
A.2.1 集合类型
Python有很多存储item集合的方式,还可以通过添加modules的方式创建更多的容器类型。下面介绍一些Python中常用的容器:
1. Lists
Lists是Python中objects的有序集合,可以存放任何类型:numbers, bool, strings等。创建list时要使用括号。下面代码可以创建名为jj的Lists,并为其添加integer和string实例各一个。
>>> jj=[]
>>> jj.append(1)
>>> jj.append('nice hat')
>>> jj
[1, 'nice hat']
也可以把elements直接存入Lists。实现代码如下:
>>> jj = [1, 'nice hat']
同其他编程语言一样,Python也有array数据类型,不过,array只能存一种数据。执行循环时,array比Lists速度快。本书我们不会使用这种类型,因为它容易与NumPy中的array混淆。
2. Dictionaries
字典(Dictionaries)是存放无序的关键字/值的容器,关键字类型可以是string或number。在其他编程语言中,Dictionaries被称为关联数组(associative array)或映射(map)。下面我们创建一个字典,再给它添加两个item:
>>> jj={}
>>> jj['dog']='dalmatian'
>>> jj[1]=42
>>> jj
{1: 42, 'dog': 'dalmatian'}
也可以直接用一行代码上面的功能:
>>> jj = {1: 42, 'dog':'dalmatian'}
3. Sets
这就像数学中的集合,也许你对它不熟悉,它是items唯一的容器。可以通过list创建一个set实例,代码如下:
>>> a=[1, 2, 2, 2, 4, 5, 5]
>>> sA=set(a)
>>> sA
set([1, 2, 4, 5])
Sets可以做联合(union)、交集(intersection)、求差(difference)等数学运算。联合运算通过管道符号(|)实现,交集运算可通过&符号实现。举例如下:
>>> sB=set([4, 5, 6, 7])
>>> sB
set([4, 5, 6, 7])
>>> sA-sB
set([1, 2])
>>> sA | sB
set([1, 2, 4, 5, 6, 7])
>>> sA & sB
set([4, 5])
A.2.2 控制结构
Python使用时,语句有缩进要求。很多人因此不满,但缩进可以持代码整洁、易读。在for循环、while循环、if 语句中,通过缩进,机器可以知道哪些语句属于循环语句。缩进有tabs和空格两种方式。在其他编程语言中,你会用大括号 { }或关键字.。通过用缩进代替大括号,Python节省了很多空间。我们来看看下面这些常用的控制语句:
1. If
If语句是非常易懂的,你可以在一行中实现:
>>> if jj < 3: print "it'sless than three man"
如果有多行,你可以使用缩进来告诉解释器你有多行。你也可以选择用缩进把它们放在一行。
>>> if jj < 3:
... print "it's less than threeman"
... jj = jj + 1
多个判断条件,如else if被写作elif,关键字else用做默认判断条件。
>>> if jj < 3: jj+=1
... elif jj==3: jj+=0
... else: jj = 0
2. For
Python中的for循环可以看做java和c++中的加强版。如果你不太熟悉,可以把它简单的理解为for循环会遍历集合中的每个item。下面我们看一些lists,sets和 dictionaries的例子:
>>> sB=set([4, 5, 6, 7])
>>> for item in sB:
... print item
...
4
5
6
7
现在,我们看看如何便利一个字典:
>>> jj={'dog': 'dalmatian', 1: 45}
>>> for item in jj:
... print item, jj[item]
...
1 45
dog dalmatian
从上面可以看出,用于迭代的item其实是字典的关键字。
A.2.3. List comprehensions
对于Python新手来说,List comprehensions是最困惑的。List comprehensions是生成list的简便方式,它不需要写很多代码,但其工作方式方式有一些不同。下面举例说明一下。
>>> a=[1, 2, 2, 2, 4, 5, 5]
>>> myList = [item*4 for item in a]
>>> myList
[4, 8, 8, 8, 16, 20, 20]
List comprehension常常被一对括号括住。上面的代码等价于:
>>> myList=[]
>>> for item in a:
... myList.append(item*4)
...
>>> myList
[4, 8, 8, 8, 16, 20, 20]
生成同样的mylist,List comprehension使用的语句要简洁的多,不过它让大家困惑的地方是循环内部的执行语句,它的位置在for语句的前面。这与英语的阅读顺序(从左往右)正好相反。接下来看看更高级的功能,只对上面数组中大于2的数字进行运算:
>>> [item*4 for item in a if item>2]
[16, 20, 20]
通过List comprehension可以实现很多功能,可是如果代码的可读性变差,就需要单独写这部分。
我们已经了解了Python的一些基本原则,下面介绍本书使用的Python模块的安装。安装独立的Python模块(没有绑定其他语言)时,可以切换到压缩包解压后的系统路径下,输入安装命令:
> python setup.py install
这是安装Python模块的默认命令。当不确定如何安装Python模块时,可以尝试一下这个命令。这些模块的安装目录为Libs/site-packages/。因此,你不用担心找不到这些模块的安装路径,同时,可以放心地清空下载文件夹。
部分译自《Machine Learning in Action》
版权声明:本文为原创文章,未经允许不得转载。