这一系列博客是看《Python for Data Analysis》的读书笔记,只截取了大部分自己认为重要的知识点,不少例子也是来自于书中。本机安装的是python 3.6版本,并使用anaconda安装了jupyter notebook和一些常用模块。
Python Interpreter
在终端命令行输入python
指令后调出python交互界面,使用exit()
或者Ctrl+D
退出python交互界面。在命令行通过python 文件名.py
的方式执行python脚本。
$ python hello_world.py
Hello world
IPython Basic
在命令行输入
ipython
命令调出ipython交互界面。ipython界面与python界面的区别自己尝试过就能感觉到。在命令行输入
jupyter notebook
命令调出jupyter notebook,当然前提是已经安装了jupyter notebook,jupyter notebook可以很好地将文字与代码合并在一起,是一个很好的工具。-
Tab
用来在写代码的时候提供提示,起到了代码补全的作用。In [1]: an_apple = 27 In [2]: an_example = 42 In [3]: an<Tab> an_apple and an_example any
这里定义了两个an开头的变量,引用变量时输入an后按下tab键会提示出两个可能的选项,如果没有多个选项那么按下tab可以直接补全变量名。能提示的不仅是变量名,还有可能的函数,函数的参数等等,与在开发环境中写代码时软件自带的代码提示功能类似。
-
?
用来显示某个函数或变量的详细信息,相当于文档的功能。In [1]: a=[1,2,3] In [2]: a? Type: list String form: [1, 2, 3] Length: 3 Docstring: list() -> new empty list list(iterable) -> new list initialized from iterable's items In [10]: print? Docstring: print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False) Prints the values to a stream, or to sys.stdout by default. Optional keyword arguments: file: a file-like object (stream); defaults to the current sys.stdout. sep: stringinsertedbetweenvalues,defaultaspace. end: stringappendedafterthelastvalue,defaultanewline. flush: whether to forcibly flush the stream. Type: builtin_function_or_method
a?
会显示出列表的种类、长度等所有详细属性,print?
则会显示出函数的一些用法和说明。 ??
用来显示自定义函数的源码,用法:函数名??
。
Python Language Basic
-
Python相对于C语言或者java语言来说,一个特点就是使用空格取代括号,例如for循环和if语句写法如下:
for x in array: if x < pivot: less.append(x) else: greater.append(x)
python在每行语句结束时不需要分号结尾。
python中的数字、字符串、数据结构、函数、类都是一个python object,有其内部的type和属性。
使用
# 注释内容
进行注释。-
在python中,对一个变量赋值即创造了一个引用指向等号右边的元素。例如:
In [3]: a Out[3]: [1, 2, 3] In [4]: b=a In [5]: a.append(4) In [6]: b Out[6]: [1, 2, 3, 4]
将a赋值给b时,此时a和b都是指向列表的引用,a和b任意一方对列表进行修改后,另一方的值也会被修改,因为两者的指向是相同的。
对于大多数语言来说,
'5'+5
的结果可能是10(将'5'转换成int类型的5),也可能是55
(将5转换成str类型的'5'),原因是这些语言支持对不同类型变量操作时的自动转换类型。上述情况在python中会直接报错,因为操作的两者数据类型不同。但是在一些很明显的情况下,也是可以执行的,比如4.5/2,一个是float,一个是int,但是得出的结果仍然是float类型的2.25。-
isinstance(变量,数据类型)
方法可以判断变量是否是某个类型,返回值为True
或False
。其中数据类型的位置可以为一个元组,意思是判断某个变量是否为多个数据类型中的某个类型。In[21]:a=5 In [22]: isinstance(a, int) Out[22]: True In[23]:a=5;b=4.5 In [24]: isinstance(a, (int, float)) Out[24]: True In [25]: isinstance(b, (int, float)) Out[25]: True
-
对于一个python object,它有很多属性与方法,
getattr()
方法可以获取这些方法与属性的反射。例如:字符串a有一个split方法,要获取这个方法本身,可以使用如下代码:In [27]: getattr(a, 'split') Out[27]: <function str.split>
使用
import 模块
的方式导入模块,这个不说了。运算符操作,即‘+’、‘-’、‘*’、‘/’等等运算符的操作。
is
is not
,用法为a is/is not b
,用于判断a、b两者的引用是否指向相同元素,常用于判断变量是否为空,需要注意与==的区别,后者是判断两者的内容是否相同。大部分Python Object是可变的,也就是说它们的值可以在定义后被修改。
python中,int类型可以存任意位数的整数,float类型默认是64位的浮点数。
-
如果想实现c风格整型除法的效果,可以使用 //符号。例如:
In[52]:3/2 Out[52]: 1.5 In[53]:3//2 Out[53]: 1
-
使用单引号双引号表示字符串,多行字符串使用三个双引号。
a = 'one way of writing a string' b = "another way" c=""" This is a longer string that spans multiple lines """
Python字符串是不可修改的,字符串定义后就不能使用赋值语句再对其内部字符重新修改。但是可以通过函数修改。
In [56]: a = 'this is a string' In [57]: a[10] = 'f' ----------------------------------------------TypeError Traceback (most recent call last) <ipython-input-57-5ca625d1e504> in <module>() ----> 1 a[10] = 'f' TypeError: 'str' object does not support item assignment In [58]: b = a.replace('string', 'longer string') In [59]: b Out[59]: 'this is a longer string'
使用
str(value)
函数可以将value转成字符串(str)类型。-
在定义字符串的时候,如果不想使用转义字符,那么可以在字符串之前加上r(由raw单词而来)。例如:
In [69]: s = r'this\has\no\special\characters' In [70]: s Out[70]: 'this\\has\\no\\special\\characters'
如果想表明定义的字符串是byte类型,那么可以在字符串之前加上b(由单词byte而来)。例如:
In [85]: bytes_val = b'this is bytes' In [86]: bytes_val Out[86]: b'this is bytes'
-
字符串的格式化
format()
,用法为模板.format(参数...)
。例如:In [74]: template = '{0:.2f} {1:s} are worth US${2:d}' In [75]: template.format(4.5560, 'Argentine Pesos', 1) Out[75]: '4.56 Argentine Pesos are worth US$1'
模板中的3个
{}
内容意思如下:-
{0:.2f}
表示将第一个参数格式化为两位小数的浮点数。 -
{1:s}
表示将第二个参数格式化为一个字符串。 -
{2:d}
表示将第三个参数格式化为一个整数。
format
的参数分别对应模板中的三个参数。 -
格式转换函数,
float(value)
将value
转成float类型;int(value)
将value
转成int类型,其他类似的函数如byte()
、bool()
同理。
15 . 复合条件语句。使用一个简短的语句来代表一个判断的逻辑操作。复合条件语句的格式如下:
value = true-expr if condition else false-expr
翻译成常规语句就是:
if condition:
value = true-expr
else:
value = false-expr
举个例子:
In[126]:x=5
In [127]: 'Non-negative' if x >= 0 else 'Negative'
Out[127]: 'Non-negative'
翻译过来就是:
if x >= 0:
print('Non-negative')
else:
print('Negative')