高阶函数
前言
变量可以指向函数
>>> f = abs
>>> f(-10)
10
函数名也是变量
>>> abs = 10
>>> abs(-10)
Traceback (most recent call last):
File"<stdin>", line1, in <module>
Type Error:'int' object is not callable
传入函数
一个函数就可以接收另一个函数作为参数,这种函数就称之为高阶函数
def add(x, y, f):
return f(x) + f(y)
map/reduce
map
map()函数接收两个参数,一个是函数,一个是Iterable,map将传入的函数依次作用到序列的每个元素,并把结果作为新的Iterator返回
>>> def f(x):
... return x*x
...
>>> r=map(f,[1,2,3,4,5,6,7,8,9])
>>> list(r)
[1, 4, 9, 16, 25, 36, 49, 64, 81]
>>> list(map(str,[1,2,3,4,5,6,7,8,9]))
['1', '2', '3', '4', '5', '6', '7', '8', '9']
reduce
reduce把一个函数作用在一个序列[x1, x2, x3, ...]上,这个函数必须接收两个参数,reduce把结果继续和序列的下一个元素做累积计算。
reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)
>>> from functools import reduce
>>> def add(x,y):
... return x+y
...
>>> reduce(add,[1,3,5,7,9])
25
把序列[1, 3, 5, 7, 9]变换成整数13579,reduce用法:
>>> from functools import reduce
>>> def fn(x,y):
... return x*10+y
...
>>> reduce(fn,[1,3,5,7,9])
13579
练习
第一题:
>>> def normalize(name):
... a= name[0].upper()
... b= name[1:].lower()
... name=a+b
... return name
...
>>> L1 = ['adam', 'LISA', 'barT']
>>> L2 = list(map(normalize, L1))
>>> print(L2)
['Adam', 'Lisa', 'Bart']
第二题:
>>> def prod(x,y):
... return x*y
...
>>> reduce(prod,[3,5,7,9])
第三题:
?
filter
filter()函数用于过滤序列
例如,在一个list中,删掉偶数,只保留奇数:
>>> def is_odd(n):
... return n%2==1
...
>>> list(filter(is_odd,[1,2,4,5,6,9,10,15]))
[1, 5, 9, 15]
用filter求素数
计算素数的一个方法是埃氏筛法。
首先,列出从2开始的所有自然数,构造一个序列。
取序列的第一个数2,它一定是素数,然后用2把序列的2的倍数筛掉
取新序列的第一个数3,它一定是素数,然后用3把序列的3的倍数筛掉
取新序列的第一个数5,然后用5把序列的5的倍数筛掉
不断筛下去,就可以得到所有的素数。
用Python来实现这个算法,可以先构造一个从3开始的奇数序列:
def_odd_iter():
n =1
while True:
n = n +2
yield n
然后定义一个筛选函数:
def_not_divisible(n):
return lambda x: x % n >0
最后,定义一个生成器,不断返回下一个素数:
def primes():
yield 2
it = _odd_iter() # 初始序列
whileTrue:
n = next(it) # 返回序列的第一个数
yield n
it = filter(_not_divisible(n), it) # 构造新序列
这个生成器先返回第一个素数2,然后,利用filter()不断产生筛选后的新的序列。由于primes()也是一个无限序列,所以调用时需要设置一个退出循环的条件:
# 打印1000以内的素数:
for n in primes():
if n <1000:
print(n)
else:
break
练习
回数是指从左向右读和从右向左读都是一样的数,例如12321,909。请利用filter()筛选出回数:
def is_palindrome(n):
return str(n) == str(n)[::-1]
sorted
sorted()也是一个高阶函数。用sorted()排序的关键在于实现一个映射函数。
>>> sorted([36,5,-12,9,-21])
[-21, -12, 5, 9, 36]
绝对值排序:
>>> sorted([36,5,-12,9,-21],key=abs)
[5, 9, -12, -21, 36]
字符串排序,按照ASCII的大小比较的,由于'Z' < 'a',结果,大写字母Z会排在小写字母a的前面:
>>> sorted(['bob','about','Zoo','Credit'])
['Credit', 'Zoo', 'about', 'bob']
忽略大小写的排序:
>>> sorted(['bob','about','Zoo','Credit'], key=str.lower)
['about','bob','Credit','Zoo']
反向排序:
>>> sorted(['bob','about','Zoo','Credit'], key=str.lower,reverse=True)
['Zoo', 'Credit', 'bob', 'about']
练习
L是用tuple来表示一对名字和分数的。
key是用来进行比较的元素,只有一个参数,具体的函数的参数就是取自于可迭代对象中,指定可迭代对象中的一个元素来进行排序。
具体的函数的参数就是取自于可迭代对象中,指定可迭代对象中的一个元素来进行排序。
那么我们看代码中的t表示啥,表示的是不是可迭代对象(list)中的一个元素(tuple类型)
一个tuple的表示形式是('名字':分数) ('Bob': 75)
那么t[0]和t[1],前一个名字,后一个分数。转换到key中去就是按照名字排序,和按照分数排序。
>>> L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]
>>> def by_name(t):
... return t[0]
...
>>> sorted(L, key=by_name)
>>> def by_score(t):
... return -t[1] #成绩降序排列
...
>>> sorted(L, key=by_score)
[('Adam', 92), ('Lisa', 88), ('Bob', 75), ('Bart', 66)]
返回函数
函数作为返回值
通常情况下的求和:
def calc_sum(*args):
ax =0
for n in args:
ax = ax + n
return ax
需要再计算的话,可以不返回求和的结果,而是返回求和的函数:
def lazy_sum(*args):
def sum():
ax =0
for n in args:
ax = ax + n
return ax
return sum
在函数lazy_sum中又定义了函数sum,并且,内部函数sum可以引用外部函数lazy_sum的参数和局部变量,当lazy_sum返回函数sum时,相关参数和变量都保存在返回的函数中。(闭包程序)
闭包
返回函数不要引用任何循环变量,或者后续会发生变化的变量!!!!
>>> def count():
... fs=[]
... for i in range(1,4):
... def f():
... return i*i
... fs.append(f)
... return fs
...
>>> f1,f2,f3=count()
>>> f1()
9
>>> f2()
9
>>> f3()
9
输出结果不是1,4,9。原因就在于返回的函数引用了变量i,但它并非立刻执行。等到3个函数都返回时,它们所引用的变量i已经变成了3,因此最终结果为9。
如果一定要引用循环变量怎么办?方法是再创建一个函数,用该函数的参数绑定循环变量当前的值,无论该循环变量后续如何更改,已绑定到函数参数的值不变:
>>> def count():
... def f(j):
... def g():
... return j*j
... return g
... fs=[]
... for i in range(1,4):
... fs.append(f(i))
... return fs
...
>>> f1, f2, f3=count()
>>> f1()
1
>>> f2()
4
>>> f3()
9
作业
暂缺
匿名函数
>>> list(map(lambda x: x*x,[1,2,3,4,5,6,7,8,9]))
[1, 4, 9, 16, 25, 36, 49, 64, 81]
关键字lambda表示匿名函数,冒号前面的x表示函数参数。匿名函数只能有一个表达式,不用写return,返回值就是该表达式的结果。
匿名函数没有名字,不必担心函数名冲突。此外,匿名函数也是一个函数对象,也可以把匿名函数赋值给一个变量,再利用变量来调用该函数:
>>> f=lambda x: x*x
>>> f
<function <lambda> at 0x000001CE0FDCEE50>
>>> f(6)
36
也可以把匿名函数作为返回值返回,比如:
def build(x, y):
return lambda: x * x + y * y
作业
用匿名函数改写:
def is_odd(n):
return n % 2 == 1
L = list(filter(is_odd, range(1, 20)))
改写后:
L=list(filter(lambda n: n%2==1, range(1, 20)))
print(L)
装饰器
函数对象可以被赋值给变量,所以,通过变量也能调用该函数。
>>> def now():
... print('2015-3-25')
...
>>> f=now
>>> f()
2015-3-25
函数对象有一个__name__属性,可以拿到函数的名字:
>>> now.__name__ #两个下划线name两个下划线
'now'
>>> f.__name__
'now'
在代码运行期间动态增加功能的方式,称之为“装饰器”(Decorator)
>>> def log(func):
... def wrapper(*arg,**kw):
... print('call %s():' % func.__name__)
... return func(*arg,**kw)
... return wrapper
借助Python的@语法,把decorator置于函数的定义处
>>> @log
... def now():
... print('2015-3-25')
相当于执行了语句:now =log(now)
调用now()函数,不仅会运行now()函数本身,还会在运行now()函数前打印一行日志:
>>> now()
call now():
2015-3-25
>>> def log(text):
... def decorator(func):
... def wrapper(*args,**kw):
... print('%s %s():' % (text, func.__name__))
... return func(*args,**kw)
... return wrapper
... return decorator
这个3层嵌套的decorator用法如下:
>>> @log('execute')
... def now():
... print('2015-3-25')
执行结果如下:
>>> now()
execute now():
2015-3-25
此时:
>>> now.__name__
'wrapper'
import functools
>>> import functools
>>> def log(func):
... @functools.wraps(func)
... def wrapper(*args, **kw):
... print('claa %s():' % func.__name__)
... return func(*args,**kw)
... return wrapper
或者针对带参数的decorator:
>>> import functools
>>> def log(text):
... def decorator(func):
... @functools.wrap(func)
... def wrapper(*args, **kw):
... print('%s %s():' % (text, func.__name__))
... return func(*args, **kw)
... return wrapper
... return decorator
作业
暂缺
偏函数
把一个函数的某些参数给固定住(也就是设置默认值),返回一个新的函数,调用这个新函数会更简单。
通过设定参数的默认值,可以降低函数调用的难度。而偏函数也可以做到这一点。f
unctools.partial就是帮助我们创建一个偏函数的,不需要我们自己定义int2(),可以直接使用下面的代码创建一个新的函数int2:
>>> import functools
>>> int2=functools.partial(int, base=2)
>>> int('1000000')
1000000
>>> int2('1000000')
64
仅仅是把base参数重新设定默认值为2,但也可以在函数调用时传入其他值:
>>> int2('1000000', base=10)
1000000
创建偏函数时,实际上可以接收函数对象、*args和**kw这3个参数,当传入:
int2 = functools.partial (int, base=2)
实际上固定了int()函数的关键字参数base,也就是:
int2('10010')
相当于:
kw = {'base':2}
int('10010', **kw)
传入:
max2 =functools.partial(max,10)
实际上会把10作为*args的一部分自动加到左边,也就是:
max2(5, 6, 7)
args = (10, 5, 6, 7)
max(*args)
结果为10。