素数算法
看到廖雪峰网站上用python的实现, 看起来很简单, 但是最终还是自己实现一遍比较好, ==代码点我跳转.==
- 素数算法 (埃拉托色尼筛选法)
原理很简单, 在数学界1
既不是质数也不是合数, 所以不用管1
, 从2
开始
输出最小的质数`2`, 然后将`2`的倍数都删除
输出剩下的第一个数为`3`, 然后将`3`的倍数都删除
输出剩下的第一个数为`5`, 然后将`5`的倍数都删除
输出剩下的第一个数为`7`, 然后将`7`的倍数都删除
...
这样不断循环下去, 直到所有的数都被删除或者输出, 输出的数即为质数
.
- 实现
def _ori_iter():
n = 1
while True:
n += 2
yield n
这里先定义一个ori_iter
方法, 返回的是一个生成器
(从3
开始的奇数, 如 3, 5, 7...)
def _not_divisible(n):
return lambda x: x % n > 0
这里定义了一个_not_divisible
方法, 这可以理解成一种规则, x
能整除n
返回false
, 不能整除则返回true
, 后面filter
中有用到
def prime():
it = _ori_iter()
while True:
n = next(it)
yield n
# it = filter(lambda x: x % n > 0, it)
it = filter(_not_divisible(n), it)
这里定义的prime
返回的则是全体素数. 第一行的it = _ori_iter()
, 这时it是一个会返回从3
开始的所有奇数(也就是不能被2整除)的生成器==(3, 5, 7, 9, 11...)==, while True
表示将会无限循环下去,直到天荒地老, 下面是循环过程
- 取出的第一个
n
是it
的第一个元素3
,yield n
将3
作为prime
生成器的第一个元素. 之后经过it = filter(_not_divisible(n), it)
, 这里的it
经过筛选, 将3
的倍数全部丢弃==(3, 5, 7,9, 11...)== - 取出被筛选过的
it
的第二个元素, 也就是5
, 作为prime
生成器的第二个元素. 之后在经过it = filter(_not_divisible(n), it)
筛选, 将5
的倍数全部丢弃(3, 5, 7, 11, 13,15...) - 取出被筛选过的
it
的第三个元素, 也就是7
, 作为prime
生成器的第三个元素. 之后在经过it = filter(_not_divisible(n), it)
筛选, 将7
的倍数全部丢弃(3, 5, 7, 11, 13...21...) - ...
这是一个无限循环, 所以prime
返回的是一个的生成器, 里面包含无穷多个质数
- 总结
算法很容易理解, 实现起来也并不难, 下面是在实现的过程中遇到的一个问题
def _not_divisible(n):
return lambda x: x % n > 0
def prime():
it = _ori_iter()
while True:
n = next(it)
yield n
# it = filter(lambda x: x % n > 0, it)
it = filter(_not_divisible(n), it)
最后两句分为注释部分it = filter(lambda x: x % n > 0, it)
和未注释部分it = filter(_not_divisible(n), it)
咋一看并没有什么区别, 但是输出的结果却大有不同, 这就有意思了, 思前想后, 请教同事, 最后总算是有点理解, 这里大致描述一下为什么会出现输出不同的情况...
生成器(Iterator)是一种惰性计算的序列(他很懒, 你催他一下, 他才会给你下一个数据- -), 只有当你使用next
取值时, 才会去执行, 然后返回给你正确的值
- 这里如果使用未注释部分,
it = filter(lambda x: x % n > 0, it)
这里的n
值确实是上一句正确返回的n
值, 但是由于filter
也是惰性的,filter
只会去执行一次筛选, 然后到下次循环时,n
的值就变了成下次返回的n
, 这样每次filter
都只会筛选一次, 真正需要筛选出去的值并没有被筛选, 最后的执行结果显然不会正确了... - 然而使用未注释部分代码,
n
的值是通过_not_divisible
函数的参数传进去的, 不会去改变, 传进去第一个3
, 他就会一直筛选下去, 然后传进第二个5
的时候, 同理也会筛选下去, 所以可以得出正确的质数序列
归根结底, 这里应该是filter
和lambda
内部处理的问题, 可能研究一下源码会更加明了, 这里就先不倒腾了/哭笑...