看到网上有人问了一个问题:
在同一个目录下,有两个 Python 文件
[A.py]
from B import D
class C:pass
[B.py]
from A import C
class D:pass
当在 shell 中执行`A.py`时
$ python A.py
Traceback (most recent call last):
File "A.py", line 1, in
from B import D
File "/Desktop/B.py", line 1, in
from A import C
File "/Desktop/A.py", line 1, in
from B import D
ImportError: cannot import name D
那么,Python 的执行细节是怎样的呢?
首先,要了解一下 Python 执行`from B import D`这条语句的机制:
- 在`sys.modules`字典中查找键`B`,例如:`os`
>>> sys.modules['os']
- 如果有`B`这个键,获取对应的值,也就是`modules对象`,从模块`B`的`__dict__`列表中查找获取名称为`D`的对象,如果不存在,抛出异常。`__dict__`列表可以通过`dir()`查看:`dir(os)`。
- 如果没有`B`这个键,则会为这个键创建一个`modules对象`,只不过,这个模块的`__dict__`列表是空的。接下来,在几个路径下查找并执行`B.py`,以填充模块`B`的`__dict__`,然后从中查找获得名称为`D`的对象,如果不存在,抛出异常。
回到最初的问题,执行过程是这样的:
1. 运行`A.py`,当执行到`from B import D`语句时,因为还没有运行过`B.py`,所以`sys.modules`中没有`B`这个键。会创建一个键`B`并赋值为模块B对象``,只不过此时这个模块对象是空的,里面什么都没有。
2. 然后,暂停执行`A.py`的其他语句,Python 在指定路径下查找,发现了同目录下的`B.py`并运行,目的是填充``的`__dict__`列表。当执行到`from A import C`时,也会检查`sys.modules`中是否有名为`A`的模块,但因为`A.py`还没有读取完,所以并没有在`sys.modules`中缓存对应的信息。然后,同样的,Python 会创建一个键`A`并赋值为空的模块A对象``。暂停执行`B.py`并寻找、从头执行`A.py`。
3. 这时,会再次执行到`from B import D`语句,由于在第一步时已经在`sys.modules`创建了键`B`的模块B对象``,所以直接获取到``,但此时``的`__dict__`还是空的,由于没有对应的`D`,最终抛出异常。
4. 但如果导入是通过命令`import B`进行的,因为这个模块已经存在于`sys.modules`,所以导入不会抛异常,但 调用模块 时还是会出问题。
原始问题 和 解答,来自 啄木鸟社区
我对用自己的理解将原文的答案进行了说明,原文中包含对 字节码 和 解释器 执行过程的分析。
图片非原创,来自 Python中文社区 大妈(ZoomQuiet)。