每一次代码的debug,都有可能是一段奇幻旅程

特别注明:本文为作者与@舒尔茨 讨论的产物,文章版权属两人共同拥有。(话说简书应该加一个“添加共同作者”的功能。)

Nov. 15th, 2018

昨天下午,我正在办公室里忙活着,突然接收到老弟的消息:

“老哥,你在简书上的那篇探索SMTP协议的文章我看了,程序好像有问题,第一行代码就报错啊!”

WTF??? 其实,老弟认真看了我的文章,还按着描述的步骤去尝试,我还是很开心的。不过,第一行代码就跑不了,这怎么能忍?于是我们开始一起研究这个错误出在哪里。研究过程并不算复杂,不过在这个过程中,我们两个编程小白学到了一些有意思的概念。这些概念对于编程高手来说可能算不上什么,但是这个探索过程本身也算有趣。故撰小文一篇,分享一下。

题图

“python自带的代码报错,这也能调吗?”

话说收到老弟的短信后,我就借着去厕所,出门点开图片看了看错误信息。出错的代码是这一句:

>>> from smtplib import SMTP
>>> server = SMTP()
(错误信息。。。具体内容见后面图片)
错误信息。相信有经验的老司机看到这里已经能猜出怎么回事了

有经验的老司机,看到这里估计已经知道怎么回事了。不过作为一只小白,我是一脸懵逼的:“这都可以,我不就是调了一个系统的包,定义了变量吗?我还啥都没干呢。Python自带的代码报错,这怎么debug啊?”

咳咳,别急,越是这种时候越不能慌。不就Python自带的代码出错吗?修复的办法太简单了!于是我回了老弟:

“那啥,你把Python重装一遍试试吧。。。”

吃我一记“不管啥事先重装一下”大法!

这不就是被人鄙视的“不管啥事先重装个系统”大法吗?我承认,这的确有点low。不过Python自己的某个包出错的话,倒是有可能是安装的过程中出了什么问题,导致这个包没有装好。所以重装一遍Python很多时候也是能解决问题的。而且我那时候在忙着写一点东西,还没太仔细研究报错的信息本身。

等了一会,我收到了回复:

“重装了个Python3.7.1,还是一样,相同的错误。”

好吧,排除了安装过程中的问题。只能祭出第二招:“有啥事儿Google一下”大法

你先别笑,其实,对于Python自带的代码报错,这一招是最管用的。Python自己的代码本身肯定是被很多人检测过的。报错的话,肯定还是由于配置或者调用的过程中哪里出了问题。这种情况下,中招的肯定不止你一个人,比如Stack Overflow之类的论坛上,或者者Github的Issues里面(后者一般第三方的库出错比较常见)肯定有人问过。而这种论坛上问问题,肯定要贴出代码,告知自己的系统信息,以及贴出完整的错误消息。所以把自己的错误信息一搜,多半能搜到好多讨论。

于是我满怀信心地向Google求助。然后。。。

Google把一首《凉凉》送给了我。

说正事专用文字

Google上居然一条相关的提问都没有! 这可就奇怪了。当我把整句错误信息贴上时,Google居然出现了一条匹配都没有的情况!

这年头搜个什么东西,搜索引擎一条都找不到的情况,并不多见

“你让我去查看它的源代码??”

没办法了,看来真得靠自己了。这个时候,已经6点了。手上的事情忙完了,我也可以仔细看看这个错误了。

'utf-8' codec can't decode byte 0xc1 in position 0: invalid start byte

是某个unicode码解码出了问题。这种解码问题倒也不罕见,比如信息传输过程中丢失了字节,而UTF-8编码规则中,起始的几个比特几个0几个1,直接决定了后面的多少位应该被理解为这个字符的内容(标准的变长度编码规则,具体可参见UTF-8的介绍。比如这篇文章。)另外,也有可能是中文处理的过程中出现了兼容性问题。比如, Windows电脑对非ASCII字符的编码方式跟标准的基于Unix系统就不一样。这中间一不留神,也很有可能出现解码问题。

看完了错误消息,我们再来看错误的出处。从上面图中可以看到,错误是server = SMTP()这一句抛出的。往下追溯,则是SMTP类的构造函数__init__抛出的。这段代码的文件路径是".../Python/Python36/lib/smtplib.py"。再往下追溯,则是这个构造函数中调用的socket.getfqdn()函数最早抛出的。(还记得吗,我们在探索SMTP协议探索HTTP协议的文章中都提到过,这些上层的包,比如smtplib, requests等,都只是对下层的TCP接口socket包的封装而已。)

其实,我内心里还是有点抵触去查看smtplib.py甚至socket.py的源代码的。总觉得,这些代码都是大神写的。自己跑去看,八成是看不懂的(好像很多初学编程的朋友也有跟我类似的想法)。但是事到如此,貌似也没有别的办法。算了,有什么大不了的,顶多不就是看不懂嘛,看看源代码又不会怀孕

于是我去Python/lib目录里,找到了smtplib.py

与smtplib.py源代码的第一眼邂逅

打开之后,马上意识到,读Python自己的源代码,似乎比读很多第三方包的源代码要顺畅许多。主要是因为文档级注释,和每个类,每个函数的注释,都写得非常清楚。找到class SMTP:下面的def __init__定义。果然,在这个函数的注释文档里就发现了问题关键。

什么是fqdn?问题到底出在哪里?

__init__函数定义里的注释信息如下图:

SMTP类的__init__函数注释文档,以及前面几行代码

文档里提到:

If specified, local_hostname is used as the FQDN
of the local host in the HELO/EHLO command.
Otherwise, the local hostname is found using socket.getfqdn().

就是说,定义SMTP对象时,有一个叫做local_hostname的可选参数。在SMTP通信的HELO阶段,需要使用到它。如果我们提供了local_hostname这个参数,那么__init__函数就拿它当作本地主机名。否则,就调用socketgetfqdn函数来查询本机的主机名。我们定义SMTP对象时,用的是SMTP(),没有提供local_hostname这个参数。于是getfqdn()函数被调用,然后就出错了。

至此,解决错误的第一个办法有可能就找到了:明确给定一个local_hostname,让那个构造函数不需要再去调用socket.getfqdn()不就不会有那个错误了吗?

老弟那边马上就做了实验。

>>> from smtplib import SMTP
>>> server = SMTP(local_hostname='whatever.com') # 果然不再报错
>>> server.connect(<某个邮件供应商的mx域名>) # 连接成功

到这里,问题其实就算解决了。

不过,与其说问题被成功解决,倒不如说问题被成功绕过了。什么是fqdn?为什么socket.getfqdn()会出错?这些还有待我们挖掘。其实,从上面的注释里差不多能猜到了。这个函数返回的,应该是本地的主机名或者域名之类的东西(一个可以被拿来当local_hostname的东西)。上网一搜什么是“fqdn”就一目了然。"fqdn"全称是"fully qualified domain name",顾名思义,就是一个能完整表述一台机器的域名地址。其格式大概就是“主机名.域名”。比如如果你电脑的主机名是“my_computer”,你这台电脑处在域名"mypage.com"中的网络中,那么你电脑的fqdn就是“mycomputer.mypage.com”。(顺便说一下,如果这台电脑上有一个用户"superman",那这个用户的完整描述就是"superman@mycomputer.mypage.com"。好像这也就是电子邮件地址的由来吧。)

我在自己办公室的电脑上试了一下:

>>> import socket
>>> socket.getfqdn()
'admins-MacBook-Pro.local'

可以看到,Mac电脑上,这个fqdn的组成。“admins-MacBook-Pro”是主机名。我的电脑只是处在局域网中,并没有关联什么域名。所以域名项是"local"。联想到老弟的电脑是一台中文版的Windows电脑,可能在一开始的配置过程中,这个fqdn没有正确配置,里面携带了非UTF-8字符,所以socket.getfqdn在读取时才会发生编码错误。

扩大战果:其它解决办法?

既然上面的函数是在查询本地的主机名,我们有什么办法可以提供给系统正确的主机名呢?我跟老弟又做了一下功课,网上说Windows电脑的fqdn可以在环境变量userDNSdomain中查询到。老弟试图查询了一下:

C:\...(路径名)>echo %userDNSdomain%
%userDNSdomain%

可以看到系统并没有这个环境变量。由于不熟悉Windows系统,我并没有了解如何姿势正确地修改电脑的fqdn。但是既然系统有环境变量,Python的socket.getfqdn()会不会就是通过访问这个环境变量来得到fqdn的呢?带着这个猜测,我问老弟

“你知道Windows怎么设置环境变量吗?”
“So easy.”

老弟用Windows写代码已经挺溜了,分分钟设定好了%userDNSdomain%变量(格式还是主机名.域名的格式,不过具体名字貌似可以随意写),再次打开Python执行

>>> from smtplib import SMTP
>>> s = SMTP()

一切正常,之前的错误没有再出现。

总结

到这里,我们也就对这个异常分析了个大概。自己感觉,在这个过程中获得了不少体验。要说得到的东西,我想有一下几点:

  1. 即使拿Python编程入门不久,也不用害怕去研究Python自带的源代码。很多这些包的源代码并没有自己想象的那么难懂。相反,它们会比自己写的代码更有结构,更有可读性。经常看看研究一下这些代码,不仅能对这些包的工作方式有更多了解,也能从中吸取到高手们的程序怎么构架。耳濡目染,自己慢慢就能写出更漂亮的代码了。
  2. 系统的环境变量在编程语言中的作用比以前自己想象的要大。以前在编程的懵懂期,只会用图形界面和IDE写代码,对背后的编译器/解释器一无所知,再到背后shell的环境变量就更不知道是什么了。后来慢慢知道了gcc这样的编译器以及Python这样的解释器,很多地方都会使用到比如PATHPYTHONPATH这样的环境变量。再后来,学会了如何在shell里自己定义环境变量,以及在程序里如何访问环境变量,虽然很简单,但还是感觉自己对操作系统的了解更进了一点。在这个例子中,老弟对userDNSdomain这个变量的实验,又是环境变量和代码之间相互作用的一个实例。

故事到这里就讲完了。其实很简单的一件事情,被我啰嗦了一大段。过路的大神看过就当茶余饭后的消遣了。刚入门的读者从中能获得一二,我们也甚感荣幸。如果你有哪些自己的探索小经历,也欢迎在留言中分享!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,378评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,356评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,702评论 0 342
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,259评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,263评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,036评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,349评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,979评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,469评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,938评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,059评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,703评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,257评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,262评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,485评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,501评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,792评论 2 345

推荐阅读更多精彩内容

  • Python 面向对象Python从设计之初就已经是一门面向对象的语言,正因为如此,在Python中创建一个类和对...
    顺毛阅读 4,210评论 4 16
  • 一、Python简介和环境搭建以及pip的安装 4课时实验课主要内容 【Python简介】: Python 是一个...
    _小老虎_阅读 5,720评论 0 10
  • 阅读的第二层次:检视阅读 “检视阅读分为两种。 一、有系统的略读或粗读让我们回到前面曾经提过的一些基本状态。这是一...
    麦花魔法花园阅读 229评论 0 0
  • 01 最近,我一直在忙视频课的事。 等到6个视频都录好后,我认真把所有视频都看了一遍,发现视频上还有一些问题,需要...
    作家格格阅读 222评论 0 0
  • 2017年已经结束了,2018年已然到来。再过一个月,我就三十一岁了。 三十一岁这个年龄,我已经过了而立之年一年。...
    白发佛阅读 155评论 0 0