【Python入门】41.电子邮件之 POP3收取邮件

摘要:如何通过POP3,用Python收取电子邮件。


*写在前面:为了更好的学习python,博主记录下自己的学习路程。本学习笔记基于廖雪峰的Python教程,如有侵权,请告知删除。欢迎与博主一起学习Pythonヽ( ̄▽ ̄)ノ *


摘要
本学习笔记基于廖雪峰的Python教程。欢迎与博主一起学习Pythonヽ( ̄▽ ̄)ノ
本节内容:如何通过POP3,用Python收取电子邮件。

目录

电子邮件
POP3收取邮件
poplib下载邮件
解析邮件
小结

电子邮件

POP3收取邮件

收取邮件通常用的是POP协议,目前版本号为3,俗称POP3。

我们需要编写一个MUA从MDA上收取邮件。

我们要用到Python中的两个模块,poplibemail,分为两大步骤:

1.用poplib下载邮件的原始文本
2.用email解析原始文本,还原邮件。

当然了,在这之前需要保证我们使用的邮箱已经开启了POP3服务。

poplib下载邮件

首先引入poplib模块:

import poplib

准备登录POP3服务器的相关信息,包括邮箱地址、密码和服务器地址:

email = input('Email:')                # 输入邮箱地址
password = input('Password:')          # 输入密码
pop3_server = input('POP3_server:')    # 输入POP3服务器地址

连接POP3服务器:

server = poplib.POP3(pop3_server)
server.set_debuglevel(1)                      # 打开调式信息
print(server.getwelcome().decode('utf-8'))    # 打印POP3服务器欢迎信息

需要注意的是,如果使用的邮箱pop服务有加密,则需要以加密的方法连接服务器,像这样:

server = poplib.POP3_SSL(pop3_server)

进行身份认证:

server.user(email)
server.pass_(password)

返回邮箱的相关信息:

print('Messages:%s. Size:%s' % server.stat())     # 返回邮件数目和占用空间
resp, mails, octets = server.list()               # 获取邮件列表
print(mails)                                      # 打印所有邮件编号及相应的大小

这里stat()可以获取邮件总数目及占用空间。

list()可以获取每一封邮件的编号即占用空间。

获取一封邮件:

index = len(mails)                                 # index为邮件总数目                            
resp, lines, octets = server.retr(index)           # 获取最新一封邮件的信息
msg_content = b'\r\n'.join(lines).decode('utf-8')  # 获得整个邮件的原始文本

retr()可以返回邮件的全部文本,其中lines存储的是文本的每一行内容。

接下来就是解析文本的部分,后面会介绍:

msg = Parser().parsestr(msg_content)             # 解析邮件原始文本

最后关闭连接:

server.quit()

解析邮件

解析邮件的过程与构造邮件正好相反。

首先,引入必要的模块:

from email.parser import Parser            # 解析模块
from email.header import decode_header     # 用于获取头文件的编码信息
from email.utils import pasrseaddr         # 用于格式化邮件信息

import poplib

由于在解析邮件的过程中,会遇到编码问题,需要进行相应的解码才能正常显示。

所以我们需要先定义相关函数用以解码。

针对邮件的相关信息,比如Subjict,name等,我们定义一个decode_str函数:

def decode_str(s):
    value, charset = decode_header(s)[0]
    if charset:
        value = valur.decode(charset)           # 如果文本中存在编码信息,则进行相应的解码
    return value

针对邮件的文本内容,我们需要检测编码,否则,非UTF-8编码的邮件都无法正常显示,我们定义一个guess_charset函数:

def guess_charset(msg):
    charset = msg.get_charset()                             # 直接用get_charset()方法获取编码
    if charset is None:                                     # 如果获取不到,则在原始文本中寻找
        content_type = msg.get('Content-Type', '').lower()  
        pos = content_type.find('charset=')                 # 找'charset='这个字符串
        if pos >=0:                                         # 如果有,则获取该字符串后面的编码信息
            charset = content_type[pos+8:].strip()
    return charset

这里lower()是把字符串全改为小写表示。

strip()是去除字符串前后的空格字符。

准备好编码的问题,就开始正式解析邮件吧。

把邮件内容解析为Message对象:

msg = Parser().parsestr(msg_content)

由于这个Message对象可能嵌套着其他MIMEBase对象,所以我们要递归地打印出Mseeage的层次结构:

def print_info(msg, indent=0):                              # indent用于缩进显示 
    # 首先打印邮件的发件人,收件人和主题
    if indent == 0:
        for header in ['From', 'To', 'Subject']:
            value = msg.get(header, '')
            if value:
                if header == 'Subject':                     # 解码主题信息
                    value = decode_str(value)
                else:                                       # 解码发件人和收件人信息
                    hdr, addr = parseaddr(value)
                    name = decode_str(hdr)
                    value = u'%s <%s>' % (name, addr)
            print('%s%s: %s' % ('  '* indent, header, value))   #'  ' *indent可以打印出2*indent个空格
            
    # 将组合邮件对象分离,         
    if (msg.is_multipart()): 
        parts = msg.get_payload()                           # 拿取msg的子对象
        for n, part in enumerate(parts):
            print('%spart %s' % ('  ' * indent, n))
            print('%s--------------------' % ('  ' * indent))
            print_info(part,indent + 1)
    
    # 逐一打印邮件对象
    else: 
        content_type = msg.get_content_type()               # 获取邮件对象格式
        if content_type == 'text/plain' or content_type == 'text/html':  # 如果为文本邮件,则直接打印
            content = msg.get_payload(decode=True)
            charset = guess_charset(msg)                     # 检测编码
            if charset:
                content = content.decode(charset)           # 解码
            print('%sText: %s' % ('  ' * indent, content))  # 打印内容
        else:
            print('%sAttachment: %s' % ('  ' * indent, content_type))  # 否则为附件,获取附件信息

整理一下上面的代码,就能用来收取邮件了,比如有这样一封邮件:


电子邮件6.png

我们运行上面的代码,把显示结果如下:

+OK QQMail POP3 Server v1.0 Service Ready(QQMail v2.0) 
Messages:19. Size:1335886 

From: 三贝 <xxxxxx@126.com> 
To: xxxxxxxx<xxxxx@qq.com> 
Subject: POP3测试 
part 0 
-------------------- 
  part 0 
  -------------------- 
    Text: 你好,正在使用POP3收取邮件。 
  part 1 
  -------------------- 
    Text: <div style="line-height:1.7;color:#000000;..."><div>你好,正在使用...
 &nbsp; &nbsp;</div></div></span> 
part 1 
-------------------- 
  Attachment: image/png 

从打印的结构我们可以看出,这封邮件是一个MIMEMultipart,分为两部分:

第一部分又是一个MIMEMultipart,这一部分包含一个纯文本格式的MIMEText和HTML格式的MIMEText

第二部分是一个Image文件。

小结

Python用POP3收取电子邮件分两步:第一,使用poplib下载邮件原始文本;第二,使用email把原始文本解析为Message对象,然后将内容展示给用户。


以上就是本节的全部内容,感谢你的阅读。

下一节内容:数据库

有任何问题与想法,欢迎评论与吐槽。

和博主一起学习Python吧( ̄▽ ̄)~*

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容