python电子邮件系列(一)之MIME及电子邮件基本结构

MIME及电子邮件基本结构

MIME

MIME(Multiplepurpose Internet Mail Extensions),中译为“多用途互联网邮件扩展”,顾名思义,这是对传统互联网邮件的扩展,现已称为实际的互联网邮件标准。

指的是一系列电子邮件的技术规范,主要包括:RFC 2045、RFC 2047、RFC 4288、RFC 4289、RFC 2077

传统的电子邮件是1982年定下的,即:RFC 822

它有一个重要的特点就是电子邮件只能使用ASCII字符。这导致了三个结果:1)非ASCII字符如中文非英语字符都不能出现在邮件中。2)电子邮件中不能插入二进制文件(如图片)3)电子邮件不能有附件

这实际上是无法接受的,因此到了1992年,工程师决定扩展电子邮件的技术规范,提出一系列补充规范,这就是MIME的由来。

电子邮件基本结构

下面是一封传统的电子邮件:

From: "Tommy Lee" <lee@example.com>
To: "Jack Zhang" <zhang@example.com>
Subject: Test
Date: Wed, 17 May 2000 19:08:29 -0400
Message-ID: <NDBBIAKOPKHFGPLCODIGIEKBCHAA.lee@example.com>

Hello World.

从上面可以看出发件人的姓名,地址,收件人的姓名,地址,邮件主题,发信日期。

结构上,这封信分为三个部分:首先是信件头,然后是一个空行,最后是新建内容。收件人的客户端只会显示最后一部分,要查看全信,必须“查看原始邮件”功能。

MIME对传统邮件的扩展主要便现在它在信头部分添加了几条语句,主要有三条:

MIME-Version: 1.0

这条语句是必须的,而且这个1.0是不变的,即使MIME已经升级了好几个版本

Content-Type: text/html; charset="UTF-8"

Content-Type表明信息类型,缺省值为“Text/plain”。它包含了主要类型/次要类型(maintype/subtype),主要类型有九中,分别是application、audio、example、image、message、model、multiple、text、video。

每一种主要类型下面又有许多次要类型,常见的有:

text/plain:纯文本,文件扩展名为.txt
text/html:HTML文本,文件扩展名为.html和.htm
image/jpeg:jpeg格式的图片,文件扩展名.jpg
image/gif:GIF格式的图片,文件扩展名为.gif
audio/x-wave:WAVE格式的文件,文件扩展名为.wav
audio/mpeg:MP3格式的音频,文件扩展名.mp3
video/mpeg:MPEG格式的视频,文件扩展名.mpg
application/zip:PK-ZIP格式的压缩文件,文件扩展名.zip

如果信息类型是Text/plain,那么还必须指明编码类型“charset”,缺省值是ASCII,其他可能值有ISO-8859-1UTF-8GB2312等等

整个Content-Type这一行,不仅使用在电子邮件,后来也被移植到了HTTP协议中,所以现在只要是在网上传播的HTTP信息,都带有Content-Type头,以表明信息类型

前面已经说过,电子邮件的传统格式不支持非ASCII字符和二进制,因此MIME添加了第三条语句:

Content-transfer-encoding: base64

为了使非ASCII字符转化为ASCII,这条语句指明了编码转化的方式,正常我们将中文等字符按照utf-8gbk等编码方式编码为二进制后,因为是非ASCII字符,所以需要再将这些非ASCII字符的二进制转化为ASCII字符的二进制,base64就可以起到这样的作用。在之前的有一篇博客详细介绍过此种编码转化。

Content-transfer-encoding的值有5种----7bit8bitbinaryquoted-printablebase64----其中7bit是缺省值,即不用转化的ASCII字符。

base64之外,常用的就是quoted-printable,它主要用于ACSII文本中夹杂少量非ASCII码字符的情况,不适合于转换纯二进制文件。

以下是一封邮件的源码:

Date: Wed, 18 Jun 2008 18:07:51 +0800 (CST)
From: xxx <xxx@163.com>
To: yifeng.ruan@gmail.com
Message-ID: <14410503.1073611213783671983.JavaMail.coremail@bj163app54.163.com>
Subject: =?gbk?B?xOO6ww==?=
MIME-Version: 1.0
Content-Type: multipart/alternative; 
boundary=&quot;----=_Part_287491_22998031.1213783671982&quot;

------=_Part_287491_22998031.1213783671982
Content-Type: text/plain; charset=gbk
Content-Transfer-Encoding: base64

IAq4+b7dsr+209PQudi55raoo6yyu7XD1Nq12Le9yM66zs341b7Jz7nSz+DTprXEtqvO96Osx+vE
49TaxOO1xLKpv83W0AogIArW0Ln6yr2x6tPvIC0gyO7Su7fltcTN+MLnyNXWvgoKtcS12jEy1cXN
vMasyb6z/aOst/HU8s7Sw8fXt76/xOO1xM/gudjU8MjOoaPQu9C7us/X96OhtMvNvMas1Nq4vbz+
wO/D5g==
------=_Part_287491_22998031.1213783671982
Content-Type: text/html; charset=gbk
Content-Transfer-Encoding: quoted-printable

<DIV>&amp;nbsp;</DIV>
<DIV>=B8=F9=BE=DD=B2=BF=B6=D3=D3=D0=B9=D8=B9=E6=B6=A8=A3=AC=B2=BB=B5=C3=D4=
=DA=B5=D8=B7=BD=C8=CE=BA=CE=CD=F8=D5=BE=C9=CF=B9=D2=CF=E0=D3=A6=B5=C4=B6=AB=
=CE=F7=A3=AC=C7=EB=C4=E3=D4=DA=C4=E3=B5=C4=B2=A9=BF=CD=D6=D0</DIV>
<DIV>&amp;nbsp;
......

其中的MIME语句是:

MIME-Version: 1.0
Content-Type: multipart/alternative; 
boundary=&quot;----=_Part_287491_22998031.1213783671982&quot;

Content-Type: multipart/alternative表明这封信的内容是纯文本与HTML文本的混合。该项还有其他两个可能的值,分别是“multiple/mixed”,“multiple/related”,前者表示信件内容含有二进制内容(比如文中插入图片),后者表示含有附件。

boundary=&quot;----=_Part_287491_22998031.1213783671982&quot boundary后的内容----=_Part_287491_22998031.1213783671982是信件不同部分的分割线,它通常是一个很长的随机字符串。

信件内容又有两个子信件头:

Content-Type: text/plain; charset=gbk
Content-Transfer-Encoding: base64
Content-Type: text/html; charset=gbk
Content-Transfer-Encoding: quoted-printable

表明信件的第一部分是gbk编码的纯文本,其编码转换方式是:base64

第二部分是gbk编码的HTML文本,其编码转换方式是:quoted-printable

邮件里所有的内容都要经过编码为二进制,再将二进制通过base64QP编码为ASCII字符在网络上传输。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,602评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,442评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,878评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,306评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,330评论 5 373
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,071评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,382评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,006评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,512评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,965评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,094评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,732评论 4 323
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,283评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,286评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,512评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,536评论 2 354
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,828评论 2 345

推荐阅读更多精彩内容

  • 28.1 引言 电子邮件(e-mail)无疑是最流行的应用程序。[Caceres et al.1991]说明,所有...
    张芳涛阅读 3,733评论 0 6
  • Python 面向对象Python从设计之初就已经是一门面向对象的语言,正因为如此,在Python中创建一个类和对...
    顺毛阅读 4,210评论 4 16
  • 8. 方法定义(Method Definitions) 通用的HTTP/1.0的方法集将在下面定义,虽然该方法集可...
    Palomar阅读 3,142评论 0 2
  • 五、电子邮件 1.电子邮件概述 一个电子邮件系统应具有三个主要组成构件:用户代理、邮件服务器、邮件发送协议(如SM...
    dmmy大印阅读 965评论 0 1
  • 何夢瑤7月28日總結分享:一個人的性格,沒有絕對的對與錯。善用缺點,缺點也會變成優點,善用優點更會讓我們性格有張力...
    夢瑤阅读 105评论 0 0