在 Python 的世界,时间是什么
不光是在 Python 的世界,在计算机世界,时间的表示都是混乱的。
首先,有Unix时间戳
, 然后还有 UTC
( 虽然只是一种标准 ), GMT
等等, 不仅如此, 还有各种时区的概念( 世界上有好几百种时区, 比如美国, 各个州定义各种时区 )。 另外, 矫情的美国人还定义了夏令时( DST )这种奇怪的东西。
怎一个乱字了得。
与时间相关的标准库 & 三方库
在 Python 的标准库里面,与时间相关的标准库有:
- time
- datetime
- calendar
处理时间的第三方库有:
- dateutil (推荐)
- pytz
其中,标准库提供的 API 繁多且混乱,各种不一致,每次使用都需要临时去查文档,每次使用,给人带来的都是痛苦。
处理时间(元数据的思想)
什么是元数据呢?
最纯粹,最干净的数据。举个例子,在 Excel 中,你认为最重要的是什么呢? 肯定是那些一行行干干净净的数据。有了它们,我们就可以做出各种漂亮的图表,以及在这一堆数据上面做各种分析。这样的数据有什么特点?一是干净,应该是纯粹的,不带其他修饰的;二是粒度足够细,不能在往下进行拆分。
在 Python 中表示某个时间,你可以用 Unix时间戳
, 也可以用datetime
这种面向对象感十足的,也可以用「适合人类阅读的字符串形式」。对应到上面的例子,谁是我们的选择?
当然是Unix时间戳
了。因为它有如下特点:
- 足够纯粹(从 1970/1/1 以来的秒数,而且是绝对偏移量)
- 没有任何多余的含义(就是一个绝对偏移量)
使用时间戳,从一开始就避免各种时区问题,因为它是绝对的。另外,处理时间戳是一件方便且容易的事情。
特别是存储数据库,直接存成时间戳就行了(BITINT 就可以搞定), 再也不用和各种 DateTime 打交道了,避免了许许多多麻烦。
如何用呢?
- 在程序中,使用时间戳;
- 当需要展示给用户时,转化成字符串;
- 在其他需要的情况,才转化成类似 datetime 这种对象
下面结合标准库 API 来说明,顺便给混乱的标准库 API 总结下,梳理出那些重要的 API 。
# 保持和 JS 一致,统一放大到毫秒级别
def now_timestamp():
return int(time.time() * 1000)
# 时间戳转化成时间字符串,展示给用户
def timestamp2str(ts, fmt=None):
if fmt is None:
fmt = '%Y/%m/%d %H:%M:%S'
timetuple = time.localtime(ts)
return time.strftime(fmt, timetuple)
def datetime2timestamp(dt, is_utc=True):
if is_utc:
ts = time.mktime(dt.utctimetuple())
else:
ts = time.mktime(dt.timetuple())
return ts
# datetime 对象转化成 ISO8601 格式的时间字符串
def datetime2iso8601(dt):
return dt.isoformat()
def timestamp2iso8601(ts):
dt = timestamp2datetime(ts)
return datetime2iso8601(dt)
def timestamp2datetime(ts):
return datetime.fromtimestamp(ts)
def datetime2str(dt, fmt):
return dt.strftime(fmt)
def timestr2datetime(time_str, fmt='%Y-%m-%dT%H:%M:%S'):
return datetime.strptime(time_str, fmt)
def timestr2timestamp(time_str):
dt = timestr2datetime(time_str)
return datetime2timestamp(dt)
第三方库又能干什么
第三方库中,只推荐 dateutil (主要因为使用得熟),主要有以下原因:
- 强大(你所考虑的事情,它都考虑好了)
- API 简洁且一致,能让人减少很多心智负担
API 谁都能写,但是 API 的法则从来都是宜精不宜多
,写出容易使用,符合直觉,拓展性好,抽象性强
的 API 可不是容易的事情,少许的几个 API 就能满足你全部的需要,还有比这更爽的事情吗?
如果用标准库不爽了,那就用 dateutil 吧。
关于 dateutil 的使用,其官方文档有非常详尽的例子,在此不赘述了。