最近遇到个问题,想要用匹配多个字符串前缀,找了一圈,发现个好办法。
问题背景:
最近需要批量初始化表结构,要从MaxCompute上将所有项目下的所有表结构都拉下来,其中只需要将满足部分前缀的表,像ads,dwd,dws,cdm等,一开始是想到用startswith,但是查了下,只找到匹配单个前缀的,难道要写4遍?或者使用正则匹配了估计
解决方案
一开始以为startswith只可以匹配单个前缀
后来查了下,发现这个startswith,除了可以是str还可以是tuple
因为项目中有效的表名前缀有几个:ads,dwd,dws,cdm,还混杂着很多没用的临时表,需要做好剔除,所以元组足够我使用了
# -*- coding: utf-8 -*-
"""
Created on Tue Apr 17 00:51:21 2018
@author: yuguiyang
"""
tables=['dwd_rack_machine','tmp_20180901','test_01','ads_demo']
pres=('ads','dwd','dws','cdm')
for t in tables:
if t.startswith(pres):
print(t)
当然,我们使用正则表达式也是可以的。
import re
tables=['dwd_rack_machine','tmp_20180901','test_01','ads_demo']
for t in tables:
if re.match(r'(ads|dwd|dws|adm)',t):
print(t)
结果也是一样的,好了,我们就介绍到这里。