python内置的正则表达库re比较弱,而且似乎在好几年里都没太大的变化。
这里介绍这个python模块regex,实现了更多方便好用的功能。
比如:\p{han}
可以匹配汉字, \p{Latin}
可以匹配拉丁字母。相当简单,易记易用。
更多的介绍请直接看:https://pypi.python.org/pypi/regex
用pip 命令安装即可
pip install regex
regex的源码托管在这里 : https://bitbucket.org/mrabarnett/mrab-regex/
参考资料:
http://www.regular-expressions.info/unicode.html
2017-1-28 1:32:59 codegay