不要以为正则表达式是程序员才要掌握的。在我看来,会点正则表达式,是互联网运营工作者必备硬技能之一。
其实,不少程序员在正则表达式方面也是弱鸡。当然,这种程序员是没出息的。
我本人正则表达式水平怎样?我自己无从评价。在工作中,算是能够比较轻松地解读文本规则,然后用正则表达式写出来。
学习正则表达式的入门书籍推荐《正则表达式必知必会》。这本书比较薄,100 多页。认真投入的话,利用一个周末,完全是可以比较深刻掌握的。
网上也有 30 分入门到掌握教程,也不妨看看,还算系统。
在 Excel 等办公软件中,也支持简单的正则表达式。只是表述不是这样的,一般称为「通配符」。如:?
、*
。这种可以看作最简单版本的正则表达式了。
在写 Robots 文件的时候,会多几个通配符,而且就算是同一个通配符,用法也不一样。在做网址批量提交,也许必须用到通配符的。一些统计后台支持自定义转化,大多数情况仍然需要使用到通配符或者更高级的正则表达式。
如果处理的数据更复杂,需要掌握的就更多了。如果不借助正则表达式,只寄希望与软件工具的强大,数据采集、数据清洗、归类统计等操作很难进行。SQL 数据库本身也支持简单的通配符,可以极大提升效率。NotePad++ 等文本编辑器能够支持复杂的正则表达式语法。
另外,通过对正则表达式的系统学习,精确描述数据能力会得到提升。你的脑海里冒出来的会是匹配、类型、数量、边界、开始、结尾、任意字符等概念。
抽个空,要去学。