【MySQL必知必会】学习笔记Day3&1.23&D8-9章&P46-61页
基本概念
- 通配符: 用来匹配值的一部分的特殊字符
- 搜索模式:由字面值、通配符或两者组合构成的搜索条件
- LIKE:为在搜索子句中使用通配符,必须使用LIKE操作符
- %通配符:在搜索串中,%表示任何字符出现任意次数
- _通配符:下划线只匹配单个字符而不是多个字符
- REGEXP:后所跟的东西作为正则表达式
- .:是正则表达式语言中一个特殊的字符。表示匹配任意一个字符
- |:为正则表达式的OR操作 符。它表示匹配其中之一
- [ ]:用来匹配特定的字符,[123]的意思是匹配1或2或3
- [^ ]:字符集合否定,[^123]可以匹配除这些字符123外的东西
- -:集合可用来定义要匹配的一个或多个字符,“-”来定义一个范围
6、用通配符进行过滤
(1)LIKE操作符
- 为在搜索子句中使用通配符,必须使用LIKE操作符。LIKE指示MySQL后跟的搜索模式利用通配符匹配而不是直接相等匹配进行比较。
(2)百分号(%)通配符
- 在搜索串中,%表示任何字符出现任意次数
- eg:找出所有以词jet起头的产品
SELECT prod_id,prod_name
FROM products
WHERE prod_name LIKE 'jet%';
注:
区分大小写:根据MySQL的配置方式,搜索可以是区分大小写的
通配符可在搜索模式中任意位置使用,并且可以使用多个通配符
eg:匹配任何位置包含文本anvil的值,而不论它之前或之后出现什么字符
SELECT prod_id, prod_name
FROM products
WHERE prod_name LIKE '%anvil%';
- 通配符也可以出现在搜索模式的中间
- eg:找出以s起头以e结尾的所有产品
SELECT prod_name
FROM products
WHERE prod_name LIKE 's%e';
注:
- 除了一个或多个字符外,%还能匹配0个字符。% 代表搜索模式中给定位置的0个、1个或多个字符。
- 注意尾空格:尾空格可能会干扰通配符匹配。例如,在保存词 anvil时,如果它后面有一个或多个空格,则子句WHERE prod_name LIKE '%anvil'将不会匹配它们,因为在最后的l 后有多余的字符。解决这个问题的一个简单的办法是在搜索模式最后附加一个%。还一个更好的办法是使用函数去掉首尾空格。
- 注意NULL:虽然似乎%通配符可以匹配任何东西,但是不能匹配NULL。
(3)下划线(_)通配符
- 下划线只匹配单个字符而不是多个字符。
SELECT prod_id,prod_name
FROM products
WHERE prod_name LIKE '_ ton anvil';
(4)使用通配符的技巧
- 不要过度使用通配符。如果其他操作符能达到相同的目的,应该使用其他操作符
- 尽量不要在搜索模式的开始处用通配符,把通配符置于搜索模式的开始处,搜索起来是最慢的
- 仔细注意通配符的位置,如果放错地方,可能不会返回想要的数据
7、用正则表达式进行搜索
(1) 正则表达式介绍
- 正则表达式是用来匹配文本的特殊的串(字符集合)。例如从文本文件中提取电话号码,查找名字中间有数字的所有文件,在一个文本块中找到所有重复的单词, 替换一个页面中的所有URL为这些 URL的实际HTML链接等
(2)使用MySQL正则表达式
- MySQL仅支持多数正则表达式实现的一个很小的子集
(3)基本字符匹配
- REGEXP后所跟的东西作为正则表达式
- eg:检索列prod_name包含文本1000的所有行
SELECT prod_name
FROM products
WHERE prod_name REGEXP '1000'
ORDER BY prod_name;
- .是正则表达式语言中一个特殊的字符,它表示匹配任意一个字符
SELECT prod_name
FROM products
WHERE prod_name REGEXP '.000'
ORDER BY prod_name;
注:
- LIKE与REGEXP 在LIKE和REGEXP之间有一个重要的差别,如下,
如果执行下面两条语句,会发现第一条语句不返回数据,而第二条语句返回一行。这是因为,LIKE匹配整个列。如果被匹配的文本在列值 中出现,LIKE将不会找到它,相应的行也不被返回(除非使用通配符)。而REGEXP在列值内进行匹配,如果被匹配的文本在 列值中出现,REGEXP将会找到它,相应的行将被返回。这是一 个非常重要的差别。
SELECT prod_name
FROM products
WHERE prod_name LIKE '1000'
ORDER BY prod_name;
SELECT prod_name
FROM products
WHERE prod_name REGEXP '1000'
ORDER BY prod_name;
注:
- 匹配不区分大小写: MySQL中的正则表达式匹配不区分大小写。为区分大小写,可使用BINARY关键字,如WHERE prod_name REGEXP BINARY 'JetPack .000'
(4)进行OR匹配
- 为搜索两个串之一(或者为这个串,或者为另一个串),使用|。
SELECT prod_name
FROM products
WHERE prod_name REGEXP '1000|2000'
ORDER BY prod_name;
(5)匹配几个字符之一
- 匹配任何单一字符,[ ]用来匹配特定的字符
- eg:[123]定义一组字符,它的意思是匹配1或2或3
- 其实,正则表达式[123]Ton 为[1|2|3]Ton的缩写,也可以使用后者。
SELECT prod_name
FROM products
WHERE prod_name REGEXP '[123] Ton'
ORDER BY prod_name;
注:
- 如上的输出效果,可以用'[123]Ton' 或者 '[1|2|3]Ton',但不能是'1|2|3 Ton',因为MySQL假定'1|2|3 Ton'的意思是'1'或 '2'或'3 ton'
- 字符集合也可以被否定,即[^123]可以匹配除这些字符123外的东西
(6)匹配范围
- 集合可用来定义要匹配的一个或多个字符
- [0-9]:匹配数字0到9
- [a-z]:匹配任意字母字符
- eg:下面表达式意思是匹配1到5,因此返回3个匹配行,.5 ton,1 ton,2 ton,由于5 ton匹配, 所以返回.5 ton也返回。
SELECT prod_name
FROM products
WHERE prod_name REGEXP '[1-5] Ton'
ORDER BY prod_name;
(7)匹配特殊字符
为了匹配特殊字符,如.、|、[]等必须用\为前导,进行转义,
eg:匹配包含“.”的:
SELECT prod_name
FROM products
WHERE prod_name REGEXP ' \\. '
ORDER BY prod_name;
- \\也用来引用元字符(具有特殊含义的字符)
元字符 说明
\\f 换页
\\n 换行
\\r 回车
\\t 制表
\\v 纵向制表
\\\ \
注:
- \或\\? ,多数正则表达式实现使用单个反斜杠转义特殊字符, 以便能使用这些字符本身。但MySQL要求两个反斜杠(MySQL 自己解释一个,正则表达式库解释另一个)。
(8)匹配字符类
- 存在找出你自己经常使用的数字、所有字母字符或所有数字字母字 符等的匹配。因此可以使用预定义的字符集,称为字符类:
类 说明
[:alnum:] 任意字母和数字(同[a-zA-Z0-9])
[:alpha:] 任意字符(同[a-zA-Z])
[:blank:] 空格和制表(同[\\t])
[:cntrl:] ASCII控制字符(ASCII 0到31和127)
[:digit:] 任意数字(同[0-9])
[:graph:] 与[:print:]相同,但不包括空格
[:lower:] 任意小写字母(同[a-z])
[:print:] 任意可打印字符
[:punct:] 既不在[:alnum:]又不在[:cntrl:]中的任意字符
[:space:] 包括空格在内的任意空白字符(同[\\f\\n\\r\\t\\v])
[:upper:] 任意大写字母(同[A-Z])
[:xdigit:] 任意十六进制数字(同[a-fA-F0-9])
(9)匹配多个实例
- 以上所有正则表达式都试图匹配单次出现。但有时需要对匹配的数目进行更强的控制。例如,可能需要寻找所有的数,不管数中包含多少数字,或者可能想寻找一个单词并且还能够适应一个尾随的s等等。此时,可以用正则表达式重复元字符来完成。
元字符 说明
* 0个或多个匹配
+ 1个或多个匹配(等于{1,})
? 0个或1个匹配(等于{0,1})
{n} 指定数目的匹配
{n,} 不少于指定数目的匹配
{n,m} 匹配数目的范围(m不超过255)
- eg:想匹配 (1 stick)和 (5 sticks)
- 正则表达式\([0-9] sticks?\)。解说如下:\( 匹配(,[0-9]匹配任意数字,sticks?匹配stick 和sticks(s后的?使s可选,因为?匹配它前面的任何字符的0次或1次出现),\)匹配)
SELECT prod_name
FROM products
WHERE prod_name REGEXP ' \\([0-9] sticks?\\)'
ORDER BY prod_name;
- eg:想匹配连在一起的4位数字
- 解说如下: [:digit:]匹配任意数字,因而它为数字的一个集合。{4}确切地要求它前面的字符(任意数字)出现4次,所以 [[:digit:]]{4}匹配连在一起的任意4位数字。
SELECT prod_name
FROM products
WHERE prod_name REGEXP '[[:digit:]]{4}'
ORDER BY prod_name;
上面的也可可以写成:
SELECT prod_name
FROM products
WHERE prod_name REGEXP '[0-9][0-9][0-9][0-9]'
ORDER BY prod_name;
(10)定位符
- 以上所有例子都是匹配一个串中任意位置的文本。为了匹配特定位置的文本,需要使用下面的定位符:
元字符 说明
^ 文本的开始
$ 文本的结尾
[[:<:]] 词的开始
[[:>:]] 词的结尾
- eg: 若想找以一个数(包括以小数点开始的数)开始的所有产品,简单搜索[0-9\\.] 或[[:digit:]\\.])不行,因为它将在文本内任意位置查找匹配。解决办法是使用^定位符。
- ^ 匹配串的开始。因此,^ [0-9\\.]只在.或任意数字开头时才匹配它们。没有^,则还要多检索出那些中间有数字的行
SELECT prod_name
FROM products
WHERE prod_name REGEXP '^[0-9\\.]'
ORDER BY prod_name;
注:
- ^的双重用途:
- 在集合中,用 [ 和 ] 定义,用 ^ 来否定该集合
- 否则,用来指字符串的开始处
- 使REGEXP起类似LIKE的作用:LIKE和REGEXP 的不同在于,LIKE匹配整个串而REGEXP匹配子串。利用定位符,通过用^开始每个表达式,用$结束每个表达式,可以使 REGEXP的作用与LIKE一样
【MySQL必知必会】系列笔记:
【MySQL必知必会1-4章】学习笔记Day1
【MySQL必知必会5-7章】学习笔记Day2