前言#
今天来看一个字符串查找函数,和这个函数初次见面时感觉她很像C语言中一个函数strstr()
,仔细研究一番发现原来这个函数更加强大,不仅可以返回匹配子串的起始位置还可以返回结束位置,甚至可以返回模式匹配所得到的字符串,既然都给它捧上天了,我们一起来看一下他究竟是怎么用的。
内容#
string.find()#
- 原型:string.find (s, pattern [, init [, plain]])
- 解释:函数在字符串
s
里查找第一个和参数pattern
匹配的子串,如果找到了一个匹配的子串,就会返回这个子串的起始索引和结束索引,否则就会返回nil
。另外,参数init
作为一个数字,指定了搜索的起始位置,这个数字默认为1可以一个负数,表示从后往前数的字符个数。参数plain
作为第四个可选参数默认为flase,传入参数true表示关闭模式匹配,所以函数只做简单的查找子串的操作,如果子串pattern
没有字符为空字符串""
将会被认为是魔法字符。 如果模式匹配子串被找到了,一个成功被找到的子串将会作为第三个返回值,放在两个索引返回值的后边而返回。
Usage##
- 首先新建一个文件将文件命名为findtest.lua然后编写如下代码:
local start_i = 1;
local end_j = 1;
local sunstr = "";
local sourcestr= "_abcd,1234,%12+-cs"
print("\nsource string is \""..sourcestr.."\"")
local function print_ret(findsub, i, j, substr)
print("\nfind substr \""..findsub.."\" ret:")
print(">start = "..(i or "nil"))
print(">end = "..(j or "nil"))
print(">substr = "..(substr or "nil"))
end
-- 查找字符串"a"
start_i, end_j, substr = string.find(sourcestr, "a")
print_ret("a", start_i, end_j, substr)
-- 查找字符串"c"
start_i, end_j, substr = string.find(sourcestr, "c")
print_ret("c", start_i, end_j, substr)
-- 从第10个位置查找字符串"a"
start_i, end_j, substr = string.find(sourcestr, "c", 10)
print_ret("c", start_i, end_j, substr)
-- 关闭模式匹配查找字符串"%d"
start_i, end_j, substr = string.find(sourcestr, "%d", 1, true)
print_ret("%d", start_i, end_j, substr)
-- 匹配查找字符串满足"%d",表示查找一个数字,参数false可省略
start_i, end_j, substr = string.find(sourcestr, "%d", 1, false)
print_ret("%d", start_i, end_j, substr)
-- 查找3个连续数字,我们来看看怎样会出现第三个返回值
start_i, end_j, substr = string.find(sourcestr, "(%d%d%d)", 1, false)
print_ret("(%d%d%d)", start_i, end_j, substr)
- 运行结果
总结#
- 需要注意的是如果参数
plain
被指定的话,参数init
也必须被指定。 - 由第2、3组结果可以看出,同样是查找子串
"a"
,但是结果不一样,原因是他们查找的起始位置不同。 - 由第4、5组结果可以看出参数
plain
的作用,当这个参数为true
时,函数只默认简单查找子串"%d"
,但是当此参数为false
时,函数会按模式匹配查找,"%d"
表示查找一个数字。 - 关于参数
pattern
作为模式匹配的参数是有很多种写法,这里先简单说两个,"%d"
表示查找一个数字,"%l"
表示查找一个小写字母,后面我会用完整的一章来讲解模式匹配,这里就不一一列举了。 - 我们来看最后一组的结果,仅有这个测试结果输出了第三个返回值,我查了多方资料都没有结果,最后不得不查了一遍源码才弄清输出第三个值的条件,那就是参数
pattern
中必须包括字符"()"
,这是输出第三个返回值的必要条件。 - 关于函数解释里的魔法字符这里也要简单了解,他们包括
( ) . % + - * ? [ ] ^ $
,后面我们会详细讲述。