表示用于搜索操作的一组固定Unicode字符值的对象。
NSCharacterSet对象表示一组符合unicode的字符。NSString和NSScanner对象使用NSCharacterSet对象将字符组合在一起进行搜索操作,这样它们就可以在搜索过程中找到任何一组特定的字符。集群的两个公共类NSCharacterSet和NSMutableCharacterSet分别声明静态和动态字符集的编程接口。
使用这些类创建的对象称为字符集对象(当没有混淆时,仅仅作为字符集)。由于类集群的性质,字符集对象不是NSCharacterSet或NSMutableCharacterSet类的实际实例,而是它们的一个私有子类的实例。尽管字符集对象的类是私有的,但是它的接口是公共的,由这些抽象超类NSCharacterSet和NSMutableCharacterSet声明。字符集类采用NSCopying和NSMutableCopying协议,使得将一种类型的字符集转换为另一种类型的字符集非常方便。
NSCharacterSet类声明一个对象的编程接口,该对象管理一组Unicode字符(有关Unicode的信息,请参阅NSString类集群规范)。NSCharacterSet的主基元方法characterIsMember:为其接口中的所有其他实例方法提供了基础。NSCharacterSet的子类只需要实现这个方法,加上mutableCopyWithZone:,就可以实现正确的行为。为了获得最佳性能,子类还应该覆盖位图表示,否则它将通过调用characterIsMember:对每个可能的Unicode值执行。
NSCharacterSet与核心基础组件CFCharacterSetRef是“免费桥接”的。有关免费桥接的更多信息,请参见免费桥接。
+ (NSCharacterSet *)characterSetWithCharactersInString:(NSString *)aString;
返回包含给定字符串中的字符的字符集。
+ (NSCharacterSet *)characterSetWithRange:(NSRange)aRange;
返回一个字符集,其中包含在给定范围内具有Unicode值的字符。
NSRange lcEnglishRange;
NSCharacterSet *lcEnglishLetters;
lcEnglishRange.location = (unsigned int)'a';
lcEnglishRange.length = 26;
lcEnglishLetters = [NSCharacterSet characterSetWithRange:lcEnglishRange];
- (NSString *)stringByTrimmingCharactersInSet:(NSCharacterSet *)set;
返回一个新字符串,该字符串通过从给定字符集中包含的接收方字符的两端删除而生成。
从集合中包含的接收字符的两端删除所生成的新字符串。如果接收字符完全由集合中的字符组成,则返回空字符串。
- (NSArray<NSString *> *)componentsSeparatedByCharactersInSet:(NSCharacterSet *)separator;
数组中的子字符串按照它们在NSCharacterSet的顺序出现。分隔符的相邻出现会在结果中产生空字符串。类似地,如果字符串以分隔符开始或结束,则第一个或最后一个子字符串分别为空。
可以把任何字符比如Swift三个字母当成分隔符。
NSString *string1 = @"Swift is a powerful and intuitive programming language designed to give developers the freedom and capabilities they need to create a new generation of cutting-edge apps. Swift is easy to learn and use and it’s open source, so anyone with an idea can create something incredible.";
NSArray *array = [string1 componentsSeparatedByCharactersInSet:[NSCharacterSet characterSetWithCharactersInString:@"Swift"]];
由此可见。区分大小写。当遇到连续的会返回空字符串。
alphanumericCharacterSet
包括所有数字和字母(大小写) ,还有中文,俄文,日文,韩文。(但是不包括符合和emoji)。
symbolCharacterSet
包括一些系统符号¥$+~~`和emoji
uppercaseLetterCharacterSet
这个集合是用于区分大小写的字母表中的大写字母的所有字符的集合。
capitalizedLetterCharacterSet
capitalizedLetterCharacterSet包含Titlecase,而uppercaseLetterCharacterSet包含Uppercase和Titlecase,capitalizedLetterCharacterSet是uppercaseLetterCharacterSet的子集。
controlCharacterSet
包括控制符,什么是控制符比如:\r\n\t。ASCII码里的**0~31及127(共33个)是控制字符或通信专用字符。
decimalDigitCharacterSet
这个集合是表示小数0到9的所有字符的集合。这些字符包括,例如,印度语脚本的十进制数字和阿拉伯语。
decomposableCharacterSet
可分解的字符。
NSString *string = @"お前は本当に愚かです";
NSArray *array = [string componentsSeparatedByCharactersInSet:[NSCharacterSet decomposableCharacterSet]];
illegalCharacterSet
包含非字符或Unicode标准3.2版本中尚未定义的值的字符集。
letterCharacterSet
这个集合是用作字母和表意文字的所有字符的集合不包括标点符号和emoji表情
lowercaseLetterCharacterSet
此集合是用于区分大小写的字母表中用作小写字母的所有字符的集合。
newlineCharacterSet
包含换行字符(U+000A ~ U+000D、U+0085、U+2028和U+2029)的字符集。
nonBaseCharacterSet
返回一个字符集,其中包含Unicode通用类别M*中的字符。
punctuationCharacterSet
包含各种标点符号
whitespaceAndNewlineCharacterSet
包括空格和回车
whitespaceCharacterSet
空格