流操作
基本思想
以声明性方式处理数据集合
特性
内部迭代
与集合类操作不同的是,流会替我们把迭代做了,我们只需要关注对每个对象的具体操作。
流的分解
一个完整的流操作 = 1 * 数据源 + n * 中间操作 + 1 * 终端操作
终端操作就像是整个流操作的开关阀门,触发流水线执行并在执行完成后关闭流。
由以上定义可以了解到流的三要素
- 数据源、中间操作、终端操作
中间操作
会返回一个流,每个流都只能遍历一次。
常见的中间操作有map、limit、filter、distinct、sorted。limit会截断流。
- limit的短路操作
public static void main(String[] args) {
Set<Integer> set = new HashSet<Integer>() {{
add(15);
add(2);
add(21);
add(5);
add(9);
add(4);
add(14);
add(19);
add(7);
}};
// 打印set中元素的顺序
set.stream().forEach(System.out::println);
System.out.println("-----------------------");
// 筛选set中大于10的数字,只取前两个(limit(2)),并在遍历过程中打印被遍历的元素
set.stream().filter(o -> {
System.out.println(o);
return o > 10;
}).limit(2).sorted().forEach(System.out::println);
}
- 输出结果
2
19
4
21
5
7
9
14
15
-----------------------
2
19
4
21
19
21
可以看到由于limit的存在,当程序找到两个大于10的数字(即19和21后,没有继续遍历下去)。limit会对流的遍历做优化。
终端操作
就像上文提到的,终端操作是整个流操作的开关,没有终端操作,中间操作就不会执行。
常见的终端操作有:collect、forEach、sum、count等
对limit短路的例子做一下修改,去掉forEach这个终端操作,可以发现在输出结果中,没有遍历set时的打印信息,也就证明了这一点。
// 筛选set中大于10的数字,只取前两个(limit(2)),并在遍历过程中打印被遍历的元素
set.stream().filter(o -> {
System.out.println(o);
return o > 10;
}).limit(2).sorted();