Stream
是一系列的计算操作的合集,不是用于储存数据的数据结果,使用目的在于将一系列数据转化成目标结果。
产生结果,并且不修改源数据对象。
对于Intermediate操作(各类型的计算操作),只要不调用Terminal操作,流不会开始遍历。当定义了多个Intermediate操作时,真正执行时会有一个内部转换,仅遍历一次完成所有的计算操作。
数据源可以是无限的,可通过操作将其转化为有限的结果,比如limit(10)。
在一个流的生命周期内,源数据中的每个元素仅会被访问一次。
需要研究JDK代码。
构造流的方法
Collection的 stream() 和 parallelStream() 方法。
Arrays.stream(Object[])
静态工厂方法,比如 Stream.of(Object[]), IntStream.range(int, int), Stream.iterate(Object, UnaryOperator)
BufferedReader.lines()
Files
Random.ints()
其他(待研究)
操作类型
Intermediate
Intermediate操作总是返回一个新的流,并且不涉及任何实际操作。
分为有状态与无状态两种。
无状态:例如 filter() 和 map(),不对任何后续元素产生影响,每个元素可独立操作。
有状态:例如 distinct() 和 sort(),处理元素时,需要参考已处理元素的状态。有状态的操作会需要遍历所有元素才可得出结果(例如排序),也就是说,在并行处理模式下,部分元素会需要重复计算 或 需要一个缓存。
Terminal
遍历元素并输出一个结果。一个流只能有一个Terminal操作,遍历完成后,流被消耗完毕,无法再次遍历。
特例:iterator() 和 spliterator() (待研究)
Short-Circuiting
Intermidiate:当这个操作的对象是一个无限大的数据源时,这个操作会产生有限的结果。
Terminal:当这个操作的对象是一个无限大的数据源时,这个操作会在有限的时间内完成。
并行
任何流都可以应用并行操作。与单线程序列化操作不同的仅仅在于生成流的方法。
不干涉(non-interference)
遍历过程中,绝对不会修改原数据。
Reduction Operation (fold)
输入是一系列元素,输出是一个汇总的结果,例如 求和 或者 求最大值。
在parallelStream的模式下,Reduction Operation也能正确执行。它会在各子集中求出一个结果,然后汇总所有的子结果,得出最终的值。
<U> U reduce(U identity, // initial seed value for the reduction and a default result
BiFunction<U, ? super T, U> accumulator, // take partial result and the next element to produce a new partial result
BinaryOperator<U> combiner); // combine partial results to a final result
Mutable reduction
将一个集合整合为目标集合。
<R> R collect(Supplier<R> supplier, // a function to construct new instances of the result container
BiConsumer<R, ? super T> accumulator, // incorporate an input element into a result container
BiConsumer<R, R> combiner); // a combining function to merge contents