Java 8 Stream 学习笔记

Stream

是一系列的计算操作的合集，不是用于储存数据的数据结果，使用目的在于将一系列数据转化成目标结果。
产生结果，并且不修改源数据对象。
对于Intermediate操作（各类型的计算操作），只要不调用Terminal操作，流不会开始遍历。当定义了多个Intermediate操作时，真正执行时会有一个内部转换，仅遍历一次完成所有的计算操作。
数据源可以是无限的，可通过操作将其转化为有限的结果，比如limit(10)。
在一个流的生命周期内，源数据中的每个元素仅会被访问一次。

需要研究JDK代码。

构造流的方法

Collection的 stream() 和 parallelStream() 方法。
Arrays.stream(Object[])
静态工厂方法，比如 Stream.of(Object[]), IntStream.range(int, int), Stream.iterate(Object, UnaryOperator)
BufferedReader.lines()
Files
Random.ints()
其他（待研究）

操作类型

Intermediate

Intermediate操作总是返回一个新的流，并且不涉及任何实际操作。

分为有状态与无状态两种。
无状态：例如 filter() 和 map()，不对任何后续元素产生影响，每个元素可独立操作。
有状态：例如 distinct() 和 sort()，处理元素时，需要参考已处理元素的状态。有状态的操作会需要遍历所有元素才可得出结果（例如排序），也就是说，在并行处理模式下，部分元素会需要重复计算或需要一个缓存。

Terminal

遍历元素并输出一个结果。一个流只能有一个Terminal操作，遍历完成后，流被消耗完毕，无法再次遍历。

特例：iterator() 和 spliterator() （待研究）

Short-Circuiting

Intermidiate：当这个操作的对象是一个无限大的数据源时，这个操作会产生有限的结果。

Terminal：当这个操作的对象是一个无限大的数据源时，这个操作会在有限的时间内完成。

并行

任何流都可以应用并行操作。与单线程序列化操作不同的仅仅在于生成流的方法。

不干涉（non-interference）

遍历过程中，绝对不会修改原数据。

Reduction Operation (fold)

输入是一系列元素，输出是一个汇总的结果，例如求和或者求最大值。

在parallelStream的模式下，Reduction Operation也能正确执行。它会在各子集中求出一个结果，然后汇总所有的子结果，得出最终的值。

<U> U reduce(U identity,  // initial seed value for the reduction and a default result
              BiFunction<U, ? super T, U> accumulator,  // take partial result and the next element to produce a new partial result
              BinaryOperator<U> combiner);  // combine partial results to a final result

Mutable reduction

将一个集合整合为目标集合。

 <R> R collect(Supplier<R> supplier,  // a function to construct new instances of the result container
               BiConsumer<R, ? super T> accumulator,  // incorporate an input element into a result container
               BiConsumer<R, R> combiner);  // a combining function to merge contents

参考

JDK1.8 Package java.util.stream

最后编辑于：2018.01.05 15:33:20