Bruce Auyeung bio photo

Bruce Auyeung

横眉冷对千夫指,俯首甘为孺子牛!

新浪微博 腾讯微博 Github

学习 Java 8 - Stream 举例说明

在上一篇文章中,我们学习了《内部迭代与外部迭代对比》,知道了内部迭代如何帮助我们专注于业务逻辑而无需关心迭代过程,它使得代码更加简洁和具有可读性。在这篇文章中,我们要探讨 Java 8 新引入的另一个概念 - 流(Stream) 。

流(Stream) 可以定义为从一个源读取而来的支持聚集操作的一系列元素。这里说的源指的是集合或者数组,她们可以为源提供数据。流(Stream) 中数据的顺序和源保持一致。聚集操作或者批量操作允许我们很容易对流(Stream) 中的元素进行常见操作。

我将从下面几个方面讨论 Java 8 中的 流(Stream),如无特殊说明,下文中的流指的都是 Stream

在继续下文之前,有必要事先说明一下, Java 8 中的多数流操作只返回流对象。这有助于写出链式流操作,我们管这个叫管线。在这篇文章中我会多次使用这个术语,所以务必记住了哦。

流 vs. 集合

相信大家都在优酷上看过在线视频,当你开始观看视频时,文件的一小部分会首先下载到你的电脑中然后开始播放。在开始播放视频之前你并不需要把整个视频下载下来。我将尝试把这个概念与流关联起来。

在基本概念层面,集合与流的区别在于其中的元素是如何产生的。集合是存在于内存中的数据结构,其中保存了所有的元素对象,这些元素对象在加入到集合中之前,必须已经构建好。流本质上不是数据结构,其中的元素对象是按需产生的。这带来了显著的好处,用户只能从流中取到他们真正需要的元素,这些元素也只在用户真正需要的时候被生产出来。这看起来是一种生产者-消费者的关系。

在 Java 中, java.util.stream.Stream 代表流,在流上可以执行各种流操作。流操作分为中间操作和末端操作。末端操作会返回某一类型的结果,而中间操作会返回流对象,所以你可以把多个中间操作串成一行。流基于源而生成,比如 ListSet 都可以作为源(Map 不行)。流操作可以串行执行,也可以并行执行。

基于上述观点,我们可以总结出来流的基本特征:

  • 不是数据结构
  • 为 lambda 表达式而设计
  • 不支持基于索引的访问方式
  • 可以很容易的被转换为集合
  • 支持延迟访问
  • 可以并行执行

各种构建流对象的方式

下面是最常见的从集合产生流对象的方式
使用 Stream.of()

1
2
3
4
5
6
public class StreamBuilders {
    public static void main(String[] args) {
        Stream<String> stream = Stream.of("a", "b", "c", "d", "e", "f", "g");
        stream.forEach(p -> System.out.println(p));
    }
}

使用 Collection.stream()

1
2
3
4
5
6
7
public class StreamBuilders {
    public static void main(String[] args) {
        List<String> strings = Arrays.asList("a", "b", "c", "d", "e", "f", "g");
        Stream<String> stream = strings.stream();
        stream.forEach(p -> System.out.println(p));
    }
}

使用 generate()

1
2
3
4
5
6
7
8
public class StreamBuilders {
    public static void main(String[] args) {
        Stream<Double> stream = Stream.generate(() -> {
            return Math.random();
        }).limit(5);
        stream.forEach(p -> System.out.println(p));
    }
}

使用 iterate()

1
2
3
4
5
6
public class StreamBuilders {
    public static void main(String[] args) {
        Stream<Integer> stream = Stream.iterate(10, i -> i + 10).limit(5);
        stream.forEach(i -> System.out.println(i));
    }
}

使用 CharSequence.chars()

1
2
3
4
5
6
public class StreamBuilders {
    public static void main(String[] args) {
        IntStream stream = "ABCDEFG_abcdefg".chars();
        stream.forEach(p -> System.out.println(p));
    }
}

还有一些其它的方式也可以产生流对象,比如使用 java.util.stream.Stream.Builder<T> 或者使用中间操作。我们会在后续的文章中学习到。

转换流为集合

其实不应该说是转换,因为这里并没有发生流对象转换为其它对象的过程,更应该说是把流中的元素放到其它数据结构中,比如集合或者数组。但是如果老是这么描述,有显得太过罗嗦,所以大家务必理解下面我提到的转换。
使用 stream.collect(Collectors.toList())Stream 转换为 List

1
2
3
4
5
6
7
8
public class StreamBuilders {
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8, 9, 10);
        Stream<Integer> stream = list.stream();
        List<Integer> oddNumbersList = stream.filter(i -> i % 2 != 0).collect(Collectors.toList());
        System.out.print(oddNumbersList);
    }
}

使用 stream.collect(Collectors.toSet())Stream 转换为 Set

1
2
3
4
5
6
7
8
public class StreamBuilders {
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8, 9, 10);
        Stream<Integer> stream = list.stream();
        List<Integer> oddNumbersSet = stream.filter(i -> i % 2 != 0).collect(Collectors.toSet());
        System.out.print(oddNumbersSet);
    }
}

使用 stream.toArray(EntryType[]::new)Stream 转换为数组

1
2
3
4
5
6
7
8
public class StreamBuilders {
    public static void main(String[] args) {
        List<Integer> list = Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8, 9, 10);
        Stream<Integer> stream = list.stream();
        Integer[] oddNumbersArray = stream.filter(i -> i % 2 != 0).toArray(Integer[]::new);
        System.out.print(oddNumbersArray);
    }
}

还有许多方法可以把 Stream 转换为 Map 或其它数据类型。你只需要去浏览下 java.util.stream.Collectors,把它们记住即可。

核心的流操作

你可以在流对象上执行非常多有用的函数。 我并不打算把他们都讲到,但是我计划把最最重要的那些讲一下,这些都是你必须第一时间掌握的。

在继续之前,我们先构建一个字符串集合,下面的例子都会基于这个集合进行操作。

1
List<String> provinceNames = Arrays.asList("湖南", "湖北", "河南", "河北", "广东", "广西", "北京", "南京");

这些核心的流操作方法,可以划分为两类:

中间操作

中间操作返回流对象,所以你可以把多个中间操作串成一行。
filter()

filter 方法接受一个断言对象,用来过滤流中的元素。

1
2
3
4
provinceNames.stream().filter((p) -> p.startsWith("湖")).forEach(p -> System.out.print(p + ", "));

// 输出 : 
// 湖南, 湖北, 

map()

这个中间操作使用给定的函数把流中的每个元素转换为另一个对象。下面的例子把每个字符串转化为另一个字符串(末尾多了一个人字)。但是你也可以把每个对象转换为其它类型的对象。

1
2
3
4
provinceNames.stream().map(p -> p + "人, ").forEach(p -> System.out.print(p));

// 输出 : 
// 湖南人, 湖北人, 河南人, 河北人, 广东人, 广西人, 北京人, 南京人, 

sorted()

sorted 会对流中的元素进行排序,默认按自然序进行排序,除非你指定一个自定义的比较器(Comparator) 。

1
2
3
4
provinceNames.stream().sorted().map(p -> p + "人, ").forEach(p -> System.out.print(p));

// 输出 : 
// 北京人, 南京人, 广东人, 广西人, 河北人, 河南人, 湖北人, 湖南人, 

需要注意的是 sorted 仅仅对流中的元素进行排序,而不会影响后面的集合,集合中的元素排序保持不变。

末端操作

末端操作返回某一类型的结果,而不是流对象。
forEach()

该方法帮助迭代流中的元素并在元素上执行一些操作。这些操作可以是 lambda 表达式或者方法引用。

1
provinceNames.stream().forEach(System.out::println);

collect()

collect() 方法用来从流中抽取元素然后保存到一个集合或者数组中。

1
2
3
4
5
List<String> provinceNamesOrdered = provinceNames.stream().sorted().collect(Collectors.toList());
System.out.print(provinceNamesOrdered);

// 输出 : 
// [北京, 南京, 广东, 广西, 河北, 河南, 湖北, 湖南]

match()

各种匹配操作用来检查流中的元素是否指定断言条件。所有的匹配操作都是末端操作,它们返回布尔结果。

1
2
3
4
5
6
7
8
9
10
11
12
13
boolean matchedResult = provinceNames.stream().anyMatch((s) -> s.startsWith("湖"));
System.out.println(matchedResult);

matchedResult = provinceNames.stream().allMatch((s) -> s.startsWith("湖"));
System.out.println(matchedResult);

matchedResult = provinceNames.stream().noneMatch((s) -> s.startsWith("湖"));
System.out.println(matchedResult);

// 输出 : 
// true
// false
// false

count()

count 末端操作返回流中元素个数。

1
2
3
4
long totalMatched = provinceNames.stream().count();
System.out.println(totalMatched);

// 输出 : 8

reduce()

该末端操作使用给定的函数对流中的元素进行归约。它是这样一个过程:每次迭代,将上一次的迭代结果(第一次时为 identity 的元素,如没有 identity 则为流中的第一个元素)与下一个元素一同执行一个二元函数。在 reduce 操作中,identity 是可选的,如果使用,则作为第一次迭代的第一个元素使用。归约的结果保存在 Optional 中。

1
2
3
4
5
Optional<String> reduced = provinceNames.stream().reduce((s1, s2) -> s1 + "#" + s2);
reduced.ifPresent(System.out::println);

// 输出 : 
// 湖南#湖北#河南#河北#广东#广西#北京#南京

短路操作

流操作通常会在流中满足某一断言的所有元素上进行操作,有时我们希望在迭代过程中遇到匹配的元素时就终止操作,在外部迭代中,你需要写 if-else 代码块,在内部迭代中,有现成的方法可以使用,下面是两个这样的方法的示例:
anyMatch()

该操作只要遇到满足断言条件的元素就会返回 true,在此之后就不再处理任何其它的元素了。

1
2
3
4
boolean matched = provinceNames.stream().anyMatch((s) -> s.startsWith("河"));
System.out.println(matched);

// 输出 : true

findFirst()

该操作会返回流中的第一个元素,然后就不再处理其它元素了。

1
2
3
4
String firstMatchedName = provinceNames.stream().filter((s) -> s.startsWith("广")).findFirst().get();
System.out.println(firstMatchedName);

// 输出 : 广东

并行处理

有了 Java 7 中的 Fork/Join 框架,我们有了高效的实现并行操作的机制,但是使用这个框架非常复杂,如果实现不当,那就会引入无数的令人费解的多线程 bug,甚至可能使得应用程序崩溃。有了内部迭代,我们一样可以实现并行操作。

要启用并行性,你只需创建一个并行流,而不是串行流。这会让你觉得非常惊讶,因为真是太简单了。在上面所有的流操作例子中,任何时候你希望在多核中并行执行你的任务,你只需要改调用 parallelStream() 方法而不是 stream() 方法。

1
2
3
4
5
6
7
8
9
10
11
12
public class StreamBuilders {
    public static void main(String[] args) {
        List<Integer> list = new ArrayList<Integer>();
        for (int i = 1; i < 10; i++) {
            list.add(i);
        }
        // 在这里创建并行流
        Stream<Integer> stream = list.parallelStream();
        Integer[] evenNumbersArr = stream.filter(i -> i % 2 == 0).toArray(Integer[]::new);
        System.out.print(evenNumbersArr);
    }
}

关于 Java 8 中的 Stream, 我就介绍到这了,在后续的文章中我会继续探讨和 Stream 相关的话题。