流(Stream)
流是java 8 中新引入的特性,用来处理集合中的数据,Stream 是一个来自数据源的元素队列并支持聚合操作。
- Java 中 Stream 不会存储元素。
- 数据源 流的来源。 可以是集合,数组,I/O channel, 产生器generator 等。
- 聚合操作 类似SQL语句一样的操作, 比如filter, map, reduce, find, match, sorted等。
Stream操作还有几个特征:
- 只遍历一次。我们可以把流想象成一条流水线,流水线的源头是我们的数据源(一个集合),数据源中的元素依次被输送到流水线上,我们可以在流水线上对元素进行各种操作。一旦元素走到了流水线的另一头,那么这些元素就被“消费掉了”,我们无法再对这个流进行操作。当然,我们可以从数据源那里再获得一个新的流重新遍历一遍。
- Pipelining: 中间操作都会返回流对象本身。 这样多个操作可以串联成一个管道, 如同流式风格(fluent style)。 这样做可以对操作进行优化, 比如延迟执行(laziness)和短路( short-circuiting)。
- 内部迭代: 以前对集合遍历都是通过Iterator或者For-Each的方式, 显式的在集合外部进行迭代, 这叫做外部迭代。 Stream提供了内部迭代的方式, 通过访问者模式(Visitor)实现。
为什么需要 Stream
Stream 作为 Java 8 的一大亮点,它与 java.io 包里的 InputStream 和 OutputStream 是完全不同的概念。它也不同于 StAX 对 XML 解析的 Stream,也不是 Amazon Kinesis 对大数据实时处理的 Stream。Java 8 中的 Stream 是对集合(Collection)对象功能的增强,它专注于对集合对象进行各种非常便利、高效的聚合操作(aggregate operation),或者大批量数据操作 (bulk data operation)。Stream API 借助于同样新出现的 Lambda 表达式,极大的提高编程效率和程序可读性。同时它提供串行和并行两种模式进行汇聚操作,并发模式能够充分利用多核处理器的优势,使用 fork/join 并行方式来拆分任务和加速处理过程。通常编写并行代码很难而且容易出错, 但使用 Stream API 无需编写一行多线程的代码,就可以很方便地写出高性能的并发程序。所以说,Java 8 中首次出现的 java.util.stream 是一个函数式语言+多核时代综合影响的产物。
流的使用
流的使用过程有三步:
- 获取流;
- 中间操作,得到一个新的流;
- 最终操作,获取结果。
获取流
流有两种:
- stream() : 创建串行流。
- parallelStream() : 创建并行流。
并行流的特点就是将一个大任务切分成多个小任务,无序一起执行,当然如果我们需要顺序输出的话可以使用forEachOrdered
,速度会比串行流快一些。它通过默认的ForkJoinPool,可能提高你的多线程任务的速度。
从集合获取流
1 | List<FarmEntity> list = service.getBySql(sql1); |
从数组获取流
1 | String[] arrays = {"你", "我", "她"}; |
从值获取流
1 | Stream<String> stream = Stream.of("你", "我", "她"); |
从文件获取流
1 | try { |
使用NIO获取流,可以打印出文本文件的内容。
流的操作
filter 过滤
filter函数接收一个Lambda表达式作为参数,该表达式返回boolean,在执行过程中,流将元素逐一输送给filter,并筛选出执行结果为true的元素。
1 | String[] strings = {"珊瑚", "阳光", "细腻", "冷暖", "阳光"}; |
distinct 去重
1 | Arrays.stream(strings).distinct().forEach(System.out::print); |
limit 截取
截取前面两个单位:
1 | Arrays.stream(strings).limit(2).forEach(System.out::print); |
skip 跳过
和上面的limit 相反,跳过前面两个
1 |
map 映射
map 方法用于映射每个元素到对应的结果。
给每个词语后面加个 “兮”
1 | Arrays.stream(strings).map(s -> s + "兮").forEach(System.out::println); |
输出:
1 | 珊瑚兮 |
sorted 排序
1 | //Arrays.stream(strings).sorted((x, y) -> x.compareTo(y)).forEach(System.out::println); |
输出:
1 | 冷暖 |
java8 以前排序:
1 | // Before Java 8 sorted |
输出:
1 | java8以前排序: |
HashMap根据value值排序key:
1 | Map<String, Integer> map = new HashMap<>(); |
输出结果:
1 | winter |
统计
1 | //统计 |
运行结果:
1 | Highest number in List : 4 |
match 匹配
anyMatch
用于判断流中是否存在至少一个元素满足指定的条件,这个判断条件通过Lambda表达式传递给anyMatch,执行结果为boolean
类型。noneMatch
与allMatch恰恰相反,它用于判断流中的所有元素是否都不满足指定条件findAny
能够从流中随便选一个元素出来,它返回一个Optional类型的元素。1
2
3
4
5
6
7
8
9Boolean result1 = Arrays.stream(strings).allMatch(s -> s.equals("java"));
System.out.println(result1);
Boolean reslut2 = Arrays.stream(strings).noneMatch(s -> s.equals("java"));
System.out.println(reslut2);
//随机读取一个
Optional<String> getResult = Arrays.stream(strings).findAny();
System.out.println(getResult);
System.out.printf("获取Optional中的值:%s%n", getResult.get());
运行结果:
1 | false |
Optional是Java8新加入的一个容器,这个容器只存1个或0个元素,它用于防止出现NullpointException,它提供如下方法:
isPresent()
判断容器中是否有值。ifPresent(Consume lambda)
容器若不为空则执行括号中的Lambda表达式。T get()
获取容器中的元素,若容器为空则抛出NoSuchElement异常。T orElse(T other)
获取容器中的元素,若容器为空则返回括号中的默认值。
reduce 归约
求和:
1 | //归约 |
getConnectStrings方法:
1 | /** |
reduce
中第一个参数是初始值,第二个参数是方法引用。
数据流
StreamAPI提供了三种数值流:IntStream、DoubleStream、LongStream,也提供了将普通流转换成数值流的三种方法:mapToInt、mapToDouble、mapToLong。
每种数值流都提供了数值计算函数,如max、min、sum等。
下面使用 mapToInt 为例:
1 | String[] numberStrings = {"1", "2", "3"}; |
打印结果:
1 | numberStrings's max number is: 3 |
由于数值流可能为空,并且给空的数值流计算最大值是没有意义的,因此max函数返回OptionalInt,它是Optional的一个子类,能够判断流是否为空,并对流为空的情况作相应的处理。 所以可以直接使用 OptionalInt.getAsInt()
获取容器的值。
为空的话捕捉异常:
1 | java.util.NoSuchElementException: No value present |
此外,mapToInt、mapToDouble、mapToLong进行数值操作后的返回结果分别为:OptionalInt、OptionalDouble、OptionalLong。
Collectors 集合归约
将流转换成集合和聚合元素。
1 | //Collectors 集合归约 |
打印结果:
1 | Collectors toList: [冷暖, 珊瑚, 细腻, 阳光, 阳光] , Conlletors Join Strings: 冷暖,珊瑚,细腻,阳光,阳光 |
后面补充: Collectors中还有一个groupingBy() 方法,比较实用,例子来源网上使用Java 8中的Stream
groupingBy()
表示根据某一个字段或条件进行分组,返回一个Map
,其中key为分组的字段或条件,value默认为list,groupingByConcurrent()
是其并发版本:1
2Map<String, List<Locale>> countryToLocaleList = Stream.of(Locale.getAvailableLocales())
.collect(Collectors.groupingBy(l -> l.getDisplayCountry()));如果
groupingBy()
分组的依据是一个bool条件,则key的值为true/false,此时与partitioningBy()等价,且partitioningBy()
的效率更高:1
2
3
4
5
6
7// predicate
Map<Boolean, List<Locale>> englishAndOtherLocales = Stream.of(Locale.getAvailableLocales())
.collect(Collectors.groupingBy(l -> l.getDisplayLanguage().equalsIgnoreCase("English")));
// partitioningBy
Map<Boolean, List<Locale>> englishAndOtherLocales2 = Stream.of(Locale.getAvailableLocales())
.collect(Collectors.partitioningBy(l -> l.getDisplayLanguage().equalsIgnoreCase("English")));groupingBy()
提供第二个参数,表示downstream,即对分组后的value作进一步的处理:
1 | // 返回set,而不是list: |
完整代码
1 | package com.wuwii.test; |