我最近开始使用Java Stream技术。 现在我碰到了以下的问题:
Stream<T> mapUntil(Stream<T> in, Function<T,T> mapFunc, Predicate<Stream<T>> predicate)
或更一般性的。
Stream<T> applyUntil(Stream<T> in, Function<Stream<T>,Stream<T>> func,
Predicate<Stream<T>> predicate)
他们的天真实现
Stream<T> mapUntil(Stream<T> in, Function<T,T> mapFunc, Predicate<Stream<T>> predicate){
return applyUntil(in,in->in.map(mapFunc),predicate)
}
Stream<T> applyUntil(Stream<T> in, Function<Stream<T>,Stream<T>> func,
Predicate<Stream<T>> predicate){
if(predicate.test(in)) return in;
return applyUntil(func.apply(in),func,predicate);
}
不幸的是,mapUntil(stream,mapFunc,s->s.anyMatch(predicate))
会导致IllegalStateException: Stream has already been operated on or closed
,这是合理的,因为我在同一个流上调用了anyMatch
和map
。所以我想出了一个不同的applyUntil
实现:
Stream<T> applyUntil(Stream<T> in, Function<Stream<T>,Stream<T>> func,
Predicate<Stream<T>> predicate){
List<T> collected = in.collect(Collectors.toList());
if(predicate.test(collected.stream())) return collected.stream()
return applyUntil(func.apply(collected.stream(),func,predicate);
}
这显然存在很多问题。
- 它无法处理无限(或非常巨大)的流。在我的特殊情况下,这是可以接受的,但对于如此通用的方法来说,这感觉很糟糕。
- 它违反了流的本意,因为所有的惰性都被失去了——由于
collect(Collectors.toList())
,每个数据都必须被计算和存储。
我尝试修改我的代码,以消除第二个问题,重写了applyUntil
:
Stream<T> applyUntil(Stream<T> in, Function<Stream<T>,Stream<T>> func,
Predicate<Stream<T>> predicate){
List<T> collected = in.collect(Collectors.toList());
return applyUntil(()->collected.stream(),func,predicate);
}
Stream<T> applyUntil(Supplier<Stream<T>> sup, Function<Stream<T>,Stream<T>> func,
Predicate<Stream<T>> pred){
if(predicate.test(sup.get())) return sup.get();
return applyUntil(()->func.apply(sup.get()),func,predicate);
}
这个实现确实可以工作,但非常缓慢,特别是当你有一个非常昂贵的函数时。当我更仔细地看它时,我认识到原因:它调用了
predicate.test(collected.stream())
,predicate.test(func.apply(collected.stream()))
,predicate.test(func.apply(func.apply(collected.stream()))
等等,导致 func
呼叫 O(n^2)
次,相比需要 n
次呼叫,这不是很好。在我的天真世界中,应该有一个比这两者更好的解决方案。像这样(只是一个快速的草案,AddFirst - Exists 是 MyStream 的简单惰性实现。我在这段代码的末尾错过了一个类似于 Fork 的类,用于默认的 Java 流):
interface MyStream<T>{
T get();
boolean hasNext();
}
class Convert<T> implements MyStream<T>{
Iterator<T> inner;
pulic Convert(Interator<T> iter){
inner=iter;
}
public boolean hasNext(){
return inner.hasNext();
}
public T get(){
return inner.get();
}
class AddFirst<T> implements MyStream<T>{
T item;
MyStream<T> inner;
boolean used;
public AddFirst(T t, MyStream<T> prev){
item=t;
inner=prev;
used=false;
}
public T get(){
if(used) return inner.get();
used=true;
return item;
}
public boolean hasNext(){
return !used || inner.hasNext();
}
}
class Filter<T> implements MyStream<T>{
Predicate<T> filter;
MyStream<T> inner
public Filter(Predicate<T> test, MyStream<T> prev){
filter=test;
inner=prev;
}
public T get(){
while(true){
T curr = inner.get(); //if !inner.hasNext, this throws NoSuchElementException
if(filter.test(curr)) return curr;
}
}
public boolean hasNext(){
try{
T item = get();
inner = new AddFirst(item,inner);
return true;
}
catch(NoSuchElementException e){
return false;
}
}
}
class Map<K,T> implements MyStream<T>{
MyStream<K> inner;
Function<K,T> func;
public Map(Function<K,T> func,MyStream<K> prev){
this.func=func;
inner = prev;
}
public T get(){
return func.apply(inner.get());
}
public boolean hasNext(){
return inner.hasNext();
}
}
class Forall<T> implements Predicate<MyStream<T>>{
Predicate<T> pred;
public Forall(Predicate<T> func){
pred=func;
}
public boolean test(MyStream<T> ms){
while(ms.hasNext()){
if(!pred.test(ms.get()) return false;
}
return true;
}
}
class Exists<T> implements Predicate<MyStream<T>>{
Predicate<T> pred;
public Forall(Predicate<T> func){
pred=func;
}
public boolean test(MyStream<T> ms){
while(ms.hasNext()){
if(pred.test(ms.get()) return true;
}
return false;
}
}
class Fork<T>{
Deque<T> advance;
MyStream<T> inner;
boolean ahead;
MyStream<T> master;
MyStream<T> slave;
public Fork(MyStrem<T> prev){
inner=prev;
advance= new LinkedList<T>();
ahead=false;
master = new ForkStream(true);
slave = new ForkStream(false);
}
public MyStream<T> getMaster(){
return master;
}
public Iterator<T> getMasterIter(){
return master;
}
public MyStream<T> getSlave(){
return slave;
}
public Iterator<T> getSlaveIter(){
return slave;
}
class ForkStream implements MyStream<T>, Iterator<T>{
boolean role;
public ForkStream(boolean in){
role=in;
}
public T get(){
if(role==ahead||advance.size()==0){
ahead=role;
T item = inner.get();
advance.addLast(item);
return item;
}
else{
return advance.removeFirst();
}
}
public boolean hasNext(){
return (role!=ahead&&advance.size()!=0) || inner.hasNext();
}
public T next(){
return get();
}
}
}
使用这些类,我可以重写我的方法:
Stream<T> applyUntil(Stream<T> in, Function<Stream<T>,Stream<T>> func,
Predicate<Stream<T>> predicate){
Fork<T> fork = new Fork(new Convert<T>(in.iterator()));
Stream<T> master = StreamSupport.stream(
Spliterators.spliteratorUnknownSize(fork.getMasterIter(),0),false);
Stream<T> slave = StreamSupport.stream(
Spliterators.spliteratorUnknownSize(fork.getSlaveIter(),0),false);
if(predicate.test(master)) return slave
return applyUntil(func.apply(slave,func,predicate);
}
这个方法适用于无限流,仍然是惰性的,可以重复使用已经计算出来的值。看起来对于任何目的都很合适。
编辑: 当我试图解释为什么这个代码块不能编译时,我找到了一种使其编译的方法。它仍然不是很好,失去了很多流的魔力,也不是线程安全的。此外,MyStream应该有一个close
方法,以表示您不再对任何数据感兴趣-因此Fork
不必为您保存它。所以另一个问题在我的脑海中出现了:你能从像迭代器那样的东西创建一个`j.u.stream.Stream`,告诉它的迭代器它不再对任何数据感兴趣(因为短路)吗?
因此,我的问题是:JDK8没有外部库是否有类似Fork的东西,保持更多的魔力存在? 如果是:哪个类/方法可以帮助我? 如果没有:为什么没有?并且:你如何自己实现它,保留尽可能多的魔力?
感谢阅读,抱歉这篇长文 :/
Alex
fork.master
应该是一个java.util.stream.Stream<T>
,.slave()
也应该是同样的类型。 - tkachuko