我目前正在使用Scala应用程序解析一些文件。问题在于这些文件太大了,所以它们总是会因为堆大小而抛出异常(即使我已经尝试了最大堆大小,但仍然无济于事)。
现在,这些文件看起来像这样:
This is
one paragraph
for Scala
to parse
This is
another paragraph
for Scala
to parse
Yet another
paragraph
等等。基本上我想把所有这些文件分成每个文件包含10或20个段落,但我必须确保一个段落不会在结果中被分开。有没有办法做到这一点?
谢谢!