我正在尝试获取文本文件的内容,除了字母以外的所有内容都要删除,然后将其转换为String
数组,以便单独处理单词。
我是通过以下方式获取文本文件的:
String temp1= IOUtils.toString(FIS,"UTF-8");
String temp2=temp1.replaceAll("[,.!;:\\r\\n]"," ");
然后我对字符串进行标记化,做法如下:
String[] tempStringArray = temp2.split(" ");
问题在于当数组被创建时,在各个索引位置都存在空的String
。这些空的String
出现在文本文件中的换行符、超过一个空格的空白、替换标点符号等位置。
我希望从我的String
数组中移除这些空的String
,或者以一种方式使它们无法进入String
数组。
如何做到这一点?